Les empreintes génétiques :
données scientifiques et techniques
L'ADN contenu pour l'essentiel dans le
noyau de la cellule possède trois propriétés qui
intéressent la police scientifique : il possède des
régions variables d'individu à individu ; ces régions
sont identiques chez un individu quel que soit le tissu
analysé ; enfin, l'ADN est transmis par moitié de chacun
des parents à ses enfants. Deux principales applications
s'en déduisent :
- la recherche en paternité ;
- l'identification d'individus à partir
de toute trace biologique3.
Les techniques utilisées pour mettre en
évidence le polymorphisme de l'ADN permettent
aujourd'hui d'obtenir, dans de courts délais, des
résultats extrêmement précis à partir d'échantillons ne
contenant qu'une quantité infime de produit biologique.
Elles imposent, en contrepartie, des précautions
rigoureuses pour parer aux risques de contamination qui
compromettraient la fiabilité des analyses.
1.1.
Le polymorphisme de l'ADN
L'acronyme ADN désigne une macromolécule,
l'acide désoxyribonucléique, dont on a dit qu'elle était
l'unité de base de la vie, l'empreinte génétique du
corps. Cette molécule est présente dans le noyau de la
quasi totalité des cellules -à l'exception des globules
rouges- ainsi que dans les mitochondries, organites
cytoplasmiques qui jouent un rôle important dans les
phénomènes de respiration et les réactions énergétiques
de la cellule. L'expertise génétique se concentre
prioritairement sur l'ADN nucléaire mais l'ADN
mitochondrial peut également, on le verra plus loin,
fournir des informations utiles bien que moins
discriminantes.
On hérite de son ADN au moment de la
conception. L'ovule fécondé renferme l'ADN provenant du
spermatozoïde du père et de l'ovule de la mère. La
cellule originelle se subdivise ensuite continuellement
de façon que chaque cellule du corps reproduise l'ADN de
cette union originelle. L'ADN
est donc identique dans chaque cellule, quelle que soit
la partie du corps où il se trouve et il reste
essentiellement le même de la conception jusqu'à la
mort.
De structure bicaténaire, l'ADN
s'organise, dans les cellules somatiques, en vingt-trois
paires de chromosomes hérités de la mère et du père,
dont vingt-deux paires de chromosomes homologues et deux
hétérochromosomes sexuels (génotype XX chez la femme, XY
chez l'homme).
La molécule d'ADN est constituée d'un
enchaînement de sucres-phosphates reliés à quatre
bases, ou nucléotides : Adénine, Guanine, Cytosine,
Thymine (A, G, C, T). Pour former chaque échelon de la
double chaîne d'ADN, ces quatre éléments de construction
constituent des couples basiques ou « A » se trouve
toujours lié à « T » et « G » à « C ». L'ordre des bases
sur la chaîne linéaire de nucléotides formant l'ADN
constitue sa séquence nucléotidique.
La séquence complète de l'ADN d'une
cellule humaine formant le génome déroulé mesure
1,80 mètre et comporte environ 3 milliards de
nucléotides. La théorie généralement acceptée veut qu'il
n'y ait pas, à l'exception des jumeaux homozygotes, deux
personnes porteuses du même ADN. Mais il serait beaucoup
trop long et coûteux de procéder, pour l'établissement
d'une comparaison, à l'examen de la totalité de la
chaîne contenue dans une cellule. Il convient donc de
s'appuyer sur les ressources offertes par
le polymorphisme de l'ADN.
1.1.1.
Le polymorphisme de l'ADN nucléaire
Pour 10 à 20 %, la molécule d'ADN est
constituée par les gènes qui sont le support de
l'information. Ces unités codantes se retrouvent au
niveau de l'ARN messager lors du phénomène de
transcription puis se traduisent en protéines.
En revanche, la plus grande partie (80 à
90 %) de l'ADN nucléaire ne commande directement aucune
synthèse protéique et l'on ignore actuellement sa
fonction précise. Dans cette partie non codante,
l'analyse a mis en évidence des régions variables : il
s'agit de segments d'ADN caractérisés par la répétition
en tandem d'unités de base composées de deux ou
plusieurs nucléotides. La taille de ces fragments, ou
allèles, varie en fonction du nombre de répétitions.
On distingue ainsi deux types de polymorphisme :
- les mini-satellites ou VNTR
(Variable Numbers of Tandem Repeats) correspondent à
des séquences répétées en tandem, appelées cores,
de 15 à 40 paires de bases. Le nombre de ces répétitions
est variable d'un individu à l'autre, constituant une
série d'allèles. Les zones se transmettent selon le mode
mendélien : l'enfant reçoit un allèle de son père et un
allèle de sa mère4.
Des études récentes considèrent que nous aurions
1 500 zones de ce type, soit 1 500 systèmes de
polymorphisme5.
- les micro-satellites ou STR
(Short Tandem Repeats), unités répétitives dont
le core est très court (4 paires de bases en moyenne) et
répété de deux à dix fois au plus. Des centaines de
micro-satellites ont été étudiés mais, comme le note le
Professeur Rouger, peuvent seuls être retenus pour la
pratique des empreintes génétiques ceux qui sont
aisément amplifiables6
avec une expression simple des allèles, présentent un
fort taux d'hétérozygotie et expriment un nombre
d'allèles suffisamment élevé.
Du point de vue judiciaire qui nous
préoccupe dans le cadre de ce rapport, deux points
importants doivent être soulignés à propos de cet examen
des zones variables :
- plus nombreux sont les sites
polymorphes qui font apparaître une concordance entre un
échantillon probatoire (recueilli sur le lieu d'une
infraction) et un échantillon connu (prélevé sur un
suspect), moins il est probable que l'échantillon
probatoire provienne d'un individu différent.
- La non-concordance constatée sur un
seul site polymorphe conduit à écarter de façon absolue
l'individu dont le profil ADN est confronté à celui de
l'échantillon probatoire. L'inclusion s'apprécie en
termes de probabilité, l'exclusion en termes de
certitude.
1.1.2.
Le polymorphisme de l'ADN mitochondrial
L'ADN
mitochondrial
(ADN-mt), présent dans le cytoplasme, peut également
être utilisé pour l'expertise génétique : il s'agit
d'une petite molécule circulaire et monocaténaire de 16
569 paires de bases qui codent pour des chaînes
polypeptidiques nécessaires au fonctionnement de la
mitochondrie et pour des ARN. Sa séquence est
entièrement connue et elle présente deux régions
hypervariables. Le polymorphisme n'est pas lié ici à des
variations de longueur mais à des variations dans la
composition en nucléotides (polymorphisme de structure).
Une autre caractéristique de l'ADN-mt est
son hérédité maternelle. En effet, l'ovule est bien
fourni en mitochondries (entre 100 000 et 200 000) alors
que le spermatozoïde n'en contient qu'un petit nombre
qui ne persiste pas dans la descendance. La mère
transmet donc son ADN-mt à tous ses enfants mais seules
les filles le transmettront à leur tour à leur
progéniture.
Par ailleurs, le polymorphisme de
l'ADN-mt est moins marqué que celui de l'ADN nucléaire
et l'analyse qui en est faite est donc moins
discriminante. Il présente néanmoins un double intérêt :
- préservé par la haute résistance de la
mitochondrie, il peut être analysé sur des traces
anciennes ou fortement dégradées sur lesquelles l'ADN
nucléaire n'est plus exploitable. La recherche
historique en a fait ces dernières années un fréquent
usage, notamment pour les ossements de la famille
impériale de Russie et pour le c_ur présumé de Louis
XVII conservé à St Denis.
- il peut également permettre
d'expertiser des tissus biologiques dépourvus d'ADN
nucléaire, mais riches en mitochondries, qui sont
prélevés sur une scène de crime. C'est notamment le cas
des tiges de cheveux.
1.1.3.
Les applications judiciaires
L'ADN étant transmis par moitié de chacun
des parents à ses enfants, l'empreinte génétique trouve
une application remarquable dans la recherche de
paternité qui relève aussi bien du domaine
civil (établissement ou contestation d'une filiation,
action à des fins de subsides) que du domaine pénal
(affaires de viol et d'inceste).
Dans le domaine des enquêtes judiciaires,
de nombreuses raisons ont conduit les services de police
à recourir aux empreintes génétiques :
- à l'exception des globules rouges,
toutes les cellules du corps humain peuvent
théoriquement être identifiées : sperme, sang (globules
blancs), racines de cheveux, salive (cellules
épithéliales), peau, moelle osseuse, os.
- l'ADN étant essentiellement le même
d'une cellule à l'autre, il est possible de procéder à
une comparaison entre différentes parties du corps,
telles que sang et sperme, cheveux et peau,
- de très faibles quantités de ces types
de substances sont nécessaires pour procéder à une
identification,
- les techniques permettent d'innocenter
certains suspects et, parallèlement, d'en identifier
d'autres. Comme on l'a indiqué précédemment, le pouvoir
d'exclusion est absolu. Le pouvoir d'inclusion dépend de
l'inférence que l'on peut tirer de la comparaison des
profils.
Un enquêteur peut, par conséquent,
exploiter cette technique d'analyse à des fins
diverses :
- identifier une victime alors même
qu'une partie du corps seulement à été découverte ;
- identifier une victime et désigner un
suspect lorsque, par exemple, l'ADN d'une partie du
corps concorde avec celui des traces de sang prélevé sur
un objet dont le suspect a été trouvé en possession ;
- identifier un suspect au moyen de
substances que l'auteur du méfait a laissées sur les
lieux du crime. Dans certains cas (analyse du sperme
laissé dans le vagin d'une victime de viol), la
concordance des analyses fournira une forte présomption
de culpabilité ; dans d'autres (frottis de salive
provenant d'une morsure ou morceau de peau découvert
sous les ongles de la victime), la valeur de la
concordance devra être appréciée, plus encore que dans
le premier cas, en fonction des autres éléments de
l'enquête ;
- identifier un suspect au moyen des
substances que l'auteur du méfait a pu emporter du lieu
du crime : tel est le cas lorsque le profil ADN de la
victime d'un meurtre correspond à celui du sang trouvé
sur les vêtements du suspect ;
- reconnaître les crimes en série et les
distinguer des crimes par imitation.
1.2. L'établissement des empreintes génétiques :
techniques d'analyse et interprétation des résultats.
On s'en tiendra ici à des développements
généraux, renvoyant, pour une description détaillée, au
document publié par le laboratoire de génétique
moléculaire de l'Institut de biologie de Nantes (cf.
annexe n° 2).
Ces techniques ont connu une évolution
rapide depuis la mise au point par Alec Jeffreys, en
1985, des premières sondes multilocus jusqu'au
développement, à partir de 1991, de la méthode basée sur
la Polymerase Chain Reaction (P.C.R.).
1.2.1. L'analyse de l'ADN nucléaire
Cette analyse s'applique aux
mini-satellites et micro-satellites, régions variables
d'individu à individu, qui sont constituées par la
répétition en tandem d'unités de base composées de deux
à plusieurs nucléotides. Le nombre de répétitions va
induire une variation de la taille du fragment d'ADN. La
tâche du biologiste consiste à mesurer la longueur de
ces régions variables, caractéristiques de l'ADN à
étudier.
1.2.1.1. Les sondes multilocus et monolocus
Leur mise au point a bénéficié, comme
l'indique le Professeur Doutremepuich7,
d'une découverte relative à la propriété des enzymes de
restriction consistant à découper la molécule d'ADN en
des zones très précises et toujours identiques :
« il en résulterait une quantité
infinie de fragments d'ADN de tailles très variables que
l'on pourrait séparer par électrophorèse. L'hybridation
avec des sondes synthétisées pouvant reconnaître
plusieurs sites dont les séquences d'ADN étaient très
voisines sur l'ensemble du génome, il était possible, en
les rendant radioactives, de faire apparaître les
fragments hybridés sur une autoradiographie. Le
polymorphisme de taille, différent chez chaque individu,
se traduisait par la mise en évidence de bandes noires
ressemblant à un code-barre dont il fallait définir avec
précision la taille des fragments. Ces sondes peu
spécifiques ont été appelées multilocus. La technique
utilisée pour effectuer le transfert des fragments d'ADN
du gel sur une membrane plus résistante est le Southern
Blot ».
Malgré son très fort pouvoir
discriminant, cette méthode a été abandonnée car elle
présentait, pour la médecine légale, un certain nombre
d'inconvénients :
- lourdeur et longueur de la mise en
_uvre (cinq jours environ),
- nécessité d'une grande quantité d'ADN
(une tâche de sang de la taille d'une pièce de cinq
francs),
- difficulté, voire impossibilité,
d'interprétation en cas de mélanges d'ADN,
- impossibilité de conserver des données
pour une interprétation ultérieure,
En 1989, Alec Jeffreys améliora cette
méthode en créant des sondes monolocus qui
utilisent, comme les précédentes, la technique du
Southern Blot et étudient le même type de variabilité
mais se concentrent sur une seule localisation du
génome.
L'autoradiographie ne révèle donc qu'un
locus représenté par un ou deux allèles selon que le
sujet est homozygote ou hétérozygote8.
Il est possible d'augmenter la puissance de ce test en
multipliant les sondes spécifiques.
Cette technologie robuste est peu
sensible aux contaminations, très discriminante et d'une
interprétation aisée. Elle présente d'autre part
l'avantage de permettre un travail sur les mélanges
d'ADN, mais elle demeure coûteuse en temps et en
personnel et sa faible sensibilité requiert une quantité
importante (500 ng au minimum) d'ADN non dégradé et bien
purifié. Si elle reste encore employée, dans le domaine
civil, pour les recherches de paternité, elle a été
supplantée au pénal par la Polymerase Chain Reaction
(PCR) basée sur l'amplification génique.
1.2.1.2. L'analyse par amplification génique (PCR)
La polymérase est une enzyme capable
d'assembler des nucléotides, formant ainsi un brin d'ADN
complémentaire au fragment qui constitue le locus
génétique à analyser. Elle a, en outre, pour qualité
essentielle, d'être thermorésistante.
Le principe de la PCR consiste donc à
cibler une région polymorphique de l'ADN avec une coupe
d'amorces qui va encadrer la zone à amplifier sur la
molécule dénaturée. On va ensuite synthétiser les
fragments complémentaires en présence de cette enzyme
thermorésistante (la plus couramment utilisée étant la
Taq Polymérase).
Ce principe reproduit in vitro la
réplication naturelle de l'ADN au cours de la division
cellulaire. Une élévation de la température aux
différentes phases du processus (séparation des deux
brins, hybridation des amorces, élongation par la
polymérase) est apportée in vitro pour remplacer
l'énergie nécessaire in vivo et permet
l'accélération de la réaction.
La thermorésistance de la polymérase va
permettre de renouveler le cycle plusieurs fois
(habituellement 20 cycles) dans le même tube en
obtenant, à la fin de la réaction, assez de copies de la
séquence cible pour permettre son identification.
L'amplification génique est plus facile à
réaliser sur des unités répétitives du génome dont la
séquence barre (le « core ») n'est composée que
de deux à sept nucléotides, les micro-satellites
ou STR (Short Tandem Repeats), qui seront
localisés sur différents chromosomes et exprimeront un
nombre d'allèles (matérialisés sous forme de bandes)
suffisamment élevé.
Le nombre de loci étudiés doit être assez
élevé pour conférer à l'analyse du profil génétique un
pouvoir réellement discriminant. Tous les laboratoires
français utilisent aujourd'hui des kits commercialisés
par les sociétés PERKIN ELMER et PROMEGA. Ces kits
incluent une quinzaine de régions du génome
sélectionnées par le système américain CODIS pour leur
haute valeur discriminante. Sept d'entre eux sont ceux
qu'a consacrés la pratique anglaise et qui tendent
désormais à être mis en _uvre par tous les laboratoires
européens.
Ces trousses permettent d'amplifier
simultanément plusieurs STR associés à un marqueur
sexuel. Ce système multiplexe présente, outre son
coût réduit et sa rapidité de réalisation, l'avantage de
permettre l'analyse sur de très faibles quantités d'ADN,
hypothèse fréquente dans le cas de traces prélevées sur
des scènes de crime. Il convient cependant d'observer
que plus les zones étudiées sont nombreuses, plus les
conditions de bonne amplification sont délicates à
réunir et plus la réaction est fragile.
Les marqueurs sont révélés, soit de façon
manuelle sur gel d'acrylamide coloré à l'argent, soit de
façon automatisée sur un séquenceur avec une détection
en fluorescence. Le choix des loci coamplifiés est
déterminé par la nécessité d'obtenir des conditions
d'amplification homogènes et de permettre une lecture
simple : les zones de taille des fragments ne doivent
pas se chevaucher et des échelles de références
possédant toutes les tailles d'allèles doivent être
disposées sur le gel tous les deux échantillons.
La
technique de la PCR présente de nombreux avantages
qui expliquent qu'elle se soit imposée dans tous les
laboratoires spécialisés pour l'établissement des
profils génétiques :
- Une réaction PCR peut être réalisé sur
une très faible quantité d'ADN représentant cinquante à
cent cellules, qu'il soit dégradé ou non, purifié ou
non, récent ou ancien et, ,pratiquement, quel que soit
le support. Ceci permet d'obtenir des résultats à partir
de très petits échantillons et de pratiquer un
complément d'expertise avec le matériel restant9.
- La méthode est facile à pratiquer, les
réactifs pouvant être fournis sous forme de kits prêts à
l'emploi.
- Le recours à l'informatique permet
d'obtenir le résultat de l'analyse dans un délai très
court, avantage décisif dans le cadre d'une enquête
judiciaire : douze heures pour une trace de sang,
soixante douze heures pour une trace de sperme. Dans le
cas d'un prélèvement buccal opéré sur un suspect, ce
délai n'excède pas six heures et est donc compatible
avec celui de la garde à vue.
La seule faiblesse de cette méthode, liée
à sa très grande sensibilité, réside dans le risque de
contamination par un ADN étranger, et ce d'autant plus
que la quantité d'ADN analysable est réduite.
Des précautions draconiennes doivent donc être observées
tant au stade du recueil des échantillons qu'à celui de
l'analyse.
1.2.1.3. L'interprétation des résultats
Si l'analyse comparée d'une STR dans le
cadre d'une enquête judiciaire fournit, pour un
individu, deux allèles différents en taille de ceux qui
caractérisent un ADN inconnu (prélèvement de
« question » opéré sur une scène de crime), l'identité
peut être exclue. Cette exclusion est toujours formelle
et ne souffre aucun risque d'erreur.
Si, en revanche, les allèles
caractérisant l'ADN du suspect sont de même taille que
ceux mesurés sur l'ADN inconnu, on parlera de
concordance sans pouvoir totalement écarter la
possibilité qu'un autre individu possède, sur cette
région précise de l'ADN, les mêmes caractéristiques
génétiques.
On doit donc, d'une part, estimer les
fréquences du génotype (association de deux allèles)
dans une population donnée, et d'autre part, utiliser un
nombre de marqueurs assez élevé pour réduire à un niveau
infinitésimal le risque de coïncidence.
Les laboratoires disposent d'études
-réalisées principalement par le FBI et le Forensic
Science Service britannique- qui donnent la fréquence de
chacun des allèles dans différentes catégories de
populations (blanche -ou caucasienne- noire,
asiatique...). Quant au nombre de systèmes utilisés, le
Docteur Olivier Pascal indique que l'utilisation de
quatre sondes (analyse par la technique du Southern
Blot) permet d'obtenir des fréquences de 1 sur plusieurs
dizaines de milliers, alors que huit systèmes STR
abaissent la fréquence à 1 sur plusieurs milliards10.
On verra cependant dans la dernière partie du rapport
que ces évaluations doivent être soumises à certaines
règles de présentation devant les juges afin d'éviter
des erreurs d'interprétation.
Pour la recherche en paternité, un
seul allèle étant pris en compte, l'analyse du
polymorphisme des individus concernés s'opère
habituellement à partir de treize marqueurs. En
l'absence d'exclusion dans chacun de ces systèmes, la
probabilité de paternité est calculée à l'aide d'un
programme qui tient compte, là encore, de la fréquence
de chaque marqueur génétique dans la population de
référence.
1.2.2. L'analyse de l'ADN mitochondrial
Elle vise à mettre en évidence un
polymorphisme de structure. La définition du
mitotype porte sur la détermination d'environ
700 nucléotides par la technique du séquençage.
L'utilisation d'un séquenceur automatique permet de
raccourcir le délai de réponse.
La séquence déterminée est comparée à une
séquence de référence, dite séquence d'Anderson. Les
points de mutation sont mis en évidence et les mitotypes
des pièces de question et des pièces de comparaison
permettront, comme pour l'ADN nucléaire, d'affirmer,
soit une exclusion (si plus de trois différences sont
observées entre les deux ADN), soit une identité.
Dans le cas de l'affirmation d'identité,
la fréquence du mitotype est déterminée à partir d'une
banque de données internationale comportant les
séquences de 1657 individus non apparentés. La majorité
des séquences déterminées n'existent pas dans cette
banque de données. Dans ce cas, l'estimation de la
fréquence en cas d'identification est inférieure à
1/1657, soit moins de 0,06 %. Néanmoins, certaines
séquences d'ADN mitochondrial sont sur-représentées dans
la population générale et leur fréquence peut atteindre
2,8 %. Dans ce cas, on considère que cette fréquence
élevée ne permet pas une identification fiable et que
seule une exclusion est possible.
Cette technologie est lourde et onéreuse.
Comme il s'agit d'une méthode permettant l'analyse de
micro-prélèvements, elle est très sensible aux
contaminations. Plus encore que pour l'ADN
nucléaire, la séparation des activités et la mise en
place de nombreux contrôles (extraction-amplification)
revêtent une importance particulière pour la validation
des résultats.
|