Les empreintes génétiques

Accueil RETOUR MENU ADN

 


Les empreintes génétiques :
données scientifiques et techniques

L'ADN contenu pour l'essentiel dans le noyau de la cellule possède trois propriétés qui intéressent la police scientifique : il possède des régions variables d'individu à individu ; ces régions sont identiques chez un individu quel que soit le tissu analysé ; enfin, l'ADN est transmis par moitié de chacun des parents à ses enfants. Deux principales applications s'en déduisent :

- la recherche en paternité ;

- l'identification d'individus à partir de toute trace biologique3.

Les techniques utilisées pour mettre en évidence le polymorphisme de l'ADN permettent aujourd'hui d'obtenir, dans de courts délais, des résultats extrêmement précis à partir d'échantillons ne contenant qu'une quantité infime de produit biologique. Elles imposent, en contrepartie, des précautions rigoureuses pour parer aux risques de contamination qui compromettraient la fiabilité des analyses.

1.1. Le polymorphisme de l'ADN

L'acronyme ADN désigne une macromolécule, l'acide désoxyribonucléique, dont on a dit qu'elle était l'unité de base de la vie, l'empreinte génétique du corps. Cette molécule est présente dans le noyau de la quasi totalité des cellules -à l'exception des globules rouges- ainsi que dans les mitochondries, organites cytoplasmiques qui jouent un rôle important dans les phénomènes de respiration et les réactions énergétiques de la cellule. L'expertise génétique se concentre prioritairement sur l'ADN nucléaire mais l'ADN mitochondrial peut également, on le verra plus loin, fournir des informations utiles bien que moins discriminantes.

On hérite de son ADN au moment de la conception. L'ovule fécondé renferme l'ADN provenant du spermatozoïde du père et de l'ovule de la mère. La cellule originelle se subdivise ensuite continuellement de façon que chaque cellule du corps reproduise l'ADN de cette union originelle. L'ADN est donc identique dans chaque cellule, quelle que soit la partie du corps où il se trouve et il reste essentiellement le même de la conception jusqu'à la mort.

De structure bicaténaire, l'ADN s'organise, dans les cellules somatiques, en vingt-trois paires de chromosomes hérités de la mère et du père, dont vingt-deux paires de chromosomes homologues et deux hétérochromosomes sexuels (génotype XX chez la femme, XY chez l'homme).

La molécule d'ADN est constituée d'un enchaînement de sucres-phosphates reliés à quatre bases, ou nucléotides : Adénine, Guanine, Cytosine, Thymine (A, G, C, T). Pour former chaque échelon de la double chaîne d'ADN, ces quatre éléments de construction constituent des couples basiques ou « A » se trouve toujours lié à « T » et « G » à « C ». L'ordre des bases sur la chaîne linéaire de nucléotides formant l'ADN constitue sa séquence nucléotidique.

La séquence complète de l'ADN d'une cellule humaine formant le génome déroulé mesure 1,80 mètre et comporte environ 3 milliards de nucléotides. La théorie généralement acceptée veut qu'il n'y ait pas, à l'exception des jumeaux homozygotes, deux personnes porteuses du même ADN. Mais il serait beaucoup trop long et coûteux de procéder, pour l'établissement d'une comparaison, à l'examen de la totalité de la chaîne contenue dans une cellule. Il convient donc de s'appuyer sur les ressources offertes par le polymorphisme de l'ADN.

1.1.1. Le polymorphisme de l'ADN nucléaire

Pour 10 à 20 %, la molécule d'ADN est constituée par les gènes qui sont le support de l'information. Ces unités codantes se retrouvent au niveau de l'ARN messager lors du phénomène de transcription puis se traduisent en protéines.

En revanche, la plus grande partie (80 à 90 %) de l'ADN nucléaire ne commande directement aucune synthèse protéique et l'on ignore actuellement sa fonction précise. Dans cette partie non codante, l'analyse a mis en évidence des régions variables : il s'agit de segments d'ADN caractérisés par la répétition en tandem d'unités de base composées de deux ou plusieurs nucléotides. La taille de ces fragments, ou allèles, varie en fonction du nombre de répétitions. On distingue ainsi deux types de polymorphisme :

- les mini-satellites ou VNTR (Variable Numbers of Tandem Repeats) correspondent à des séquences répétées en tandem, appelées cores, de 15 à 40 paires de bases. Le nombre de ces répétitions est variable d'un individu à l'autre, constituant une série d'allèles. Les zones se transmettent selon le mode mendélien : l'enfant reçoit un allèle de son père et un allèle de sa mère4. Des études récentes considèrent que nous aurions 1 500 zones de ce type, soit 1 500 systèmes de polymorphisme5.

- les micro-satellites ou STR (Short Tandem Repeats), unités répétitives dont le core est très court (4 paires de bases en moyenne) et répété de deux à dix fois au plus. Des centaines de micro-satellites ont été étudiés mais, comme le note le Professeur Rouger, peuvent seuls être retenus pour la pratique des empreintes génétiques ceux qui sont aisément amplifiables6 avec une expression simple des allèles, présentent un fort taux d'hétérozygotie et expriment un nombre d'allèles suffisamment élevé.

Du point de vue judiciaire qui nous préoccupe dans le cadre de ce rapport, deux points importants doivent être soulignés à propos de cet examen des zones variables :

- plus nombreux sont les sites polymorphes qui font apparaître une concordance entre un échantillon probatoire (recueilli sur le lieu d'une infraction) et un échantillon connu (prélevé sur un suspect), moins il est probable que l'échantillon probatoire provienne d'un individu différent.

- La non-concordance constatée sur un seul site polymorphe conduit à écarter de façon absolue l'individu dont le profil ADN est confronté à celui de l'échantillon probatoire. L'inclusion s'apprécie en termes de probabilité, l'exclusion en termes de certitude.

1.1.2. Le polymorphisme de l'ADN mitochondrial

L'ADN mitochondrial (ADN-mt), présent dans le cytoplasme, peut également être utilisé pour l'expertise génétique : il s'agit d'une petite molécule circulaire et monocaténaire de 16 569 paires de bases qui codent pour des chaînes polypeptidiques nécessaires au fonctionnement de la mitochondrie et pour des ARN. Sa séquence est entièrement connue et elle présente deux régions hypervariables. Le polymorphisme n'est pas lié ici à des variations de longueur mais à des variations dans la composition en nucléotides (polymorphisme de structure).

Une autre caractéristique de l'ADN-mt est son hérédité maternelle. En effet, l'ovule est bien fourni en mitochondries (entre 100 000 et 200 000) alors que le spermatozoïde n'en contient qu'un petit nombre qui ne persiste pas dans la descendance. La mère transmet donc son ADN-mt à tous ses enfants mais seules les filles le transmettront à leur tour à leur progéniture.

Par ailleurs, le polymorphisme de l'ADN-mt est moins marqué que celui de l'ADN nucléaire et l'analyse qui en est faite est donc moins discriminante. Il présente néanmoins un double intérêt :

- préservé par la haute résistance de la mitochondrie, il peut être analysé sur des traces anciennes ou fortement dégradées sur lesquelles l'ADN nucléaire n'est plus exploitable. La recherche historique en a fait ces dernières années un fréquent usage, notamment pour les ossements de la famille impériale de Russie et pour le c_ur présumé de Louis XVII conservé à St Denis.

- il peut également permettre d'expertiser des tissus biologiques dépourvus d'ADN nucléaire, mais riches en mitochondries, qui sont prélevés sur une scène de crime. C'est notamment le cas des tiges de cheveux.

1.1.3. Les applications judiciaires

L'ADN étant transmis par moitié de chacun des parents à ses enfants, l'empreinte génétique trouve une application remarquable dans la recherche de paternité qui relève aussi bien du domaine civil (établissement ou contestation d'une filiation, action à des fins de subsides) que du domaine pénal (affaires de viol et d'inceste).

Dans le domaine des enquêtes judiciaires, de nombreuses raisons ont conduit les services de police à recourir aux empreintes génétiques :

- à l'exception des globules rouges, toutes les cellules du corps humain peuvent théoriquement être identifiées : sperme, sang (globules blancs), racines de cheveux, salive (cellules épithéliales), peau, moelle osseuse, os.

- l'ADN étant essentiellement le même d'une cellule à l'autre, il est possible de procéder à une comparaison entre différentes parties du corps, telles que sang et sperme, cheveux et peau,

- de très faibles quantités de ces types de substances sont nécessaires pour procéder à une identification,

- les techniques permettent d'innocenter certains suspects et, parallèlement, d'en identifier d'autres. Comme on l'a indiqué précédemment, le pouvoir d'exclusion est absolu. Le pouvoir d'inclusion dépend de l'inférence que l'on peut tirer de la comparaison des profils.

Un enquêteur peut, par conséquent, exploiter cette technique d'analyse à des fins diverses :

- identifier une victime alors même qu'une partie du corps seulement à été découverte ;

- identifier une victime et désigner un suspect lorsque, par exemple, l'ADN d'une partie du corps concorde avec celui des traces de sang prélevé sur un objet dont le suspect a été trouvé en possession ;

- identifier un suspect au moyen de substances que l'auteur du méfait a laissées sur les lieux du crime. Dans certains cas (analyse du sperme laissé dans le vagin d'une victime de viol), la concordance des analyses fournira une forte présomption de culpabilité ; dans d'autres (frottis de salive provenant d'une morsure ou morceau de peau découvert sous les ongles de la victime), la valeur de la concordance devra être appréciée, plus encore que dans le premier cas, en fonction des autres éléments de l'enquête ;

- identifier un suspect au moyen des substances que l'auteur du méfait a pu emporter du lieu du crime : tel est le cas lorsque le profil ADN de la victime d'un meurtre correspond à celui du sang trouvé sur les vêtements du suspect ;

- reconnaître les crimes en série et les distinguer des crimes par imitation.

1.2. L'établissement des empreintes génétiques : techniques d'analyse et interprétation des résultats.

On s'en tiendra ici à des développements généraux, renvoyant, pour une description détaillée, au document publié par le laboratoire de génétique moléculaire de l'Institut de biologie de Nantes (cf. annexe n° 2).

Ces techniques ont connu une évolution rapide depuis la mise au point par Alec Jeffreys, en 1985, des premières sondes multilocus jusqu'au développement, à partir de 1991, de la méthode basée sur la Polymerase Chain Reaction (P.C.R.).

1.2.1. L'analyse de l'ADN nucléaire

Cette analyse s'applique aux mini-satellites et micro-satellites, régions variables d'individu à individu, qui sont constituées par la répétition en tandem d'unités de base composées de deux à plusieurs nucléotides. Le nombre de répétitions va induire une variation de la taille du fragment d'ADN. La tâche du biologiste consiste à mesurer la longueur de ces régions variables, caractéristiques de l'ADN à étudier.

1.2.1.1. Les sondes multilocus et monolocus

Leur mise au point a bénéficié, comme l'indique le Professeur Doutremepuich7, d'une découverte relative à la propriété des enzymes de restriction consistant à découper la molécule d'ADN en des zones très précises et toujours identiques : « il en résulterait une quantité infinie de fragments d'ADN de tailles très variables que l'on pourrait séparer par électrophorèse. L'hybridation avec des sondes synthétisées pouvant reconnaître plusieurs sites dont les séquences d'ADN étaient très voisines sur l'ensemble du génome, il était possible, en les rendant radioactives, de faire apparaître les fragments hybridés sur une autoradiographie. Le polymorphisme de taille, différent chez chaque individu, se traduisait par la mise en évidence de bandes noires ressemblant à un code-barre dont il fallait définir avec précision la taille des fragments. Ces sondes peu spécifiques ont été appelées multilocus. La technique utilisée pour effectuer le transfert des fragments d'ADN du gel sur une membrane plus résistante est le Southern Blot ».

Malgré son très fort pouvoir discriminant, cette méthode a été abandonnée car elle présentait, pour la médecine légale, un certain nombre d'inconvénients :

- lourdeur et longueur de la mise en _uvre (cinq jours environ),

- nécessité d'une grande quantité d'ADN (une tâche de sang de la taille d'une pièce de cinq francs),

- difficulté, voire impossibilité, d'interprétation en cas de mélanges d'ADN,

- impossibilité de conserver des données pour une interprétation ultérieure,

En 1989, Alec Jeffreys améliora cette méthode en créant des sondes monolocus qui utilisent, comme les précédentes, la technique du Southern Blot et étudient le même type de variabilité mais se concentrent sur une seule localisation du génome.

L'autoradiographie ne révèle donc qu'un locus représenté par un ou deux allèles selon que le sujet est homozygote ou hétérozygote8. Il est possible d'augmenter la puissance de ce test en multipliant les sondes spécifiques.

Cette technologie robuste est peu sensible aux contaminations, très discriminante et d'une interprétation aisée. Elle présente d'autre part l'avantage de permettre un travail sur les mélanges d'ADN, mais elle demeure coûteuse en temps et en personnel et sa faible sensibilité requiert une quantité importante (500 ng au minimum) d'ADN non dégradé et bien purifié. Si elle reste encore employée, dans le domaine civil, pour les recherches de paternité, elle a été supplantée au pénal par la Polymerase Chain Reaction (PCR) basée sur l'amplification génique.

1.2.1.2. L'analyse par amplification génique (PCR)

La polymérase est une enzyme capable d'assembler des nucléotides, formant ainsi un brin d'ADN complémentaire au fragment qui constitue le locus génétique à analyser. Elle a, en outre, pour qualité essentielle, d'être thermorésistante.

Le principe de la PCR consiste donc à cibler une région polymorphique de l'ADN avec une coupe d'amorces qui va encadrer la zone à amplifier sur la molécule dénaturée. On va ensuite synthétiser les fragments complémentaires en présence de cette enzyme thermorésistante (la plus couramment utilisée étant la Taq Polymérase).

Ce principe reproduit in vitro la réplication naturelle de l'ADN au cours de la division cellulaire. Une élévation de la température aux différentes phases du processus (séparation des deux brins, hybridation des amorces, élongation par la polymérase) est apportée in vitro pour remplacer l'énergie nécessaire in vivo et permet l'accélération de la réaction.

La thermorésistance de la polymérase va permettre de renouveler le cycle plusieurs fois (habituellement 20 cycles) dans le même tube en obtenant, à la fin de la réaction, assez de copies de la séquence cible pour permettre son identification.

L'amplification génique est plus facile à réaliser sur des unités répétitives du génome dont la séquence barre (le « core ») n'est composée que de deux à sept nucléotides, les micro-satellites ou STR (Short Tandem Repeats), qui seront localisés sur différents chromosomes et exprimeront un nombre d'allèles (matérialisés sous forme de bandes) suffisamment élevé.

Le nombre de loci étudiés doit être assez élevé pour conférer à l'analyse du profil génétique un pouvoir réellement discriminant. Tous les laboratoires français utilisent aujourd'hui des kits commercialisés par les sociétés PERKIN ELMER et PROMEGA. Ces kits incluent une quinzaine de régions du génome sélectionnées par le système américain CODIS pour leur haute valeur discriminante. Sept d'entre eux sont ceux qu'a consacrés la pratique anglaise et qui tendent désormais à être mis en _uvre par tous les laboratoires européens.

Ces trousses permettent d'amplifier simultanément plusieurs STR associés à un marqueur sexuel. Ce système multiplexe présente, outre son coût réduit et sa rapidité de réalisation, l'avantage de permettre l'analyse sur de très faibles quantités d'ADN, hypothèse fréquente dans le cas de traces prélevées sur des scènes de crime. Il convient cependant d'observer que plus les zones étudiées sont nombreuses, plus les conditions de bonne amplification sont délicates à réunir et plus la réaction est fragile.

Les marqueurs sont révélés, soit de façon manuelle sur gel d'acrylamide coloré à l'argent, soit de façon automatisée sur un séquenceur avec une détection en fluorescence. Le choix des loci coamplifiés est déterminé par la nécessité d'obtenir des conditions d'amplification homogènes et de permettre une lecture simple : les zones de taille des fragments ne doivent pas se chevaucher et des échelles de références possédant toutes les tailles d'allèles doivent être disposées sur le gel tous les deux échantillons.

La technique de la PCR présente de nombreux avantages qui expliquent qu'elle se soit imposée dans tous les laboratoires spécialisés pour l'établissement des profils génétiques :

- Une réaction PCR peut être réalisé sur une très faible quantité d'ADN représentant cinquante à cent cellules, qu'il soit dégradé ou non, purifié ou non, récent ou ancien et, ,pratiquement, quel que soit le support. Ceci permet d'obtenir des résultats à partir de très petits échantillons et de pratiquer un complément d'expertise avec le matériel restant9.

- La méthode est facile à pratiquer, les réactifs pouvant être fournis sous forme de kits prêts à l'emploi.

- Le recours à l'informatique permet d'obtenir le résultat de l'analyse dans un délai très court, avantage décisif dans le cadre d'une enquête judiciaire : douze heures pour une trace de sang, soixante douze heures pour une trace de sperme. Dans le cas d'un prélèvement buccal opéré sur un suspect, ce délai n'excède pas six heures et est donc compatible avec celui de la garde à vue.

La seule faiblesse de cette méthode, liée à sa très grande sensibilité, réside dans le risque de contamination par un ADN étranger, et ce d'autant plus que la quantité d'ADN analysable est réduite. Des précautions draconiennes doivent donc être observées tant au stade du recueil des échantillons qu'à celui de l'analyse.

1.2.1.3. L'interprétation des résultats

Si l'analyse comparée d'une STR dans le cadre d'une enquête judiciaire fournit, pour un individu, deux allèles différents en taille de ceux qui caractérisent un ADN inconnu (prélèvement de « question » opéré sur une scène de crime), l'identité peut être exclue. Cette exclusion est toujours formelle et ne souffre aucun risque d'erreur.

Si, en revanche, les allèles caractérisant l'ADN du suspect sont de même taille que ceux mesurés sur l'ADN inconnu, on parlera de concordance sans pouvoir totalement écarter la possibilité qu'un autre individu possède, sur cette région précise de l'ADN, les mêmes caractéristiques génétiques.

On doit donc, d'une part, estimer les fréquences du génotype (association de deux allèles) dans une population donnée, et d'autre part, utiliser un nombre de marqueurs assez élevé pour réduire à un niveau infinitésimal le risque de coïncidence.

Les laboratoires disposent d'études -réalisées principalement par le FBI et le Forensic Science Service britannique- qui donnent la fréquence de chacun des allèles dans différentes catégories de populations (blanche -ou caucasienne- noire, asiatique...). Quant au nombre de systèmes utilisés, le Docteur Olivier Pascal indique que l'utilisation de quatre sondes (analyse par la technique du Southern Blot) permet d'obtenir des fréquences de 1 sur plusieurs dizaines de milliers, alors que huit systèmes STR abaissent la fréquence à 1 sur plusieurs milliards10. On verra cependant dans la dernière partie du rapport que ces évaluations doivent être soumises à certaines règles de présentation devant les juges afin d'éviter des erreurs d'interprétation.

Pour la recherche en paternité, un seul allèle étant pris en compte, l'analyse du polymorphisme des individus concernés s'opère habituellement à partir de treize marqueurs. En l'absence d'exclusion dans chacun de ces systèmes, la probabilité de paternité est calculée à l'aide d'un programme qui tient compte, là encore, de la fréquence de chaque marqueur génétique dans la population de référence.

1.2.2. L'analyse de l'ADN mitochondrial

Elle vise à mettre en évidence un polymorphisme de structure. La définition du mitotype porte sur la détermination d'environ 700 nucléotides par la technique du séquençage. L'utilisation d'un séquenceur automatique permet de raccourcir le délai de réponse.

La séquence déterminée est comparée à une séquence de référence, dite séquence d'Anderson. Les points de mutation sont mis en évidence et les mitotypes des pièces de question et des pièces de comparaison permettront, comme pour l'ADN nucléaire, d'affirmer, soit une exclusion (si plus de trois différences sont observées entre les deux ADN), soit une identité.

Dans le cas de l'affirmation d'identité, la fréquence du mitotype est déterminée à partir d'une banque de données internationale comportant les séquences de 1657 individus non apparentés. La majorité des séquences déterminées n'existent pas dans cette banque de données. Dans ce cas, l'estimation de la fréquence en cas d'identification est inférieure à 1/1657, soit moins de 0,06 %. Néanmoins, certaines séquences d'ADN mitochondrial sont sur-représentées dans la population générale et leur fréquence peut atteindre 2,8 %. Dans ce cas, on considère que cette fréquence élevée ne permet pas une identification fiable et que seule une exclusion est possible.

Cette technologie est lourde et onéreuse. Comme il s'agit d'une méthode permettant l'analyse de micro-prélèvements, elle est très sensible aux contaminations. Plus encore que pour l'ADN nucléaire, la séparation des activités et la mise en place de nombreux contrôles (extraction-amplification) revêtent une importance particulière pour la validation des résultats.