Suite

Déterminer la taille de l'écran/de la carte pour limiter le nombre de marqueurs affichés

Déterminer la taille de l'écran/de la carte pour limiter le nombre de marqueurs affichés


J'écris une application Web javascript JQuery Openlayers qui se connecte à une API, qui expose un million de points géolocalisés ainsi que des métriques et des informations sur les points.

Une métrique est une importance de points, donc les points peuvent être ordonnés et limités par cette métrique. Je peux demander à l'API un nombre limité de points dans un cadre de délimitation.

L'application doit être optimisée pour les mobiles, ce qui signifie que je dois détecter la taille de l'écran, en tenant compte de la densité de pixels, et modifier le nombre de points à interroger et à afficher sous forme de marqueurs pour l'utilisateur.

Les marqueurs sont de taille similaire et ressemblent à l'icône marqueur/épingle api de google maps. L'utilisateur peut appuyer sur un marqueur et afficher un appel.

Donc pour un iPhone 3g, 4 et 4S une limite de 20 serait bien, un iPad 50, mais pour un ordinateur de bureau il est possible qu'elle soit liée à la taille actuelle que l'utilisateur a choisie pour la carte.

L'application doit être réactive à la mise en page et l'utilisateur peut choisir le nombre de panneaux d'information à afficher. Il est donc possible sur l'iPad que la limite diminue à mesure que davantage de panneaux sont "dépliés". En fait la carte est secondaire, et celle-ci sera également "pliable".

Comment déterminer la taille de l'écran des appareils mobiles/de bureau, y compris en tenant compte des écrans Retina (c'est-à-dire que les écrans plus denses n'affichent pas plus de marqueurs) ?

Puis-je également déterminer la zone d'affichage de la carte actuelle ?


Pour la division de la carte, vous pouvez utiliser la fonction getSize() qui renvoie une instance openLayers.Size qui a des propriétés de largeur et de hauteur

voir : http://dev.openlayers.org/releases/OpenLayers-2.7/doc/apidocs/files/OpenLayers/Map-js.html#OpenLayers.Map.getSize

map = new.OpenLayers.Map('map'); taille = map.getSize() largeur = taille.w hauteur = taille.h

Le nombre maximum de waypoints autorisés est de 8, plus l'origine et la destination. Les clients Maps API Premier ont droit à 23 points de cheminement, plus l'origine et la destination.

Donc, oui, la limite est de dix lorsque vous incluez le début et la fin. Donc, si vous voulez plus que cela, vous pouvez soit passer à Maps Premier ($) soit essayer de le contourner.

Une solution de contournement possible consiste à :

  • Regroupez les waypoints en groupes de 9 qui sont les plus proches les uns des autres
  • Faites des instructions pour chaque groupe, le point de départ de chaque groupe étant le point d'arrivée du dernier groupe
  • Si vous pouvez autoriser l'utilisateur à spécifier la commande au lieu d'optimiser le code, cela facilite les choses
  • La fonction de matrice de distance peut aider à déterminer les distances entre les points de cheminement, car elle a une limite plus élevée pour le nombre de points.

Une autre solution consiste à revenir à l'API Google Maps V2, qui semble toujours avoir la plus grande limite de 25.

Une dernière solution consiste à faire votre propre implémentation du problème du voyageur de commerce, mais ce n'est pas anodin.


Carte routière du Nord de l'Ontario

Cliquez sur la vignette pour télécharger le côté nord de la carte routière officielle de l'Ontario 2020-2021
(PDF - 21 Mo)

Cliquez sur les zones géographiques pour télécharger les cartes.

Carte 12 :
Marathon, Wawa, Sault Ste. Marie, Blind River, Elliot Lake (PDF - 4,34 Mo )

Carte 13 :
Kapuskasing, Timmins, New Liskeard, Elliot Lake, Sudbury, North Bay(PDF - 5,03 Mo )

Carte 14 :
Rainy River, Kenora, Red Lake, Sioux Lookout, Ignace, Atikokan(PDF - 3,63 Mo )

Carte 15 :
Thunder Bay, Mishkeegogamang, Nakina, Longlac, Marathon, Nipigon (PDF - 5,21 Mo )

Carte 16 :
Lac Rouge, Lac Sachigo, Sioux Lookout
(PDF - 2,72 Mo )

Carte 17 :
Lac Bearskin, Webequie, Eabametoong, lac Savant, lac Pickle (PDF - 6,24 Mo )

Carte 18 :
Marten Falls, Attawapiskat, Longlac, Hearst (PDF - 3,16 Mo )

Carte 19 :
Kashechewan, Fort Albany, Moosonee, Kapuskasing, Smooth Rock Falls (PDF - 1,81 Mo )

Carte 20 :
Lac Sandy, lac Sachigo, Wapekeka, lac Kasabonika (PDF - 1,67 Mo )

Agrandissements


SIG (Système d'Information Géographique)

Un système d'information géographique (SIG) est un système informatique permettant de capturer, de stocker, de vérifier et d'afficher des données relatives aux positions sur la surface de la Terre.

Géographie, Systèmes d'Information Géographique (SIG), Géographie Physique

Celui-ci répertorie les logos des programmes ou partenaires de NG Education qui ont fourni ou contribué au contenu de cette page. Nivelé par

Si vous avez déjà utilisé Google Maps ou GPS en voyage, alors vous avez fait l'expérience de la puissance du SIG.

Un système d'information géographique (SIG) est un système informatique permettant de capturer, de stocker, de vérifier et d'afficher des données relatives aux positions sur Terre.

Il peut utiliser n'importe quelle information qui inclut l'emplacement. L'emplacement peut être exprimé de différentes manières, telles que la latitude et la longitude, l'adresse ou le code postal.

De nombreux types d'informations peuvent être comparés et contrastés à l'aide du SIG, et nous pouvons découvrir comment ces informations sont liées les unes aux autres. Il nous parle du paysage et des gens qui nous entourent. Le SIG est un outil important pour de nombreux emplois différents.

Les données SIG se présentent sous de nombreuses formes.

Les données cartographiques ou les données cartographiques en sont un exemple. Cela peut inclure des informations telles que l'emplacement des rivières, des routes, des collines et des vallées. Les données cartographiques peuvent également inclure des données d'enquête ou des informations cartographiques, qui peuvent être directement saisies dans un SIG.

L'interprétation des photographies est une partie importante du SIG. L'interprétation des photos consiste à analyser les photographies d'en haut et à évaluer les caractéristiques qui apparaissent.

Les données numériques peuvent également être saisies dans le SIG. Par exemple, les données informatiques collectées par satellite peuvent montrer comment les terres sont utilisées, ainsi que l'emplacement des fermes, des villes et des forêts. Les satellites peuvent également utiliser le SIG pour capturer des images dans un outil appelé télédétection.

Enfin, les données SIG peuvent également être collectées à partir de tableaux ou de feuilles de calcul. La démographie de la population en est un exemple. C'est à ce moment que les gens sont regroupés dans certaines catégories. Certains exemples sont l'âge, le revenu et l'origine ethnique, ou même l'historique de navigation sur Internet.

La technologie SIG permet de superposer tous ces différents types d'informations sur une seule carte. L'emplacement est le point de données clé qui relie des informations apparemment sans rapport.

La technologie SIG peut être utilisée pour afficher les relations spatiales et les réseaux linéaires.

Les relations spatiales peuvent afficher la topographie, comme les terres agricoles et les cours d'eau. Ils peuvent également montrer des modèles d'utilisation des terres, tels que l'emplacement des parcs et des quartiers.

Des exemples de réseaux linéaires sont les routes et les rivières. Une ligne sur une carte peut indiquer une route ou une autoroute. Avec les couches SIG, cependant, cette route peut indiquer la limite d'un district scolaire, d'un parc public ou d'une autre zone d'utilisation des terres.

Le SIG doit faire en sorte que les informations de toutes les différentes cartes et sources s'emboîtent à la même échelle. Une échelle est la relation entre la distance sur une carte et la distance réelle sur Terre.

Souvent, le SIG doit manipuler et déplacer des données car différentes cartes ont des projections différentes. Une projection est un moyen de déplacer des informations de la surface incurvée de la Terre vers un morceau de papier plat ou un écran d'ordinateur. Différents types de projections accomplissent cette tâche de différentes manières. Chaque fois que cela se produit, il y a une certaine distorsion. Vous ne pouvez pas placer une forme tridimensionnelle incurvée sur une surface plane sans étirer certaines parties et presser d'autres.

Une carte du monde peut montrer les tailles correctes des pays ou leurs formes correctes, mais elle ne peut pas faire les deux. Le SIG prend des données à partir de cartes qui ont été faites à l'aide de différentes projections. Il les combine afin que toutes les informations puissent être affichées en utilisant une projection commune.

Une fois que toutes les données souhaitées ont été saisies dans un système SIG, elles peuvent être combinées pour produire une grande variété de cartes individuelles. L'une des utilisations les plus courantes du SIG consiste à comparer les caractéristiques naturelles avec l'activité humaine.

Par exemple, les cartes SIG peuvent afficher les maisons et les entreprises dans les zones sujettes aux inondations.

La technologie SIG permet également aux utilisateurs de « creuser en profondeur » dans une zone spécifique avec de nombreux types d'informations. Les cartes d'une seule ville ou d'un quartier peuvent rapporter des informations telles que les habitudes de vote ou le montant moyen d'argent gagné par les gens là-bas. N'importe quelle couche de données SIG peut être ajoutée ou soustraite à la même carte.

Les cartes SIG peuvent être utilisées pour montrer des informations sur les nombres et la densité. Par exemple, le SIG peut montrer combien de médecins il y a dans un quartier par rapport à la population de la région.

Avec la technologie SIG, les chercheurs peuvent également examiner les changements au fil du temps. Ils peuvent utiliser les données satellitaires pour étudier des sujets tels que le mouvement et la disparition de la couverture de glace au pôle Nord. Un service de police pourrait étudier les changements dans les données sur la criminalité pour aider à déterminer où affecter les agents.

Photographie et images 3D

Une utilisation importante de la technologie SIG basée sur le temps consiste à créer des photographies en accéléré. Il montre des processus changeant sur de vastes zones et de longues périodes de temps. Par exemple, les données montrant le mouvement des fluides dans les courants océaniques aident les scientifiques à mieux comprendre comment l'humidité et l'énergie thermique se déplacent autour du globe.

La technologie SIG permet parfois aux utilisateurs d'accéder à des informations supplémentaires sur des zones spécifiques sur une carte. Par exemple, un utilisateur peut cliquer sur une école pour connaître le nombre d'élèves qui y sont inscrits ou le nombre d'élèves par enseignant.

Les images tridimensionnelles sont souvent produites avec des systèmes SIG. Ceci est utile, par exemple, pour les géologues qui étudient les lignes de faille, là où se produisent les tremblements de terre.

Il est également facile de mettre à jour les cartes grâce à la technologie SIG et les données mdash peuvent être simplement ajoutées au programme existant. Une nouvelle carte peut alors être imprimée ou affichée à l'écran. Cela saute l'ancienne façon de dessiner une carte, qui prend du temps et de l'argent.

La technologie SIG est utilisée pour de nombreux travaux.

De nombreux commerces de détail utilisent le SIG pour les aider à déterminer où localiser un nouveau magasin. Les scientifiques utilisent les SIG pour comparer les statistiques démographiques à des ressources telles que l'eau potable. Les biologistes utilisent le SIG pour suivre les schémas de migration des animaux.

Les autorités municipales, étatiques ou fédérales utilisent le SIG pour planifier leur intervention en cas de catastrophe naturelle telle qu'un tremblement de terre ou un ouragan. Les cartes SIG peuvent montrer à ces fonctionnaires quels quartiers sont les plus menacés ou où localiser les abris d'urgence.

Les ingénieurs utilisent la technologie SIG pour concevoir et gérer les réseaux de téléphonie mobile et Wi-Fi que nous utilisons. D'autres ingénieurs pourraient utiliser les SIG pour développer des réseaux routiers et des infrastructures de transport.

Il n'y a pas de limite au type d'informations pouvant être analysées à l'aide de la technologie SIG.


Les références

Development CoreTeam : R : Un langage et un environnement pour l'informatique statistique. 2011, Vienne, Autriche : R Foundation for Statistical Computing, [http://www.R-project.org]. [ISBN 3-900051-07-0], []. [ISBN 3-900051-07-0]

Bivand R, Pebesma E, Gomez-Rubio V : Analyse de données spatiales appliquées avec R. 2008, New York : Springer, [http://www.asdar-book.org/], []

Tanser F, le Sueur D : L'application des systèmes d'information géographique à d'importants problèmes de santé publique en Afrique. Int J Santé Géogr. 2002, 1 : 4-10.1186/1476-072X-1-4.

Soares Magalhães R, Clements A, Patil A, Gething P, Brooker S: Les applications de la géostatistique basée sur des modèles dans l'épidémiologie et le contrôle des helminthes. Adv Parasitol. 2011, 74 : 267-296.

Soares Magalhães R, Biritwum NK, Gyapong J, Brooker S, Zhang Y, Blair L, Fenwick A, Clements A : Cartographie de la co-infection et de la co-intensité des helminthes : prédiction géostatistique au Ghana. PLoS Negl Trop Dis. 2011, 5 (6) : e1200-10.1371/journal.pntd.0001200.

Beck-Wörner C, Raso G, Vounatsou P, N'Goran E, Rigo G, Parlow E, Utzinger J : prédiction bayésienne du risque spatial d'infection à Schistosoma mansoni dans l'ouest de la Côte d'Ivoire à l'aide d'un modèle numérique d'élévation de télédétection Suis J Trop Med Hyg. 2007, 76 (5) : 956-63.

Simoonga C, Utzinger J, Brooker S, Vounatsou P, Appleton C, Stensgaard A, Olsen A, Kristensen T : Télédétection, système d'information géographique et analyse spatiale pour l'épidémiologie et l'écologie de la schistosomiase en Afrique. Parasitologie. 2009, 136 (13) : 1683-93. 10.1017/S0031182009006222.

Chang A, Parrales M, Jimenez J, Sobieszczyk M, Hammer S, Copenhague D, RP K : Combiner les technologies de cartographie Google Earth et SIG dans un système de surveillance de la dengue pour les pays en développement. Int J Santé Géogr. 2009, 8 : 49-10.1186/1476-072X-8-49.

Lozano-Fuentes S, Elizondo-Quiroga D, Farfan-Ale J, Loroño-Pino M, Garcia-Rejon J, Gomez-Carro S, Lira-Zumbardo V, Najera-Vazquez R, Fernandez-Salas I, Calderon-Martinez J, Dominguez-Galera M, Mis-Avila P, Morris N, Coleman M, Moore C, Beaty B, Eisena L : utilisation de Google Earth pour renforcer les capacités de santé publique et faciliter la gestion des maladies à transmission vectorielle dans les environnements pauvres en ressources. Bulletin de l'Organisation mondiale de la santé. 2008, 86 : 718-725. 10.2471/BLT.07.045880.

Kamadjeu R : Traquer le virus de la polio en aval du fleuve Congo : une étude de cas sur l'utilisation de Google Earth dans la planification et la cartographie de la santé publique. Int J Santé Géogr. 2009, 8 : 4-10.1186/1476-072X-8-4.

Pebesma E, Bivand R : sp : classes et méthodes pour les données spatiales. 2012, [http://CRAN.R-project.org/web/packages/sp/]. [R package version 0.9-99], []. [R package version 0.9-99]

Hijmans RJ, van Etten J : raster : Analyse géographique et modélisation avec des données raster. 2012, [http://cran.r-project.org/web/packages/raster/]. [Progiciel R version 1.9-92], []. [Progiciel R version 1.9-92]

Hengl T, Roudier P, Beaudette D, Nuest D : plotKML : Visualisation d'objets spatiaux et spatio-temporels dans Google Earth. 2012, [http://cran.r-project.org/web/packages/plotKML/]. [R package version 0.2-2], []. [R package version 0.2-2]

SAGA : Système d'Analyses Géoscientifiques Automatisées. [http://www.saga-gis.org/fr/index.html], []

Brenning A : rsaga : SAGA Geoprocessing and Terrain Analysis in R. 2011, [http://cran.r-project.org/web/packages/RSAGA/]. [R package version 0.93-1], []. [R package version 0.93-1]

GDAL : Bibliothèque d'abstraction de données géospatiales. [http://www.gdal.org/], []

Keitt TH, Bivand R, Pebesma E, Rowlingson B : rgdal : Bindings for the Geospatial Data Abstraction Library. 2012, [http://cran.r-project.org/web/packages/rgdal/]. [R package version 0.7-11], []. [R package version 0.7-11]

Bivand R, Rundel C : rgeos : Interface vers le moteur de géométrie - Open Source (GEOS). 2012, [http://cran.r-project.org/web/packages/rgeos/] [R package version 0.8-5], [] [R package version 0.8-5]

Urbanek S : proj4 : Une interface simple vers la bibliothèque de projections cartographiques PROJ.4. 2011, [http://cran.r-project.org/web/packages/proj4/] [R package version 1.0-7], [] [R package version 1.0-7]

Ripley B : spatial : fonctions pour le krigeage et l'analyse des motifs de points. 2011, [http://cran.r-project.org/web/packages/spatial/]. [R package version 7.3-3], []. [Package R version 7.3-3]

Baddeley A, Turner R : et al, spatstat : analyse de motifs ponctuels spatiaux, ajustement de modèle, simulation, tests. 2012, [http://cran.r-project.org/web/packages/spatstat/]. [R package version 1.27-0], []. [R package version 1.27-0]

Pebesma E : et al, gstat : modélisation géostatistique spatiale et spatio-temporelle, prédiction et simulation. 2011, [http://cran.r-project.org/web/packages/gstat/]. [R package version 1.0-10], []. [R package version 1.0-10]

Gómez-Rubio V, Ferrándiz-Ferragud J, López-Quílez A, Bivand R : DCluster : fonctions pour la détection de groupes spatiaux de maladies. 2012, [http://cran.r-project.org/web/packages/DCluster/]. [R package version 0.2-5], []. [R package version 0.2-5]

Newton R, Wernisch L : Rwui : une application Web pour créer des interfaces Web conviviales pour les scripts R. R Nouvelles. 2007, 7 (2) : 32-35.

MacDonald P : Méthodes en épidémiologie de terrain. 2011, Burlington : Jones et Bartlett Learning

Scotch M, Parmanto B, Gadd C, Sharma R : Exploration du rôle des SIG lors de la résolution de problèmes d'évaluation de la santé communautaire : expériences des professionnels de la santé publique. Int J Santé Géo. 2006, 5 : 39-10.1186/1476-072X-5-39.

Scotch M, Parmanto B, Monaco V : Évaluation de, SOVAT : Un système d'aide à la décision OLAP-SIG pour l'analyse des données d'évaluation de la santé communautaire. BMC Med Inf et prise de décision. 2008, 8 : 22-10.1186/1472-6947-8-22.


Visualisation des données avec Python Folium Maps

L'une de mes choses préférées à propos de la science des données est la visualisation des données. J'aime créer et utiliser des aides visuelles pour soutenir les histoires et les tendances de mes données. La bibliothèque Python Folium a été une ressource utile pour moi d'utiliser la puissance de l'analyse visuelle géospatiale. En d'autres termes, des cartes !

Les cartes me permettent d'analyser mes données sur plusieurs dimensions en une seule visualisation. Pour un projet récent, j'ai analysé 293 villes américaines afin de déterminer quelles seraient les bonnes candidates pour un programme pilote de partage de vélos et de scooters. À l'aide de la régression OLS, j'ai déterminé que, entre autres caractéristiques, le niveau de congestion d'une ville (mesuré par le pourcentage de temps de conduite passé dans la circulation, obtenu à partir d'INRIX.com) était positivement et significativement corrélé avec la « cyclabilité » d'une ville (mesurée par le score de vélo de walkscore.com). Bien que ce résultat puisse sembler contre-intuitif, il est raisonnable de penser que les habitants des villes les plus congestionnées sont incités à se déplacer à vélo (pensez : « Je ne veux pas m'asseoir dans la circulation donc je vais mettre mon casque et pédaler moi-même travailler").

Alors, comment puis-je visualiser la relation entre « cyclabilité » et embouteillage ? Un simple regplot en mer montre une corrélation linéaire positive entre le score du vélo et le trafic (mesuré par le pourcentage de temps de conduite passé dans le trafic).

FMais et si je voulais visualiser la distribution géospatiale des villes à travers ces deux dimensions ? Eh bien… en utilisant l'analyse géospatiale, j'ai pu créer une carte où les villes avec un trafic plus élevé ET des scores de vélo plus élevés étaient affichées. Mieux encore, la modification d'attributs tels que la couleur et la taille des marqueurs de carte signifie que je peux utiliser une figure pour visualiser les trois dimensions.

Pour créer cette carte, j'ai d'abord installé la bibliothèque Python Folium.

La première dimension que je voulais montrer est la géolocalisation. J'ai défini la latitude et la longitude de ma carte en fonction des résultats d'une simple recherche Google pour « latitude et longitude des États-Unis ». Ensuite, j'ai défini ma carte (astucieusement nommée traffic_map) pour l'initialiser à ces coordonnées. Le zoom par défaut est fixé à cinq (j'ai dû jouer avec ce paramètre jusqu'à ce que je trouve un bon affichage).

La deuxième dimension que nous voulions montrer est la congestion du trafic. J'ai regroupé ma variable de trafic ("traffic_index") en quartiles :

Ensuite, j'ai créé un dictionnaire pour les couleurs de mes marqueurs. J'ai opté pour une gamme de couleurs primaires allant du bleu clair (0) au rouge (3). Je voulais que le quartile le plus élevé (c'est-à-dire les villes les plus congestionnées) se démarque par un rouge vif, et que le quartile le plus bas (c'est-à-dire les candidats les moins congestionnés et les moins viables) s'efface plus ou moins dans la carte de base.

Note latérale : J'ai trouvé des noms de couleurs viables dans ce post Stack Overflow :
https://stackoverflow.com/questions/36202514/foilum-map-module-trying-to-get-more-options-for-marker-colors. J'ai essayé la plupart des couleurs répertoriées et elles se sont affichées avec précision, comme leur nom l'indique, à l'exception du "rouge clair", qui provoque une erreur ou apparaît en noir.

La troisième et dernière dimension sur ma carte est la « bikeability » de la ville. Pour visualiser cette dimension, j'ai défini la taille des marqueurs de la ville à 0,15 fois le bikescore de la ville (un autre paramètre avec lequel j'ai dû jouer en utilisant des essais et des erreurs jusqu'à ce qu'il "semble" correct).

Le code complet de la carte finale est le suivant :

Grâce à cette visualisation de données géospatiales, nous pouvons rapidement voir deux faits sur les villes et le vélo. Premièrement, la « cyclabilité » est positivement liée à la congestion du trafic. Deuxièmement, les villes à fort trafic ET « cyclabilité » (c'est-à-dire de grands marqueurs rouges) sont plus susceptibles d'être trouvées dans les régions du nord-est, de la Californie et du nord-ouest du Pacifique des États-Unis (à quelques exceptions notables près).

Découvrez mon article sur le projet complet ici. Et n'hésitez pas à laisser des commentaires ou des idées dans les commentaires!


Qu'est-ce qu'une carte topographique ?

Que ce soit sur papier ou sur un écran d'ordinateur, une carte est le meilleur outil disponible pour cataloguer et visualiser la disposition des choses à la surface de la Terre. Cartes de divers types et cartes routières, cartes politiques, cartes d'utilisation des terres, cartes du monde et mdash servent à de nombreuses fins différentes.

L'une des cartes les plus utilisées est la carte topographique. La caractéristique qui distingue le plus les cartes topographiques des cartes d'autres types est l'utilisation de courbes de niveau pour représenter la forme et l'élévation du terrain. Les cartes topographiques rendent les hauts et les bas en trois dimensions du terrain sur une surface en deux dimensions.

Les cartes topographiques représentent généralement à la fois des éléments naturels et artificiels. Ils montrent et nomment des œuvres de la nature, notamment des montagnes, des vallées, des plaines, des lacs, des rivières et de la végétation. Ils identifient également les principaux travaux de l'homme, tels que les routes, les limites, les lignes de transmission et les principaux bâtiments.

Le large éventail d'informations fournies par les cartes topographiques les rend extrêmement utiles aux utilisateurs de cartes professionnels et récréatifs. Les cartes topographiques sont utilisées pour l'ingénierie, l'exploration énergétique, la conservation des ressources naturelles, la gestion de l'environnement, la conception des travaux publics, la planification commerciale et résidentielle et les activités de plein air comme la randonnée, le camping et la pêche.


TECHNIQUES MÉDICALES ÉMERGENTES

15.4 TECHNIQUES D'EMPREINTE DIGITALE ADN/MICROBIOLOGIQUE

15.4.1 PRÉSENTATION

L'utilisation de micro-organismes en médecine légale environnementale dépend de l'existence de méthodes suffisamment reproductibles et spécifiques pour capturer la majeure partie de la variabilité microbienne. Jusqu'à récemment, nous étions limités à ces quelques micro-organismes (environ 5%) qui peuvent être cultivés et cultivés dans des conditions de laboratoire. Aujourd'hui, cela peut être surmonté par les progrès de la microbiologie moléculaire reflétés dans le développement d'une série de méthodes généralement appelées « empreintes digitales de l'ADN ». Ces méthodes utilisent la structure de l'ADN de l'ADN extrait directement des échantillons environnementaux (en contournant la culture) pour évaluer la variabilité d'une communauté microbienne et pour discerner des modèles et des corrélations spécifiques. Ces modèles sont distincts dans différents environnements, alors que pour le même environnement, ils peuvent refléter la présence ou l'absence de contamination.

Les méthodes d'empreintes génétiques peuvent être appliquées dans deux principaux types d'enquêtes médico-légales environnementales :

Suivi du passage et de la source de contamination en fonction des changements dans la structure des groupes microbiens (qui peuvent être observés au niveau de l'ADN) dus à la présence de contamination ( Flynn et al., 2000 Macur et al., 2004). La présence d'un certain contaminant influencera la structure de la communauté microbienne de l'environnement où le contaminant est libéré. En extrayant l'ADN de cet environnement et en créant une empreinte génétique communautaire, suivie d'une comparaison avec le même environnement sans contamination, il peut être possible de suivre les changements dus à une certaine contamination. Les changements enregistrés (changements) dans la communauté microbienne seront traçables longtemps après la disparition de la contamination. L'une des raisons en est que l'ADN persiste dans l'environnement après la mort des cellules microbiennes.

Suivi de la source des micro-organismes dans les attaques de bioterrorisme. L'existence d'un polymorphisme génique entre des espèces microbiennes et au sein de souches d'une même espèce peut être exploitée pour discerner la source exacte d'un micro-organisme. Sur la base du polymorphisme des gènes, des méthodes et stratégies médico-légales d'identification microbienne peuvent être développées et appliquées en cas d'attaque bioterroriste ou à toute autre fin médico-légale, telle que l'identification de la source de pollution fécale dans l'eau. Plus de détails sur les méthodes et stratégies utilisées dans la criminalistique bioterroriste ne sont pas donnés ici, mais peuvent être trouvés dans Petrisor et al. (2006) .

15.4.2 ADN (ACIDE DÉOXYRIBONUCLÉIQUE)

L'acide désoxyribonucléique (ADN) est la pierre angulaire de toutes les cellules vivantes. Les caractéristiques, les traits et les caractéristiques physiques d'un organisme sont déterminés par l'arrangement spécifique de la paire de bases d'ADN dans la cellule. L'ADN est un polymère constitué d'une grande répétition de séquences de monomères. Les unités monomères de l'ADN sont des nucléotides. Chaque nucléotide est constitué de trois composants : (1) le désoxyribose (un sucre à 5 carbones), (2) une base azotée attachée au sucre et (3) un groupe phosphate. Les composants désoxyribose et phosphate sont communs (répétition) pour tous les nucléotides, et les bases contenant de l'azote peuvent varier, étant de quatre types. Les nucléotides sont abrégés à une lettre (abréviation des quatre bases) : A pour adénine G pour guanine C pour cytosine et T pour thymine. Ces bases appartiennent à deux classes principales : puriniques (A et G) et pyrimidiniques (C et T). Leur nombre est égal. C'est cet arrangement distinct d'adénine, de guanine, de thymine et de cytosine qui régule la production de protéines et d'enzymes spécifiques dans une cellule. Ainsi, l'ADN est le génotype de base (identité génétique) d'un organisme, qui à son tour détermine le phénotype (caractéristiques physiques). Par la suite, des profils d'ADN particuliers peuvent être attribués à des organismes particuliers. Le profil ADN constitue ainsi une empreinte unique, propre à chaque individu (voir La structure de la double hélice d'ADN, de http://www.people.virginia.edu/∼rjh9u/dnareq2.html).

Une molécule d'ADN est constituée de deux brins enroulés l'un autour de l'autre en une double hélice. Les deux brins d'ADN vont dans des directions opposées et forment une spirale hélicoïdale, s'enroulant autour d'un axe d'hélice dans une spirale à droite. Les bases des nucléotides individuels sont à l'intérieur de l'hélice, empilées les unes sur les autres comme les marches d'un escalier en colimaçon, les phosphates sont à l'extérieur. Les bases sont réunies par paires, une seule base d'une chaîne étant liée hydrogène à une seule base de l'autre chaîne, de sorte que les deux se trouvent côte à côte. L'une des paires doit être une purine et l'autre une pyrimidine pour que la liaison se produise. Seules des paires de bases spécifiques peuvent se lier entre elles. Ces paires sont l'adénine (purine) avec la thymine (pyrimidine) et la guanine (purine) avec la cytosine (pyrimidine).

Les informations responsables du bon fonctionnement d'une cellule et d'un organisme sont stockées dans l'ADN, comme une recette dans un livre de recettes. L'ADN code les informations déterminant la synthèse des protéines dans un organisme. Dans ce processus de synthèse des protéines, l'ADN utilise une autre molécule polymère (ARN, acide ribonucléique) pour transférer l'information génétique.

15.4.3 SYNTHÈSE DES PROTÉINES ET ARN (ACIDE RIBONUCLÉIQUE)

La séquence des trois nucléotides de la chaîne polymérique de l'ADN code pour un acide aminé de la chaîne polymérique des protéines. Le processus de synthèse des protéines implique la lecture du code génétique stocké dans l'ADN, qui est accomplie en transcrivant l'ADN en une autre molécule appelée ARN, ou acide ribonucléique. L'ARN est similaire à la molécule d'ADN, sauf qu'il contient U (uracyl) comme base dans la structure nucléotidique au lieu de T (timine). L'ARN s'insère à l'intérieur de la molécule d'ADN qui s'est partiellement décompressée pour révéler le code de la protéine (séquence nucléotidique). Il lit le code en faisant correspondre ses molécules avec les molécules d'ADN correspondantes dans un processus appelé transcription. Avec le code exact d'une protéine particulière transcrit dans sa structure, l'ARN passe à une structure cellulaire appelée ribosome, qui est l'endroit où les protéines sont synthétisées en assemblant les acides aminés selon le code contenu dans l'ARN. Davantage d'acides aminés continuent de s'accumuler jusqu'à ce que la fin du code ARN soit atteinte. Il existe des molécules distinctes d'ARN qui contiennent les informations transcrites et celles qui rassemblent et assemblent les acides aminés dans la chaîne protéique. Avec les acides aminés liés entre eux, le résultat final est une protéine.

15.4.4 PCR (RÉACTION EN CHAÎNE DE POLYMÉRASE)

La PCR est une technique puissante, qui amplifie efficacement l'ADN. La technique a été développée relativement récemment (en 1987) par un jeune scientifique nommé Kary Mullis. Le Dr Mullis a reçu peu de temps après le prix Nobel pour ses réalisations et la PCR a été saluée comme une découverte monumentale.

L'utilisation de la PCR nécessite de minuscules quantités d'échantillon d'ADN, ce qui en fait un grand potentiel pour les enquêtes médico-légales, généralement limité par la quantité d'échantillon pouvant être récupérée. La PCR peut produire de multiples copies de segments d'ADN à partir d'une quantité initiale très limitée d'ADN (aussi peu que 50 molécules), permettant par exemple de créer une empreinte ADN à partir d'un seul cheveu. Généralement, la PCR est utilisée pour amplifier une séquence connue d'ADN. Une fois la séquence à amplifier sélectionnée, les amorces (petits extraits d'ADN conservés chez la plupart des espèces) sont conçues et encadrent la séquence d'intérêt qui doit être amplifiée par la réaction PCR. Ainsi, la PCR conduit à l'amplification d'un segment particulier (gène) de l'ADN. Un autre avantage de la PCR est sa simplicité.

Les amorces sont de petits extraits d'ADN homologues à différentes régions d'un gène cible. Pour tout gène d'ADN ciblé, au moins deux amorces sont nécessaires pour délimiter un segment variable d'ADN ciblé à amplifier. Ce segment composé à chaque extrémité par une amorce et amplifié lors de la réaction PCR est appelé amplicon. La sélection d'amorces appropriées représente la clé d'une amplification PCR réussie d'un gène cible. Afin de concevoir de telles amorces, une collection de séquences pour le gène cible provenant de nombreux arrière-plans génétiques différents est nécessaire. Au moins deux régions de séquence conservées doivent exister dans le gène d'intérêt afin de fournir des sites d'amorçage dans les gènes d'un large éventail d'organismes (Kitts, 2001). Les amorces doivent être suffisamment espacées pour obtenir un fragment d'ADN multiplié avec une divergence de séquence suffisante. Dans le même temps, les régions des amorces ne doivent pas être trop éloignées, car les amplicons résultants longs peuvent créer, après digestion avec des enzymes de restriction dans les applications d'empreintes génétiques, des fragments trop volumineux pour être analysés. Une longueur d'amplicon optimale se situe entre 400 et 700 paires de bases (pb) (Kitts, 2001).

Le processus PCR nécessite trois étapes principales qui sont répétées (à chaque fois en doublant l'échantillonnage de la séquence) :

Dénaturation de l'échantillon d'ADN à 94°C en chauffant l'échantillon d'ADN pour démêler et diviser ou décompresser la double hélice d'ADN.

Recuit à 54 °C - les amorces sélectionnées, ainsi que les enzymes primase et polymérase, sont utilisées pour identifier les séquences d'ADN et en produire une copie. Des liaisons ioniques sont constamment formées et rompues entre l'amorce simple brin et la matrice simple brin. Sur le morceau d'ADN double brin, la polymérase se fixe et commence à copier la matrice.

Extension à 72°C - les bases complémentaires de la matrice sont couplées à l'amorce côté 3'. La polymérase ajoute des dNTP's (nucléotides) de 5′ à 3′, en lisant la matrice du côté 3′ à 5′, des bases sont ajoutées en complément de la matrice.

La PCR ne fait pas de distinction entre l'ADN d'organismes vivants ou morts. Tout organisme de l'échantillon peut et sera analysé, étant donné qu'il contient le gène cible (sites amorces). Ceci est d'un grand avantage dans les enquêtes médico-légales car les changements dans les communautés microbiennes induits alors que les contaminants sont en contact avec la communauté microbiologique sont visibles dans les empreintes génétiques (de l'ADN libéré) une fois que la contamination n'est plus présente et que la communauté microbienne vivante est revenue à des conditions normales. . La réaction PCR standard est illustrée sur http://avery.rutgers.edu/WSSP/StudentScholars/project/archives/onions/rapd.html .

15.4.5 EMPREINTE DIGITALE ADN – PRINCIPES ET APPLICATIONS MÉDICALES

15.4.5.1 Principes

The first technique of this type was developed in England by the geneticist Alec Jeffreys in the mid-1980s, who was looking at techniques to screen for hereditary diseases and genetic defects. However, when asked by the local constabulary to investigate a rape case, he successfully identified the rapist from his DNA profile. Within a few years, DNA profiling -based techniques were used by forensic scientists around the world.

Unique DNA sequences are present in all species and are used as biomarkers for the detection of cells from that species. These DNA sequences can most easily be detected using the polymerase chain reaction (PCR) -based DNA fingerprinting methods. All DNA fingerprinting techniques produce a pattern or profile of nucleic acids amplified (by PCR) from a sample and that pattern reflects the microbial community structure from an environment ( Kitts, 2001 ). DNA fingerprinting or profiling comprises any DNA-based techniques that identifies the DNA from a certain individual or group of individuals within a community of organisms. The DNA fingerprints may be used as a tool for determining the identity of a specific DNA sample, or to assess the relatedness between samples. Most DNA fingerprinting methods are highly specific, highly sensitive, and largely independent on the physiological or growth state of the organisms, which make them of particular interest for forensic investigations.

The principle of these techniques consists of screening for certain DNA sequences that are found in some individuals, but not in others, thus visualizing DNA polymorphisms between samples and producing specific DNA fingerprints. Each individual has a DNA profile as unique as a fingerprint. In the case of humans, for instance, over 99% of all nucleotides are identical among all individuals. However, for every 1000 nucleotides inherited there is one site of variation, called polymorphism, in the population. These DNA polymorphisms induce the change in the length of the DNA fragments produced by digestion with restriction enzymes in the course of a fingerprinting technique. So, DNA polymorphism determines the resulting fragments to be of different length and/or sequence. Gel electrophoresis is used to separate and determine the size of the resulted fragments. This is because DNA is a charged molecule, so in an applied electric field it moves toward an electrode. The exact number and size of fragments produced by a specific restriction enzyme digestion varies between individuals. The fragments are arranged in order of length and tagged with radioactive probes emitting x-rays, so when the sample is photographed they show up. This produces the fingerprint represented by a series of black lines corresponding to the DNA sequences present.

Many DNA fingerprinting methods are available. DNA fingerprinting techniques with potential applicability in environmental forensics are listed in Table 15.2 . They differ methodologically using various techniques to look into the polymorphism of certain genes. All these techniques function based on the same principle described earlier, and they all result in producing specific patterns (fingerprints) of microbial communities in the environment.

Table 15.2 . DNA fingerprinting techniques with potential environmental forensics applicability.

PCR amplification of the target gene with fluorescently labeled primers (only used if automated).

Digestion of the amplified fragments with one or more restriction enzymes.

Separation and visualization of terminal-labeled fragments (using automated capillary-based electrophoresis).

Data analysis for peak identification (species identification in some cases).

Rapidity of analyzing large amounts of information due to available automated systems, generating hundreds of reproducible TRF patterns.

A resolution previously unachievable.

The potential to use TRF data to search existing databases for matching sequences and identification of individual organisms in a community profile.

Ability for unprecedented opportunities to correlate the structure and diversity of microbial communities to the physical-chemical parameters of their surroundings.

A tendency of PCR to differentially amplify templates preventing quantification of relative abundance in community. Individual TRF detection is limited by electrophoresis.

Patterns resulted from a single enzyme digest do not result in accurate community characterizations.

Problems with incomplete digestion of amplicons creating artificial peaks in TRF patterns.

A possibility of TRF length to overlap exists.

The complexity of identification of the organisms responsible for a particular element in a profile due to the fact that TRFP are destructively sampled.

DNA digestion with (usually two) restriction enzymes.

Ligation of adapters to the restriction fragments.

PCR amplification of the restricted fragments using primers complementary to each of the adapter sequences selective nucleotides are added in the extension of restriction fragment at 3′ends determining the selectivity and complexity of the amplification.

Separation and visualization of the resulted AFLP fragments.

The large number of polymorphisms that the method generates, being highly sensitive to polymorphism detection at the total-genome level.

No sequence information is required.

The PCR technique is fast.

A high multiplex ratio is possible.

Provides in general enhanced performance in terms of reproducibility, resolution, and time efficiency can be automated.

Homology is perhaps the greatest problem in AFLP analysis. It is often assumed that comigrating bands are homologous. However, there is no a priori reason to accept this.

Bias introduced by dominance, reproducibility problems, the effect of polyploids, as well as practical problems.

The choice of either restriction enzyme or primer can affect the number of AFLP polymorphisms detected.

Amplification of DNA fragments by PCR using a phosphorylated and a nonphosphorylated primer for the target gene (usually rRNA).

Denaturation of the amplified fragments to a single-strand form by exonuclease digestion.

Separation of the denaturated amplified fragments, based on their polymorphisms by polyacrylamide gel-electrophoresis.

Visualization of the separated fragments by silver staining or autoradiography and interpretation of the resulted pattern by hybridization with either DNA fragments or with RNA copies synthesized on each strand as probes.

Polymorphisms at any of several sequence positions may be detectable by this technique, without requiring precise knowledge of the sequence polymorphism.

Potential applicability to all unique sequences, both within genes and nongenic regions if one amplified region does not show polymorphism, one can always move up- or downstream to another.

PCR amplicons are smaller (200–300 bp) and thus easier to amplify and when polymorphisms are detected the amplicons are of optimal size to sequence using an ABI automated sequencer.

The amount of mobility differences is not correlated to the amount of sequence differences thus, the only information that can be gained from SSCP is if PCR amplicons are “identical” or different.

The optimal amplicon size for detection of most point mutations is rather small, involving complicated strategies to deal with this limitation.

Single-stranded DNA mobility is also dependent on temperature and pH.

The fragment length may also affect SSCP analysis. For optimal results, DNA fragment size should fall within the range of 150 to 300 bp.

Amplification of DNA fragments by PCR using primers for the target gene (usually rRNA).

Incomplete denaturation of the amplified fragments (using two main modalities as described before corresponding to DGGE and TGGE, respectively) and separation (based on fragment polymorphism) in gels containing a linear gradient of DNA denaturing agent.

Visualization of the separated fragments.

Almost all single-base substitutions can be detected in longer amplicons it is an ideal technique to search for rare variant alleles among individuals within a population.

Applies best for finding intraspecific variation within one genus (insects) or family (vertebrates) of organisms.

The resulting electrophoresis bands may be recovered from the gel for further analysis such as sequencing the specific DNA fragments of interest.

DGGE requires that one of the PCR primers include a “GC-clamp” (about 40 bp of G's and C's) and additional specialized equipment, which is expensive.

DGGE does not scale up easily.

DGGE requires the determination of optimal gradient conditions before screening individuals for variation.

Cultivation of the targeted microorganisms → microbial isolates.

DNA extraction from microbial isolates.

DNA amplification by PCR, using 15S rRNA universal primers.

Digestion of amplified DNA fragments by endonuclease restriction with one or more restriction enzymes (selection of restriction enzymes should be on the basis of simulated digests of the complete 15S rRNA gene sequences of chosen reference strains).

Separation and visualization of the digested DNA fragments based on their polymorphisms, by agarose gel electrophoresis (gels stained with ethidium bromide).

DNA was visualized by transillumination with UV light after the gels were stained with ethidium bromide.

The automated culture technique, in combination with ARDRA provides accurate, practically applicable, and wide range identification of mycobacterial species.

The existing identification library covers most species and can be updated easily when new species are studied or described.

Unsuitable for typing analysis, as it overlooks intraspecific differences.

Amplification of DNA fragments by PCR using randomly chosen primers (about 10 bp) at low annealing temperatures → amplification at multiple loci.

Separation of the amplified fragments based on their polymorphisms by agarose gel electrophoresis (two-dimensional gel).

Visualization of the separated fragments. Possible cloning and sequencing of the DNA band of interest → develop longer specific PCR primer pairs targeting reproducible amplification and detection of the differences.

The relative speed (a complete analysis in one day) and ease with which results can be obtained.

Does not include expensive techniques such as cloning and sequencing.

More rapid and easier to perform as compared to ribotyping and pulsed-field gel electrophoresis.

Useful to analyze large amounts of strain collections from a monitoring standpoint.

Cloning of RAPD fragments can be rapidly accomplished and cloned. RAPD loci will not contain repetitive sequences.

Lacks specificity, due to low annealing temperatures and easier reaction conditions. A polymorphism detected between one pair of strains may not translate into use for another pair of strains.

On average, only half of the RAPD polymorphisms detected between two strains would be mapped.

Most of RAPD markers are dominant and this makes it difficult to use the data in population genetics studies. RAPD is sometimes not reproducible.

Digestion of DNA by endonuclease restriction.

Separation of the resulted fragments by agarose gel- electrophoresis.

Transference of the fragments to a nylon filter by Southern blotting.

Hybridization of fragments to a locus specific radio labeled DNA probe.

Visualization of the polymorphisms by autoradiography.

Higher degree of polymorphism and the possibility of obtaining an infinite number of probes, evenly distributed over the whole genome.

High stability and reproducibility, giving constant results over time, and location.

Random distribution throughout the genome.

Band profiles interpretation in terms of loci and alleles. Codominance of alleles.

Producing of semidominant markers, allowing determination of homozygosity, or heterozygosity.

The results do not specifically indicate the chance of a match between two organisms.

The process is very expensive, laborious, and technically demanding.

Large quantities of purified, high molecular weight DNA required (5–10 μg).

Additional development costs in case suitable probes are unavailable.

Not amenable to automation. Long methodology before results are gained.

Many probes not available depending on species.

Too many polymorphisms may be present for a short probe.

Cultivation of targeted organism (optional step).

Digestion of extracted DNA with restriction enzymes.

Analysis of the digested DNA fragments by Southern blotting or PCR followed by an electrophoresis gel.

Discriminant analysis of the resulted banding patterns for strain identification.

Availability of an automated ribotyping system, the DuPont Qualicon RiboPrinter, which provides highly reproducible and standardized ribotype data.

Uses ribosomal DNA, which is very stable in a population of bacteria, providing a limit to genotype variability that may overcome geographical restrictions.

Routinely analyses inexpensive ($375–600 per sample).

A lack of standardization.

Discrimination is dependent upon the restriction enzyme and the probe used.

A need for highly skilled technical staff.

Requires access to specialized equipment.

DNA fingerprinting has been increasingly applied to determine the ancestry of plants, animals, and other microorganisms. Another application relates to tracking genomic mutations. Molecular diagnosis of complex inherited disorders, population screening of genetic diseases, studies of the genetic basis of variable drug response (pharmacogenetics), as well as discovery and investigation of new drug targets (pharmacogenomics) involving screening for mutations in multiple DNA samples are only a few examples of the DNA fingerprinting application pool. The primary applications of the DNA fingerprinting techniques described before are listed in Table 15.3 .

Table 15.3 . Forensic and other applications of DNA fingerprinting techniques.

Ability to characterize the microbial communities from different environments, allowing the determination of spatial and temporal shifts in community structures— potential application in environmental forensics.

Used in criminal forensics to link different soil samples (from crime scene and sole of a shoe or clothing).

Able to characterize functional diversity in bacterial communities, including reports on the functional diversity of important processes such as nitrification, nitrogen fixation, denitrification, and mercury resistance investigated in a large variety of environments from marine sediments to termite intestines.

Studies focused on Eubacteriaceae ( Brunk et al., 1996 Liu et al., 1998 Flynn et al., 2000 Franklin et al., 2001 ).

Characterization and comparison of subsurface and surface soil bacterial communities in California grassland ( LaMontagne et al., 2003 ).

Discerning bacterial population changes in feces during feeding rats with L. acidophilus NCFM ( Kaplan et al., 2001 ).

Characterization of the debrominating methanogenic consortia.

Characterization and comparison of bacterial communities in deer fecal pellets, petroleum hydrocarbon-contaminated sands, and pristine sand ( Clement et al., 1998 ).

Observation of taxonomic diversity in other microbial groups, such as archaebacterial communities in soil and fish intestines ( van der Maarel et al., 1998 Fey and Conrad, 2000 Leuders and Friedrich, 2000 ).

Revealing Nitrosospira-like organisms as one of the major contributors to ammonia oxidation in a full-scale aerated-anoxic Orbal reactor ( Park et al., 2002 ).

Fungal community studies—to point alterations in soil micro- fungal community structure across a transect between a seminatural upland grassland and an agriculturally improved enclosure ( Brodie et al., 2003 ).

Establishing the source of bacteria isolated from amber and age-dating amber ( Cano and Borucki, 1995 Greenblatt et al., 1998 ).

Investigation of bacterial community structure and dynamics during a bioremediation experiment in a land treatment unit (LTU) established at a site contaminated with highly weathered petroleum hydrocarbons at the Guadelupe Oil Field (central California Coast) ( Kaplan and Kitts, 2004 ).

Used for “basic” diversity and genetic variation studies.

Reliable and efficient method for detecting molecular markers.

May be used for defined applications such as polymorphism screening, QTL analysis, or genetic mapping.

An efficient and reliable technique for evolutionary studies.

Applications in paternity analyses.

Investigation of the genetic variation of Calycophyllum spruceanum (Rubiaceae), a fast growing pioneer tree of the Amazon Basin ( Russell et al., 1999 ).

Investigation of introgression and hybridization ( Beismann et al., 1997 Rieseberg et al., 1999 ).

Generation of a large number of markers that are linked to target genes ( Xu et al., 1999 ).

AFLP markers have been used at the individual level for application in paternity analyses and gene-flow investigations ( Krauss and Peakall, 1998 Krauss, 1999 ).

AFLP markers are used in phylogenetic analyses ( Heun et al., 1997 Kardolus et al., 1998 Aggarwal et al., 1999 Mace et al., 1999 ).

Frequently applied to mapping studies ( Bradshaw et al., 1998 Zhu et al., 1998 Xu et al., 1999 ).

Gene-flow experiments and for plant variety registration ( Law et al., 1998 ).

A powerful tool for the analysis of microbial community diversity in environment, with a large pool of potential applications in microbial ecology, environmental biotechnology, and environmental forensics.

Can detect DNA polymorphisms and mutations at multiple places in DNA fragments.

Can be used in cloning studies.

Analysis of microbial community diversity in environmental samples ( Wagner, 2002 ).

Sensitive in determining genetic variation ( Sunnucks et al., 2000 ).

Effective and rapid search for point mutations or polymorphisms in mitochondrial DNA ( Sarkar et al., 1992 Suomalainen et al., 1992 ).

The analysis of polymorphisms at single loci, especially when used for medical diagnoses ( Sunnucks et al., 2000 ).

Identification and cloning of nine aquaporin genes in cucumber ( Xie et al., 2002 ).

Popular tool in microbial ecology.

Ideal for analyzing complex bacterial communities.

Able to detect mutations and in general genetic variations.

DGGE is highly efficient for detection of DNA sequence differences.

DGGE is a convenient tool for analyzing community shifts that involves only a small region (∼200–300 bp) of the 15S rRNA gene.

Monitoring microbial communities with potential in Environmental Forensics studies.

Detection of actinomycetes in the environment, monitoring actinomycete community changes in potato rhizosphere, and investigation of actinomycete diversity in different soils ( Heuer et al., 1997 ).

Monitoring microbial communities in metal contaminated environments ( Petrisor et al., 2006 ).

TGGE technique was used as a tool for detecting various conformational modifications of plasmid DNAs (Viglasky et al., 2000).

Successful in species differentiation but not strain differentiation as it relies on the conserved nature of rDNA.

Able to evaluate microbial community structure changes—potential for environmental forensics applications.

Rapid and unambiguous species differentiation within the genus Acinetobacter ( Seifert et al., 1997 ).

Reliable and rapid method for identifying Lactobacillus species from intestinal and vaginal microflora at species and subspecies level ( Ventura et al., 2000 ).

Detection and identification of all mycobacterial species at once, instead of attempting direct PCR-based detection from clinical samples of M. tuberculosis.

Characterization of thermophilic bacteria associated with the subsurface soil environment in Northern Ireland ( Rahman et al., 2003 ).

Detection of differences in activated sludge bacterial communities fed on domestic or industrial wastewater, and subjected to different operational conditions ( Gich et al., 2000 ).

Typically used for genetic mapping and studies of population genetic structure.

Able to produce a biochemical fingerprint of a particular species.

Capable of screening the differences in DNA sequences of two species of plants.

Rarely used to infer phylogeny, as it is difficult to know if bands of the same size are homologous across species.

Applied in criminal forensic studies and potential for environmental forensics.

Comparison of genetic material from four females and four unknown male trees of Egyptian date palm ( Soliman et al., 2003 ).

Determining the identity and relationships of old roses ( Manners et al., 2004 ).

Determining whether variations exist among bovine strains isolated from a localized geographic area (watershed of the Red River) ( Shianna et al., 1998 ).

Testing for genetic differentiation in fish populations within Rio Dolce basin of southeastern Brazil ( Dergam et al., 2002 ).

Correlation of RAPD profile-based measures of genetic diversity in crayfish with environmental impacts ( Kranee et al., 1999) .

Used for quick identification of arthropods and support classical morphological and medico-legal analysis of maggots on a human corpse ( Benecke, 1998 ).

Able to identify the origins of a particular species, with the aim of mapping its evolution.

Able to characterize a large number of individuals, given preexisting knowledge of the sequence variation.

Using the sequence data of three species of nematodes (from a particular genus) to determine a simple way to diagnose the species based on restriction digestion ( Petrisor et al., 2006 ).

Survey of a large sample of individual nematodes (even life history stages that might not be morphologically distinguishable) and enumerate the species composition of the sample. Gased Ribotyping) ( Oliveira and Ramos, 2002 )

Able to be used in subtyping of foodborne pathogens and of microorganisms important for fermentation and food spoilage.

Excellent tool for indicating major sources of biological pollutants.

Effective tool for bacterial source tracking (BST), e.g., tracking the source of fecal pollution in water.

Effective tool for discriminating between human vs. nonhuman forms of Escherichia coli.

Tracking E. coli that are regrowing and proliferating in a watershed.

Resolving a “true-life” water quality and management problem consisting in tracking sources of fecal pollution in a watershed in South Carolina ( Scott et al., 2004 ).

Differentiation between human and nonhuman sources of fecal pollution (generally E. coli) in water ( Parveen et al., 1999 ).

Identification of individual host sources of fecal Escherichia coli and distinguishing between fecal E. coli of human and nonhuman origin ( Carson et al., 2001 ).

Differentiation of E. coli between human and nonhuman sources when applied to organisms isolated from a large geographic region ( Scott et al., 2003 ).

Automated ribotyping and pulsed-field gel electrophoresis were used for the rapid identification of multidrug-resistant Salmonella serotype Newport ( Fontana et al., 2003 ).

15.4.5.2 Forensic Applications

Microoganisms respond to contamination, and such response may be recorded by DNA fingerprinting methods. The response to heavy metal contamination was well studied and could be the basis for forensic applications of microorganisms ( Petrisor et al., 2006 ). Biological processes are particularly sensitive to soil heavy metal loadings ( Kelly and Tate, 1998 ). The negative impact of heavy metals results from their toxicity to biological processes. The population size of rhizobia has been found to decrease as a result of metal contamination. ( Brookes et al., 1986 Lorenz et al., 1992 Chaudri et al., 1993 Dahlin et al., 1997 ). Several studies that used plate count techniques have demonstrated an increase in gram-negative bacteria ( Doelman and Haanstra, 1979 Barkay et al., 1985 ) and a shift in the composition of fungal species toward a more metal-tolerant community in metal-contaminated soils ( Jordan and Lechevalier, 1975 ). Therefore, it is postulated that the soil microbial community could serve as an indicator of losses in soil quality due to heavy metal contamination ( Kelly and Tate, 1998 ). Such indications may provide the basis for developing innovative forensic techniques for tracking metal contamination passage through the environment and identifying the source of contamination.

From different DNA fingerprinting methods presented, probably Terminal Restriction Fragment Length Polymorphism (TRFLP) holds the greatest potential for application in environmental forensics studies. Many laboratories routinely use TRFL patterns to characterize the microbial communities from different environments, allowing the determination of spatial and temporal shifts in community structure. Such shifts may be used in forensic studies as evidence for the presence of certain contaminants through an environment, or to track their past passage. Also, the toxicity of contaminants to bacterial communities, coupled with their use as nutrient sources (such as oil that may be used by bacteria as carbon source) are likely selective pressures on bacterial community composition and diversity. Thus, the characterization of such microbial diversity and its response to contamination through simple automated techniques such as TRFLP could help predict the fate of contaminants in the environment.

TRFLP applications in criminal forensics generally based on significant differences between DNA profiles of different soils are well established. Thus, by setting up mock crime scenarios, Horswell et al. (2002) established that bacterial community DNA profiling can be used to compare soil samples of the size likely to be encountered in real forensic situations. In the first scenario, the shoe print from a hypothetical crime scene was compared with soil from the scene, and in a second scenario, the jeans were impregnated (knee level) with soil from the scene. A simple comparison index, the Sorenson's Index, was used to compare profiles, in which a value of 1 indicates identical profiles, and 0 indicates that the profiles share no common fragment sizes (peaks). The microbial community profiles for soil from the shoe print and soil collected from the shoe itself produced very similar electropherograms and a very high (> 0.9) similarity index. In contrast, there were major differences between the profiles of the reference soils and those of the crime scene and the suspect's shoe, with a similarity index of <0.6. When the soil sample collected eight months later (A3) was compared with the microbial community DNA profile of soil collected at the time of original sampling (A2), differences were observed, but overall, there was a considerable similarity between the profiles and a similarity index of 0.70 was obtained. In the second scenario, the microbial community profiles of the soil from the left knee impression in the soil and the soil extracted from the left knee of the jeans were very similar with a Sorenson's index of 0.82.

Several environmental studies have successfully used the TRFLP method to study and monitor natural remediation processes. TRFLP techniques were used to investigate bacterial community structure and dynamics during a bioremediation experiment in a land treatment unit (LTU) established at a site contaminated with highly weathered petroleum hydrocarbons (C10-C32 range) at the Guadalupe Oil Field (central California Coast) ( Kaplan and Kitts, 2004 ). The different shifts in the bacterial community structure were linked to the degradation rate of petroleum hydrocarbons. Thus the TRF patterns revealed a series of sample clusters describing bacterial succession during the study, and the data suggested that specific polytypes of bacteria are associated with different phases of petroleum degradation in the land treatment unit. Such findings supported the possible use of TRFP technique to monitor, better understand, and improve the bioremedial treatment. On the other hand, the sensitive insight into microbial community generated may allow association with different contaminants and sources in a forensic investigation.

The net effect of naturally occurring oil on marine sediment bacterial communities was also evaluated at the Guadalupe Oil Field. Sediment piston-cores were collected at an active marine hydrocarbon seep located in the Coal Oil Point area at the depth of 66 m in the Santa Barbara Channel, and community profiles were determined by TRFLP of 15S rDNA genes PCR-amplified using eubacterial primers. TRFLPs obtained by restriction with Hha I suggested that the bacterial communities collected in the center of the seep are distinct from those located 10 meters outside the area of active hydrocarbon release. Additionally, diversity indices calculated from the number of peaks were the lowest in surface sediments (0–2 mm) collected in the center of the seep. These consistent differences in surface sediment communities suggested a negative effect of hydrocarbons on bacterial diversity and the existence of a unique bacterial community within hydrocarbon seep fields.

Amplified Fragment Length Polymorphism (AFLP) is generally used for “basic” diversity and genetic variation studies. The method is also reliable and efficient for detecting molecular markers. AFLP markers have been used at the level of the individual, for application in paternity analyses and gene-flow investigations for example, Krauss and Peakall (1998) analyzed paternity in natural populations of Persoonia mollis (Proteaceae), a long-lived fire-sensitive shrub from southern Australia. Another application in paternity analysis was described by Krauss (1999) .

Due to its methodological simplicity and sensitivity, Single-Stranded Conformation Polymorphism Analysis (SSCP) is a powerful tool for the analysis of microbial communities with a large pool of potential applications in microbial ecology and environmental biotechnology, as well as in environmental forensics. SSCP analysis offers an inexpensive, convenient, and sensitive method for determining genetic variation ( Sunnucks et al., 2000 ). The method can be applied for the cultivation and independent analysis of microbial community diversity in environmental samples, based on PCR-amplified small subunit (SSU) rRNA gene sequences from directly extracted DNA. Under optimal conditions, approximately 80 to 90% of the potential base exchanges are detectable by SSCP ( Wagner, 2002 ).

Analysis of PCR amplified 15S rDNA fragments from environmental samples by denaturing gradients of chemicals or heat within polyacrylamide gels is a popular tool in microbial ecology ( Bruggemann et al., 2000 ). These techniques are ideal for analyzing complex bacterial communities. A thorough analysis of microbial communities on several levels ranging from the community structure of dominant populations using conserved sequence primers, to phylogenetic sequence analysis of single bands from individual community members is generated. Similar to SSCP, Denaturing/Thermal Gradient Gel Electrophoresis (D/TGGE) techniques are used successfully to detect mutations and in general genetic variations, and hold great potential for environmental forensics use by monitoring microbial communities in contaminated environments. Thus, TGGE was used effectively to monitor bacterial communities in soil ( http://risk.kan.ynu.ac.jp/rmg/WS99PDF/99ITOH.PDF ). These methods monitored actinomycete community changes in potato rhizosphere and investigated actinomycete diversity in different soils. The use of DGGE and TGGE techniques in monitoring microbial communities in metal-contaminated environments is reviewed in detail by Petrisor et al. (2006) .

The assessment of microbial community structure changes by amplified ribosomal DNA restriction analysis was also successfully performed and may be the basis for developing innovative forensic techniques tracking the path of contaminants in environment. Gich et al. (2000) evaluated the suitability of this method for detecting and monitoring changes in activated sludge systems. The method was applied efficiently to detect differences in activated sludge bacterial communities fed on domestic or industrial wastewater, and subjected to different operational conditions. Rahman et al. (2003) used molecular and culture-based methods to characterize thermophilic bacteria associated with the subsurface soil environment in Northern Ireland. The bacteria were screened by amplified ribosomal DNA restriction analysis prior to 15S rRNA gene sequencing.

The Randomly Applied Polymorphic DNA (RAPD) method also holds potential for environmental forensics applications. This method was already applied in criminal forensic studies. Benecke (1998) used RAPD to permit quick identification of arthropods and support classical morphological and medico-legal analysis of maggots on a human corpse. It was determined that maggots found on the inside of a body bag were identical with maggots found on the outside of the bag, and with the pupae found on the floor under the corpse.

Ribotyping represents a molecular subtyping method with widespread applications in bacterial source tracking. Ribotyping was shown to be an effective tool for bacterial source tracking (BST) and is an excellent tool for indicating major sources of biological pollutants since most BST projects only need to determine broad groups of contamination. In the context of BST investigations, ribotyping is an effective tool for discriminating between human and nonhuman forms of Escherichia coli. It has also been shown effective in distinguishing E. coli from major animal groups. The statistical probabilities for distinguishing the major animal groups are greatly enhanced when comparison samples are submitted.

A broad range of forensic applications of ribotyping are related to tracking the source of fecal pollution in water. Fecal pollution affects the quality and safety of water systems used for drinking, recreation, and in the harvesting of seafood. Fecal coliform can originate from numerous sources, including sewage treatment plant discharges, failing septic systems, agricultural and urban runoff, improper disposal of wastes from boats, and wildlife. Ribotyping is now commercially used to track E. coli that are regrowing and proliferating in watersheds ( Scott et al., 2004 ). The ability of ribotyping to differentiate between human and nonhuman sources of fecal pollution (generally E. coli) in water was also demonstrated in the study of Parveen et al. (1999) , who applied ribotyping on a total of 238 E. coli isolates from human sources (HS) and nonhuman sources (NHS) collected from Apalachicola National Estuarine Research Reserve, from associated sewage plants, and directly from animals. The analysis of ribotyping profiles showed that 97% of the HS isolates and 100% of the animal fecal isolates were correctly classified.

Carson et al. (2001) also used ribotyping to successfully identify individual host sources of fecal E. coli, and distinguish between fecal E. coli of human and nonhuman origin, such as fecal E. coli ribotype patterns from humans and seven nonhuman hosts. Such an application could assist in formulation of pollution reduction plans. In another study also related to sources of fecal pollution of water, Scott et al. (2003) applied ribotyping analysis to E. coli isolates obtained from humans, beef cattle, dairy cattle, swine, and poultry from different locations in Florida. The study indicated that using a single restriction enzyme (HindIII) ribotyping cannot differentiate E. coli isolates from different animal species. A possible conclusion of the study was that a combination of geographic and environmental variation exert a significant role in affecting the ability of ribotyping for identification of sources of E. coli in the environment. The study indicated and confirmed, however, that ribotyping procedure can be used effectively to differentiate E. coli between human and nonhuman sources when applied to organisms isolated from a large geographic region.

A project conducted at the University of Georgia, Athens, ( http://alpha.marsci.uga.edu/coastalcouncil/hartel_ribotyping.htm ) used ribotyping to determine the host origin of fecal contamination in Georgia's coastal waters. As a result of the project, four hundred Enterococcus faecalis ribotypes (200 each from birds and humans) were also added to this host origin database.

Routine microbial source tracking analysis (ribotyping) is commercially available at relatively low costs. Such methods and applications include:

DNA analysis of presence or absence of E. faecium

DNA analysis and quantification of E. faecium from human sources

DNA analysis of presence or absence Bacteroides from human, DNA analysis of presence or absence human fecal viruses (i.e., enteroviruses)

DNA analysis of presence or absence of E. coli from cattle sources

DNA analysis of presence or absence of Bacteroides from cattle sources

DNA analysis of presence or absence of cattle fecal viruses (i.e., bovine enteroviruses)

DNA ribotyping (i.e., DNA fingerprinting) analysis of five or more E. coli isolates per sample

DNA comparative analysis of the E. coli isolates from fecal and water or sediment sources