Suite

Répertorier tous les jeux de classes d'entités et classes de plusieurs géodatabases dans un fichier CSV ?

Répertorier tous les jeux de classes d'entités et classes de plusieurs géodatabases dans un fichier CSV ?


J'ai un dossier contenant plusieurs géodatabases et j'appelle ce dossier "Multiplegdb". Il y a 3 géodatabases dans un dossier qui sont les suivantes :

  • ABC.gdb

  • UVW.gdb

  • XYZ.gdb

Chaque géodatabase possède plusieurs « jeu de données d'entités » et chaque « jeu de données d'entités » a plusieurs « classes d'entités ».

Ma tâche:

Je voudrais répertorier tous les jeux de données d'entités et classes d'entités de chaque géodatabase dans un dossier au format CSV. Je souhaite également obtenir les informations de métadonnées de chaque classe d'entités dans un fichier CSV. Le format du fichier CSV sera le suivant : nom GDB, nom du jeu de données d'entités, nom des classes d'entités, résumé, descriptions, crédits, date de modification, chemin du fichier.


Si j'entreprenais cette tâche, je la diviserais d'abord en deux « moitiés » :

  1. Lecture des géodatabases et impression des résultats
  2. Écriture des résultats au format CSV

Je pense que cette question devrait se concentrer uniquement sur le premier d'entre eux, et dans ce cadre, commencez par écrire un extrait de code qui utilise ListWorkspaces, ListFeatureDatasets et ListFeatureClasses pour imprimer le nom de chaque classe d'entités, dans chaque jeu de classes d'entités, dans chaque géodatabase, dans un seul dossier.

Une fois que cela fonctionne, si vos géodatabases ne sont pas toutes dans un seul dossier, commencez à écrire un extrait de code qui utilise arcpy.da.Walk pour parcourir votre structure de dossiers à la recherche de celles-ci.

L'écriture des résultats au format CSV est plus une question StackOverflow (Python) que GIS This Site (ArcPy), donc bien qu'il puisse y avoir des extraits ici pour le faire, si vous ne les trouvez pas, alors l'endroit à demander est StackOverflow.


Présentation de l'utilisation des jeux de classes d'entités

Un jeu de classes d'entités est un ensemble de classes d'entités associées qui partagent un système de coordonnées commun. Les jeux de données d'entités sont utilisés pour intégrer spatialement ou thématiquement des classes d'entités associées. Leur objectif principal est d'organiser des classes d'entités associées dans un jeu de données commun pour créer une topologie, un jeu de données réseau, un jeu de données de MNT ou un réseau géométrique.

Utilisation de jeux de classes d'entités

  • Pour ajouter une topologie
  • Pour ajouter un jeu de données réseau
  • Pour ajouter un réseau géométrique
  • Pour ajouter un jeu de données de MNT
  • Pour ajouter un atelier parcellaire

Il existe des situations supplémentaires dans lesquelles les utilisateurs appliquent des jeux de classes d'entités dans leurs géodatabases :

    Pour organiser des classes d'entités liées par thème

Parfois, les utilisateurs organisent une collection de classes d'entités pour un thème commun dans un seul jeu de classes d'entités. Par exemple, les utilisateurs peuvent disposer d'un jeu de données d'entités pour l'eau contenant des points hydroélectriques, des lignes hydroélectriques et des polygones hydroélectriques.

Parfois, les utilisateurs organisent les privilèges d'accès aux données à l'aide de jeux de données d'entités. Toutes les classes d'entités contenues dans un jeu de classes d'entités ont les mêmes privilèges d'accès. Par exemple, les utilisateurs peuvent avoir besoin d'utiliser plusieurs jeux de classes d'entités pour segmenter une série de classes d'entités associées afin de tenir compte des différents privilèges d'accès entre les utilisateurs. Chaque groupe dispose d'un accès en édition à l'un des jeux de classes d'entités et à ses classes d'entités, mais aucun accès en édition pour les autres.

Dans certaines situations de partage de données, les organisations collaboratrices peuvent convenir d'un schéma de partage de données pour partager des ensembles de données avec d'autres utilisateurs. Dans ces situations, les utilisateurs peuvent utiliser des jeux de classes d'entités en tant que dossiers pour organiser des collections de classes d'entités simples à partager avec d'autres.


Répertorier tous les jeux de classes d'entités et classes de plusieurs géodatabases dans un fichier CSV ? - Systèmes d'information géographique

Création de jeux de données d'entités et édition de vecteurs

La plupart des projets que vous rencontrerez incluront des données déjà développées. Cependant, vous devrez parfois créer de nouveaux ensembles de données ou modifier des ensembles de données existants. Cette section traite des modifications apportées aux entités dans les bases de données de coordonnées utilisées dans ArcGIS.

Lorsque vous créez ou modifiez des jeux de données d'entités (vecteurs) dans ArcGIS, vous utilisez des fichiers de formes. Les fichiers de formes sont le jeu de données natif préféré pour ArcGIS. Les fichiers de formes sont entièrement modifiables dans ArcGIS, ce qui signifie qu'ils peuvent être modifiés à la fois dans leurs entités spatiales et attributaires. De plus, toutes les autres sources de données vectorielles valides dans les projets ArcGIS peuvent être facilement converties en fichiers de formes ou en classes d'entités de géodatabase, auquel cas leurs entités peuvent être modifiées.

La méthode "héritée" la plus courante pour introduire des données dans un SIG a été l'utilisation de tablettes numériques.

Les tablettes numériques sont utilisées depuis les premiers jours du SIG, afin de capturer des données cartographiques de coordonnées. Un numériseur est une table spéciale encastrée sous la surface avec une série de fils. Les fils sont disposés en rangées horizontales et en colonnes verticales étroitement espacées. Ces fils reçoivent des signaux du curseur du numériseur (qui se comporte comme une souris) et permettent de tracer et d'enregistrer les entités cartographiques en tant que données de coordonnées. Un logiciel SIG est utilisé pour transformer les valeurs de coordonnées de la table en valeurs de coordonnées réelles.

En règle générale, une carte est enregistrée sur la tablette et enregistrée avec des points de localisation connus ("quottics"). Ensuite, les caractéristiques de la carte sont tracées lorsque le logiciel "écoute" le port de communication auquel le numériseur est connecté. Des touches spéciales sur le curseur sont utilisées pour contrôler la fonctionnalité du numériseur.

La plupart des applications logicielles qui ont été développées en tant que solutions SIG complètes ont inclus la prise en charge de la numérisation sur tablette et à l'écran ("tête haute").

ArcGIS prend en charge la numérisation dans les deux modes, à quelques exceptions près. Les fichiers de formes et les classes d'entités de géodatabase sont le seul type de fichiers de source de données spatiales pouvant être modifiés par numérisation. La numérisation tête haute des fichiers de formes et des classes d'entités de géodatabase est entièrement prise en charge. La numérisation de la tablette n'est prise en charge que sur les systèmes MS-Windows et n'est prise en charge que si les pilotes Windows sont installés pour la marque de la tablette de numérisation qui est connectée à la machine. En raison des contraintes de temps et du manque de tablettes à numériser en nombre suffisant, nous ne couvrirons pas la numérisation des tablettes dans ce cours. Cependant, les fichiers d'aide pour la numérisation des tablettes dans ArcGIS sont clairs et complets.

Utilisation des fichiers de formes et des géodatabases amp

Fichiers de formes sont le format de données vectorielles ArcGIS le plus facile à gérer. Un seul fichier de formes représente un groupe de points, de lignes ou de polygones. Alors que d'autres sources de données (par exemple, les couvertures ArcInfo, les dessins CAO) peuvent être composées de plusieurs types d'entités, les fichiers de formes sont composés de seulement points, lignes, ou alors polygones.

Le shapefile est en fait une collection de fichiers, plutôt qu'un seul fichier. Un seul shapefile est composé d'au moins 3 fichiers (où dans cet exemple, le nom du shapefile est routes).

  • roads.shp : géométrie de l'entité (forme et emplacement)
  • roads.shx : index de géométrie d'entité
  • roads.dbf : table attributaire des entités

En plus des 3 fichiers de base, il peut également y avoir d'autres fichiers :

  • roads.sbn : index spatial des entités
  • roads.sbx : index spatial des entités
  • roads.ain : index d'attributs d'entités
  • roads.aix : index des attributs d'entités
  • roads.prj : projection et coordonnées des données

Les fichiers d'index sont utilisés pour croiser des caractéristiques ou des attributs spatiaux et accélérer les requêtes, le traitement et l'affichage.

Les fichiers de formes sont utiles dans ArcGIS car ils

  • dessiner rapidement (par rapport à d'autres sources de données d'entités)
  • peut être créé dans l'application
  • peut être entièrement modifié dans l'application
  • peut être créé à partir d'autres sources de données vectorielles
  • peut être déplacé à travers la structure du fichier facilement et sans corruption

Géodatabases sont des types spéciaux de fichiers de base de données qui contiennent une géométrie d'entité, des tables attributaires et d'autres tables stockant des règles et des relations entre des jeux de classes d'entités. Les géodatabases peuvent stocker plusieurs jeux de classes d'entités différents dans le même fichier de base de données, ce qui fait de la géodatabase une méthode pratique et puissante de stockage de données. En outre, il est possible de stocker des relations, telles qu'une topologie multicouche dans la géodatabase. Le modèle de données de base pour les couches d'entités (point, ligne, polygone) est utilisé dans le modèle de géodatabase. Les données vectorielles stockées dans les géodatabases sont appelées classes d'entités ou alors jeux de classes d'entités (qui sont des groupes de classes d'entités individuelles). Les rasters peuvent également être stockés dans des géodatabases.

Dans ArcGIS, il existe deux types de formats de fichier de géodatabase, le géodatabase personnelle, qui est stocké sous forme de fichier MDB Microsoft Access, et le géodatabase fichier, qui est stocké dans un format de fichier ESRI spécial.

Création d'un nouveau calque de forme

En plus de convertir des fichiers de formes ou des classes d'entités de géodatabase à partir d'autres sources de données d'entités, il est également possible de créer des fichiers de formes ou des classes d'entités à partir de zéro, en utilisant d'autres couches de données d'entités ou images uniquement comme guide visuel pour la référence de position. Pour le reste de ce cours, les fichiers de formes et les classes d'entités seront simplement appelés "classes d'entités".

Lorsqu'une nouvelle classe d'entités est créée, l'utilisateur doit décider si la classe d'entités représentera des entités ponctuelles, linéaires ou surfaciques. Vous devez déterminer à l'avance quel sera le type d'entité pour votre jeu de données. La classe d'entités doit également recevoir un nom et une place dans le système de fichiers.

La classe d'entités est ensuite ajoutée à la carte actuelle et est ouverte pour modification.

Les coordonnées des nouvelles entités sont déterminées par l'étendue du bloc de données auquel les entités sont ajoutées et par le système de coordonnées du nouveau jeu de données. Si vous utilisez un nouveau bloc de données sans autres couches, les entités que vous ajoutez seront placées près de l'origine du bloc de données (par défaut, l'étendue d'un nouveau bloc de données est d'environ [(0,0), (1,1)]).

Ici, une nouvelle classe d'entités points est créée :

La nouvelle couche est prête à être modifiée, mais ne contient ni entités ni attributs tabulaires. Ceci est similaire à la création d'une nouvelle feuille de calcul ou d'un document de traitement de texte lorsqu'il vient d'être créé, il est vide. Afin d'ajouter des entités au nouveau fichier de formes, il doit être ajouté à un document ArcMap et ouvert pour modification.

Ajout de fonctionnalités de calque de forme

Une fois la nouvelle couche ajoutée à la carte et ouverte pour modification, vous pouvez ajouter des entités. La barre d'outils Editeur dans ArcMap doit être activée. Dans la barre d'outils de l'éditeur, il existe un certain nombre d'outils différents pour créer et éditer des entités. Il existe également un certain nombre de tâches d'édition différentes parmi lesquelles choisir. Nous couvrirons les outils et tâches les plus courants, mais nous n'aurons pas le temps de couvrir tous les outils et tâches d'édition.

Les différents outils d'édition se trouvent dans une liste déroulante d'icônes, chacune remplissant une fonction d'édition différente. Selon l'état de l'application, un ou plusieurs outils peuvent être indisponibles (grisés). La liste des outils et de leurs fonctions est listée ici :

croquis : dessin de base

milieu : créer un point au milieu d'une ligne tracée

distance-distance : créer un point à distance connue de 2 autres emplacements
intersection : créer un point à l'intersection de deux vecteurs existants
arc de point d'extrémité : créer une section circulaire avec des points d'extrémité définis
direction-distance: créer un point à une distance et une direction connues à partir d'un autre emplacement
arc : créez une section circulaire en définissant le début, le milieu et la fin de la courbe
tangente : prolonger un segment avec une ligne tangente au segment existant
trace : créer une nouvelle entité qui trace les entités existantes à partir de la même couche ou d'une autre couche

Lorsqu'une nouvelle classe d'entités est créée, une table attributaire "bare bones" est également créée. Cette table ne contiendra initialement qu'un seul enregistrement pour chaque caractéristique, et deux champs, FID, Façonner et Identifiant. Dans le tableau suivant, un point a été créé et la table attributaire est affichée

L'utilisateur peut ajouter des champs à la table attributaire (ou à n'importe quelle table du projet, d'ailleurs). Des champs sont ajoutés pour représenter les propriétés des entités spatiales. Lorsque des champs sont ajoutés, le nom du champ, le type de données (par exemple, entier court, texte, blob), la longueur (nombre de caractères) et/ou la précision décimale doivent être spécifiés. Le nouveau champ est ajouté après le dernier champ existant dans la table.

Une fois les champs ajoutés à la table, les valeurs peuvent être renseignées.

Modification des classes d'entités

les classes d'entités qui ont été créées à partir de zéro ou à partir d'autres sources peuvent être modifiées. Lorsqu'une nouvelle classe d'entités a été créée, elle est automatiquement placée en mode d'édition. Cependant, n'importe quelle classe d'entités peut être modifiée, en supposant que l'utilisateur dispose d'une autorisation d'écriture sur les fichiers et répertoires du disque qui stockent la classe d'entités. Les rubriques suivantes illustrent certaines des modifications spécifiques qui peuvent être apportées aux caractéristiques spatiales des couches.

Avant de pouvoir apporter des modifications, la classe d'entités doit être placée en mode de mise à jour. Dans la barre d'outils de l'éditeur, sélectionnez Éditeur > Commencer l'édition du menu. Toutes les sources de données du bloc de données actuel qui sont modifiables seront ouvertes pour modification. Pour décider du calque à modifier, sélectionnez le Cibler:

Vous pouvez basculer entre différentes sources de données au cours de la même session d'édition.

En outre, il est possible de basculer entre différentes tâches d'édition. Les différentes tâches d'édition sont pour la plupart explicites.

Une fois qu'un calque est en mode édition, utilisez le Éditer outil pour sélectionner des caractéristiques individuelles. Garder le <MAJ> touche enfoncée pour sélectionner plusieurs fonctions. Lorsque des entités sont sélectionnées, elles apparaissent dans un symbole cyan épais. Ici, vous pouvez voir deux polygones sélectionnés. Si une caractéristique est sélectionnée, elle peut être supprimée à l'aide de la <SUPPRIMER> touche du clavier,

Pour voir les sommets de formes individuelles, appuyez et maintenez le v clé. La forme actuellement sous le pointeur et toutes les formes environnantes auront leurs sommets exposés. De cette façon, vous pouvez comprendre comment la forme est construite.

Utilisez le Remodeler les fonctionnalités tâche et le Esquisser outil pour dessiner une nouvelle arête pour les entités polygonales ou linéaires. Voici quelques diagrammes simples montrant comment les polygones et les lignes sont remodelés

Pour modifier l'emplacement des sommets individuels d'une ligne ou d'un polygone, utilisez le Modifier les fonctionnalités tâche et à l'aide de l'outil Modifier , cliquez sur le sommet de l'entité que vous souhaitez remodeler. Tous les sommets de la ligne seront marqués d'un petit carré.

Cliquez et faites glisser un sommet vers une nouvelle position.

Si vous souhaitez éditer simultanément des tronçons partagés, il est nécessaire de créer une relation topologique. Pour l'édition de fichiers de formes, la relation topologique persiste uniquement pour une session d'édition donnée. Pour les géodatabases, il est possible d'avoir des règles topologiques enregistrées dans la géodatabase, de sorte que les règles topologiques sont restaurées chaque fois que vous modifiez les classes d'entités qui participent à la topologie.

Lorsqu'une topologie est active, il est possible d'utiliser les outils de topologie pour sélectionner des entités partagées, puis d'utiliser les outils d'esquisse et le Remodeler le bord ou alors Modifier l'arête Tâches. Voici la même zone mais une arête commune est sélectionnée (cela sélectionne simultanément les deux ensembles de sommets pour les deux formes adjacentes).

Le remodelage du bord modifie les deux polygones adjacents.

Les sommets peuvent être supprimés en utilisant le Modifier les fonctionnalités tâche. Ici, l'un des sommets est supprimé pour montrer que la tâche précédente de modification de l'arête partagée a effectivement modifié les deux polygones simultanément :

Définition de l'environnement de capture

La capture est utilisée pour garantir que les nouvelles fonctionnalités partagent l'emplacement commun aux points de terminaison ou aux nœuds. L'accrochage fera que la fin d'une nouvelle ligne rejoint une ligne existante, soit de bout en bout, soit de bout en côté. L'accrochage est défini, soit de manière interactive, soit dans les propriétés du calque, à une certaine tolérance. Si l'extrémité d'une nouvelle ligne se trouve dans la distance de tolérance d'une ligne existante, la nouvelle ligne s'accrochera et rejoindra la ligne existante. Les fonctionnalités ajoutées ou modifiées sont soumises à des règles de capture. L'environnement de capture définit les règles et les priorités pour la capture.

Voici deux lignes ajoutées à un fichier de formes sans accrochage :

Fractionnement des lignes et des polygones

Lignes existantes et pouvant être fractionnées à l'aide de la Fractionnement de ligne outil . Les polygones peuvent être divisés en utilisant le Couper des polygones tâche.

Lors de la division de lignes, cliquez sur l'emplacement de la ligne où vous souhaitez que la division se produise.

La division de polygone est similaire à la division de ligne, sauf que les polygones existants sont divisés par une ligne plutôt que par un seul emplacement. Pour diviser des polygones, il est nécessaire que la ligne de division commence et se termine à l'extérieur du polygone à diviser.

Une seule ligne de division peut diviser plusieurs lignes ou polygones existants à la fois.

Lorsqu'une ligne ou un polygone existant est fractionné, l'enregistrement d'attribut de l'entité d'origine est supprimé et de nouveaux enregistrements d'attribut sont ajoutés pour chaque nouvelle entité. Pour les classes d'entités de géodatabase, diverses stratégies peuvent être spécifiées pour ce qui arrive aux attributs lorsque les entités sont fractionnées. Pour les fichiers de formes, les nouveaux enregistrements pour les entités fractionnées dupliquent les valeurs d'origine de la forme parent.

Ici, l'un des polygones de peuplement forestier est divisé en deux polygones distincts.

Ici, l'une des lignes qui a été ajoutée précédemment est divisée en deux segments.

Mettre à jour les attributs avec Split

Lorsque des entités sont fractionnées, vous pouvez spécifier comment les attributs des nouvelles entités sont dérivés des entités d'origine. Chaque champ de la table attributaire peut se voir attribuer des règles de comportement pour le fractionnement. Les champs numériques doivent-ils être copiés, ou leur proportion par rapport à la valeur d'origine doit-elle être donnée ? Les champs de type chaîne (caractère) doivent-ils être copiés ou les champs doivent-ils être vides pour les nouvelles fonctionnalités ?

ArcGIS fournit des règles pour la mise à jour des valeurs attributaires des entités qui ont été fractionnées :

Politique de fractionnement

effet

Valeur par défaut les valeurs dans les nouveaux enregistrements sont la valeur par défaut du champ dans les paramètres du domaine attributaire de la classe d'entités
Dupliquer les valeurs des nouveaux enregistrements sont copiées à partir de l'enregistrement parent
Rapport de géométrie les valeurs numériques sont proportionnelles à la surface ou à la longueur d'origine de l'entité

Chaque champ de la table attributaire de couche peut avoir des politiques de fractionnement appliquées.

Fusion de fonctionnalités avec Union

En plus de fractionner des entités, ArcGIS permet de fusionner plusieurs entités. Les entités à fusionner doivent faire partie d'un ensemble sélectionné.

Les lignes qui se rencontrent au même point sont jointes en une seule ligne avec un seul enregistrement d'attribut.

Les polygones qui se chevauchent ou partagent une limite commune sont joints en un seul polygone avec un seul enregistrement d'attribut. Les polygones qui ne se chevauchent pas et ne sont pas contigus peuvent également être fusionnés en un seul polygone avec un seul enregistrement.De cette manière également, la classe d'entités diffère des autres jeux de données vectorielles pris en charge par les classes d'entités Célibataire polygones constitués de plusieurs objets géographiques.

Ici, deux polygones de peuplement forestier sont réunis. Le nouveau polygone a un seul enregistrement d'attribut.

Si les polygones à réunir ne sont pas adjacents, les entités peuvent toujours être réunies. Avant:

Mise à jour des attributs avec Merge

Union rejoint simplement les géométries de l'ensemble sélectionné et génère un nouvel enregistrement vierge. Lorsque les fonctionnalités sont fusionné, les enregistrements d'attribut d'origine sont supprimés et un nouvel enregistrement d'attribut est créé. Comme pour le fractionnement, les stratégies peuvent être utilisées pour définir des valeurs pour les attributs du nouvel enregistrement.

Politique de fusion

effet

Valeur par défaut les valeurs dans les nouveaux enregistrements sont la valeur par défaut du champ dans les paramètres du domaine attributaire de la classe d'entités
Dupliquer les valeurs des nouveaux enregistrements sont copiées à partir de l'enregistrement parent
Géométrie pondérée les valeurs numériques sont proportionnelles à la surface ou à la longueur d'origine de l'entité

Lorsque des entités sont fusionnées, vous devez sélectionner l'entité qui définira les valeurs attributaires de la nouvelle entité.

La géométrie de fusionner est identique à celui de syndicat, mais dans cette fusion, vous pouvez voir que l'enregistrement a obtenu des valeurs de l'une des entités parentes, plutôt que d'être vide comme dans l'union ci-dessus.

Plus d'opérations d'édition

Quelques opérations d'édition supplémentaires sont disponibles pour les entités surfaciques. Voici quelques caractéristiques généralisées utilisées pour illustrer les opérations. Un seul shapefile est composé d'un cercle chevauchant un rectangle.

  • Clip (en supprimant la zone qui se croise): le découpage supprime la zone de chevauchement entre deux polygones. Le polygone qui est sélectionné à ce moment-là agit comme "l'emporte-pièce", en supprimant la zone du ou des polygones qui se chevauchent. Ici, après l'opération de découpage, le rectangle a été déplacé pour montrer l'effet de l'opération. L'image de gauche montre le rectangle en tant que tondeuse, l'image de droite montre le cercle en tant que tondeuse.

Toutes les modifications apportées aux classes d'entités peuvent être annulées en sélectionnant Modifier > Annuler à partir du menu ou en utilisant la combinaison de touches <CTRL-Z>. Toutes les mises à jour peuvent être annulées, jusqu'au dernier enregistrement, ou jusqu'à la création de la classe d'entités si la classe d'entités est nouvelle et n'a jamais été enregistrée.

Si vous avez terminé de modifier une classe d'entités, vous pouvez choisir d'enregistrer les modifications. C'est aussi une bonne idée d'enregistrer les modifications sur une base fréquente en cas de problèmes du système. Toutes les mises à jour enregistrées sont écrites sur le disque dans le cadre de la structure de la classe d'entités.

Vous serez invité à enregistrer les modifications si vous essayez d'arrêter la modification.

Vous serez également invité à enregistrer les modifications si vous essayez de fermer la carte, d'ouvrir un autre projet ou de fermer ArcGIS.


Ensemble de données hydrographiques nationales

L'ensemble de données hydrographiques nationales (NHD) représente le réseau de drainage des eaux des États-Unis avec des caractéristiques telles que des rivières, des ruisseaux, des canaux, des lacs, des étangs, des côtes, des barrages et des barrages. Le NHD est l'ensemble de données hydrographiques le plus à jour et le plus complet pour la nation.

Ensemble de données hydrographiques nationales (NHD)

La version la plus récente de l'ensemble de données hydrographiques nationales, la haute résolution NHD, est cartographiée à une échelle de 1:24 000 ou une échelle plus grande (1:63 360 ou une échelle plus grande en Alaska). Ces données sont mises à jour et maintenues grâce à des partenariats d'intendance avec les États et d'autres organismes de collaboration. La haute résolution NHD, ainsi que les données du jeu de données sur les limites du bassin versant (WBD) et du programme d'élévation 3D (3DEP), sont utilisées pour créer la haute résolution NHDPlus.

Le téléchargement de la géodatabase fichier conserve la richesse du modèle de base de données complexe NHD, y compris plusieurs jeux de classes d'entités, classes d'entités, classes d'entités d'événement, tables attributaires, classes de relations, domaines et métadonnées au niveau de l'entité. Le téléchargement du fichier de formes simplifie cette structure en contenant toutes les classes d'entités sous forme de fichiers de formes distincts et de tables sous forme de fichiers de données distincts.

Présentation du modèle de données NHD

Le téléchargement de la géodatabase de fichier NHD contient des données NHD dans le jeu de données d'entités hydrographiques. Il inclut également le WBD dans un deuxième jeu de données d'entités.

Caractéristiques de la ligne NHD

NHDFlowline est le réseau d'écoulement fondamental composé principalement de caractéristiques vectorielles ruisseau/rivière et chemin artificiel. Il représente la géométrie spatiale, porte les attributs et contient des mesures de référencement linéaire pour localiser des entités ou des « événements » sur le réseau. Les caractéristiques supplémentaires de NHDFlowline sont le canal/fossé, le pipeline, le connecteur, le conduit souterrain et le littoral.

NHDLine contient des caractéristiques linéaires non essentielles au réseau.

Caractéristiques de la zone NHD

Les plans d'eau tels que les lacs/étangs sont représentés dans NHDWaterbody. Ils représentent la géométrie spatiale et les attributs de l'entité. Ces polygones d'eau peuvent être traversés par des chemins artificiels NHDFlowline pour permettre la représentation de la direction de l'écoulement de l'eau. Les autres caractéristiques du NHDWaterbody sont les marais/marais, le réservoir, la plage, l'estuaire et la masse de glace.

NHDArea contient de nombreuses fonctionnalités supplémentaires de polygones aquatiques. L'un des plus importants est la fonction ruisseau/rivière. Il représente l'étendue de l'eau dans un large cours d'eau/rivière avec un ensemble de base d'attributs. Ces polygones englobent généralement les chemins artificiels NHDFlowline qui représentent le réseau de cours d'eau. Le chemin artificiel porte les attributs critiques du cours d'eau/de la rivière, tandis que NHDArea représente l'étendue géométrique.

Caractéristiques des points NHD

NHDPoint contient des entités ponctuelles liées à l'hydrographie.

Événements NHD

NHDPointEventFC, NHDLineEventFC et NHDAreaEventFC représentent des événements de données ponctuelles, linéaires et surfaciques qui se comportent comme des entités cartographiques et des événements référencés linéairement. Les Streamgages, qui sont des entités ponctuelles, peuvent être affichés et identifiés dans le réseau grâce à un référencement linéaire avec une adresse de réseau.

Tableaux NHD

Des informations sur le NHD peuvent également être obtenues dans une série de tableaux associés. Cela inclut les métadonnées stockées dans NHDFeaturetoMetadata et NHDMetadata, les sources données dans NHDSourceCitation, l'identification du modèle et la version des données données dans NHDProcessingParameters, les relations de flux données dans NHDFlow, les historiques de code d'accès donnés dans NHDReachCrossReference, le domaine des codes de caractéristiques donnés dans NHDFCode, et autres.

Héritage NHD moyenne résolution (1:100.000)

À la fin des années 1990, l'USGS et l'US EPA ont collaboré pour produire l'ensemble de données hydrographiques nationales à moyenne résolution à l'échelle 1:100 000 pour les États-Unis contigus. leurs applications et celles d'autres utilisateurs à moyenne résolution, tandis que l'USGS, le US Forest Service et d'autres partenaires ont lancé la production du NHD à l'échelle 1:24 000 ou mieux. Vous trouverez plus d'informations sur l'historique du développement de la NHD et des ensembles de données connexes dans le document Faire couler l'eau numérique : l'évolution des cadres géospatiaux des eaux de surface.

Aujourd'hui, l'US EPA gère la maintenance et la distribution de la résolution moyenne NHD dans le cadre de la suite de produits NHDPlus Version 2, qui peut être téléchargée à partir du site Web de l'EPA NHDPlus.


Répertorier tous les jeux de classes d'entités et classes de plusieurs géodatabases dans un fichier CSV ? - Systèmes d'information géographique

Système de données sur les ressources minérales (MRDS)

MRDS est une collection de rapports décrivant les ressources minérales métalliques et non métalliques à travers le monde. Sont inclus le nom du gisement, l'emplacement, la marchandise, la description du gisement, les caractéristiques géologiques, la production, les réserves, les ressources et les références. Il englobe les MRDS et MAS/MILS d'origine. Le MRDS est vaste, complexe et quelque peu problématique. Ce service fournit un sous-ensemble de la base de données composé des champs de données jugés les plus utiles et qui contiennent le plus souvent des informations, mais des rapports complets de la plupart des enregistrements sont également disponibles.

Statut actuel : Depuis 2011, l'USGS a cessé les mises à jour systématiques du MRDS et travaille à la création d'une nouvelle base de données, axée principalement sur les États-Unis voisins. Pour les emplacements en dehors des États-Unis, MRDS reste la meilleure collection de rapports dont l'USGS dispose. Pour les emplacements en Alaska, le fichier de données sur les ressources de l'Alaska reste la collection la plus cohérente de ces rapports et est en cours de développement.

Les descriptions des ressources incluent ici une indication de la quantité globale et de la diversité des informations qu'elles contiennent. De nombreux enregistrements de cette base de données sont de simples rapports de produits à un certain endroit, mais certains enregistrements fournissent des détails substantiels sur le cadre géologique et l'exploitation industrielle de la ressource. Pour aider les utilisateurs à trouver ces enregistrements plus complets, une interface cartographique et un formulaire de recherche sont fournis qui classent les résultats par qualité globale, les enregistrements classés A contenant plus d'informations sur plus d'aspects de la ressource, les enregistrements classés D n'ayant que des informations récapitulatives sur la ressource. Les notices classées B et C sont intermédiaires entre celles-ci, et les notices classées E manquent généralement de références bibliographiques.


Répertorier tous les jeux de classes d'entités et classes de plusieurs géodatabases dans un fichier CSV ? - Systèmes d'information géographique

COMMENCER - L'outil HydroLink aide à générer une référence linéaire pour les données ponctuelles vers les couches d'hydrographie moyenne résolution NHDPlusV2.1 et NHD haute résolution. L'outil utilise les connaissances locales et sur le terrain du chercheur des caractéristiques géospatiales où les données ont été collectées pour améliorer à la fois la précision spatiale des données de recherche et aider à la liaison avec ces ensembles de données nationales sur les eaux de surface.

Une fois les données de localisation des points vérifiées et le référencement linéaire terminé, le jeu de données de sortie comprend les coordonnées de latitude et de longitude vérifiées et des attributs supplémentaires pour documenter le lien avec les jeux de données hydrographiques. Le jeu de données peut ensuite être exporté sous forme de fichier de formes (SHP) à partir de l'outil, exporté dans plusieurs formats via ArcGIS Online [par ex. valeurs séparées par des virgules (CSV), fichier de géodatabase (FGDB) et GeoJSON], ou publié en tant que service Web (par exemple, services de carte avec WMS activé).

  1. Créez un fichier de formes à partir de vos données. Compressez le fichier de formes. Vous pouvez également créer un fichier CSV ou Excel sans compresser les données. Lors de la création de fichiers à télécharger, suivez les exigences sous les boutons « Ajouter un fichier de forme » ou « Ajouter un fichier CSV/Excel ».
  2. Cliquez sur le bouton "Ajouter Shapefile" ou "Ajouter CSV/Excel" pour télécharger votre fichier. ArcGIS Online créera un service d'entités à partir de votre fichier. Une fois le téléchargement terminé, vous verrez le nouveau service d'entités apparaître sur le tableau de bord HydroLink.
  3. Cliquez sur "Modifier". Cela ouvre l'ensemble de données dans la vue d'édition.
  4. Effectuez un zoom avant jusqu'à ce que les couches d'hydrographie NHD deviennent visibles.
  5. Vérifiez l'emplacement spatial en utilisant l'imagerie comme guide. Si nécessaire, déplacez l'emplacement du point en cliquant une fois pour mettre le point en surbrillance. Survolez le point en surbrillance. Les curseurs se transforment en main, cliquez sur le point sans relâcher. Faites glisser le point vers l'emplacement correct et relâchez.
  6. Liez les données au NHD. Cliquez sur « Localiser ». Tout en maintenant Contrôle, survolez la ligne de flux haute résolution où le point doit être référencé et cliquez. L'outil affiche les points de référence sur les deux réseaux NHD à l'aide de cases (rouge pour haute résolution, jaune pour moyenne résolution). Vérifiez les emplacements des deux points de référence et sélectionnez « Mettre à jour » pour insérer des données dans la table attributaire. L'outil passe automatiquement au point suivant. Remarque : Par défaut, « Localiser » identifie les points de référence pour les deux versions du NHD. Si nécessaire, décochez une version du NHD pour « Localiser » uniquement les données par rapport à une version de NHD à la fois. De plus, les options pour « pas de portée pour ce point » peuvent être sélectionnées pour l'un ou les deux réseaux NHD afin de représenter un point qui a été échantillonné dans un emplacement où les réseaux NHD n'ont pas de lignes d'écoulement modélisées.
  7. Lorsque tous les points sont vérifiés, cliquez sur « Retour au tableau de bord » en haut à droite.
  8. Cliquez sur "Exporter" pour télécharger les données sous forme de fichier de formes sur une machine locale. Cet ensemble de données a maintenant les attributs à valeur ajoutée des coordonnées vérifiées et le lien avec les ensembles de données NHD.

MES SERVICES DE FONCTIONNALITÉS EN LIGNE ARCGIS - HydroLink ne fonctionne qu'en utilisant des services d'entités correctement formatés. En cliquant sur « Ajouter un fichier de formes », vous créerez automatiquement un service d'entités dans votre compte ArcGIS Online avec la structure de données appropriée à utiliser. Vous trouverez ci-dessous une liste de tous les services d'entités de votre compte ArcGIS Online personnel. Cliquez sur le bouton "Modifier" pour commencer à modifier un jeu de données, cliquez sur le bouton "Afficher" pour afficher votre jeu de données dans ArcGIS Online, ou cliquez sur le bouton "Exporter" pour télécharger vos données finales au format shapefile.


Nom de la spécification : Schéma DCAT-US v1.1 (Schéma de métadonnées de données ouvertes du projet)
Cette version: 1.1
Dernière version: Cette version
Date de publication: 6 novembre 2014

Introduction

Cette section contient des conseils pour prendre en charge l'utilisation des métadonnées du projet Open Data pour répertorier les ensembles de données des agences et les interfaces de programmation d'applications (API) hébergés sur agency.gov/data. Des informations techniques supplémentaires sur le schéma sont disponibles sur la page Ressources de métadonnées.

Vocabulaire des métadonnées standard

Les métadonnées sont des informations structurées qui décrivent, expliquent, localisent ou facilitent la récupération, l'utilisation ou la gestion d'une ressource d'information (NISO 2004, ISBN : 1-880124-62-9). Le défi consiste à définir et à nommer les champs de métadonnées standard afin qu'un consommateur de données dispose de suffisamment d'informations pour traiter et comprendre les données décrites. Plus il y a d'informations qui peuvent être transmises dans un format standard standardisé, plus les données deviennent précieuses. Les métadonnées peuvent aller de basiques à avancées, de permettre de découvrir le simple fait qu'un certain actif de données existe et concerne un sujet général jusqu'à fournir des informations détaillées documentant la structure, l'historique de traitement, la qualité, les relations et d'autres propriétés de un jeu de données. Rendre les métadonnées lisibles par une machine augmente considérablement son utilité, mais nécessite une normalisation plus détaillée, définissant non seulement les noms de champs, mais aussi la manière dont les informations sont codées dans les champs de métadonnées.

Établir un vocabulaire commun est la clé de la communication. Le schéma de métadonnées spécifié dans ce mémorandum est basé sur DCAT, un vocabulaire hiérarchique spécifique aux jeux de données. Cette spécification définit trois types d'éléments de métadonnées : champs obligatoires, obligatoires-if (conditionnellement obligatoires) et étendus. Ces éléments ont été sélectionnés pour représenter les informations les plus souvent recherchées sur le web. Pour aider les utilisateurs d'autres normes de métadonnées, des mappages de champs avec des éléments équivalents dans d'autres normes sont fournis.

Quoi documenter - Ensembles de données et API Web

Un jeu de données est une collection identifiable d'objets de données structurés unifiés par certains critères (auteur, sujet, portée, étendue spatiale ou temporelle…). Un catalogue est une collection de descriptions d'ensembles de données, chaque description est un enregistrement de métadonnées. L'intention d'un catalogue de données est de faciliter l'accès aux données par les utilisateurs qui s'intéressent d'abord à un type particulier de données, et après avoir trouvé un ensemble de données adapté, voudront ensuite savoir comment obtenir les données.

Une API Web (UNEcandidature Pprogrammation jeninterface) permet aux programmes informatiques d'interroger dynamiquement un ensemble de données à l'aide du World Wide Web. Par exemple, un ensemble de données de marchés de producteurs peut être mis à disposition pour téléchargement sous forme de fichier unique (par exemple, un fichier CSV), ou peut être mis à la disposition des développeurs via une API Web, de sorte qu'un programme informatique puisse utiliser un code postal pour récupérer un liste des marchés de producteurs dans la zone du code postal.

Le fichier catalogue de chaque agence doit répertorier tous les ensembles de données de l'agence qui peuvent être rendus publics, qu'ils soient distribués par téléchargement de fichier ou par une API Web. Veuillez également consulter les instructions détaillées sur la documentation des API Web dans vos fichiers data.json.

Format de fichier de métadonnées - JSON

Le guide de mise en œuvre disponible dans le cadre du projet Open Data décrit les exigences de l'Agence pour le développement de métadonnées conformément à la politique sur les données ouvertes. Une introduction rapide sur le format de fichier impliqué :

JSON est un format d'échange de données léger qui est très facile à lire, à analyser et à générer. Basé sur un sous-ensemble du langage de programmation JavaScript, JSON est un format de texte optimisé pour l'échange de données. JSON est construit sur deux structures : (1) une collection de paires nom/valeur et (2) une liste ordonnée de valeurs.

Lorsque des champs facultatifs sont inclus dans un fichier catalogue mais ne sont pas renseignés, ils peuvent être représentés par une valeur nulle. Ils ne doivent pas être représentés par une chaîne vide ( " " ).

Lorsqu'un enregistrement a un URL d'accès ou alors URL de téléchargement, ils doivent être contenus en tant qu'objets dans un Distribution. Tout objet peut être décrit par Titre, la description, format, ou alors type de support, bien que lorsqu'un objet contient URL de téléchargement, il doit être accompagné type de support.

Le schéma Project Open Data est sensible à la casse. Le schéma utilise une convention de cas de chameau où la première lettre de certains mots dans un champ est en majuscule (généralement tous les mots sauf le premier). Bien qu'il puisse sembler subtil quels caractères sont majuscules et minuscules, il est nécessaire de suivre exactement la même casse que celle définie dans le schéma documenté ici. Par exemple:

Correct : point de contact
Incorrect : Point de contact
Incorrect : point de contact
incorrect : POINT DE CONTACT

Des liens vers des exemples téléchargeables de fichiers de métadonnées développés dans ce format et dans d'autres se trouvent dans les ressources de métadonnées. Des outils pour aider les agences à produire et à maintenir leurs inventaires de données sont disponibles sur Labs.Data.gov.

Champs du catalogue

Ces champs décrivent l'intégralité du fichier catalogue de la liste des données publiques. Les éditeurs peuvent également utiliser le champ describeBy pour référencer le fichier de schéma JSON par défaut utilisé pour définir le schéma (https://project-open-data.cio.gov/v1.1/schema/catalog.json) ou ils peuvent faire référence à leur propre fichier de schéma JSON s'ils ont étendu le schéma avec des définitions de schéma supplémentaires. De même, @context peut être utilisé pour référencer le contexte JSON-LD par défaut utilisé pour définir le schéma (https://project-open-data.cio.gov/v1.1/schema/catalog.jsonld) ou les éditeurs peuvent se référer au leur s'ils ont étendu le schéma avec des vocabulaires de données liés supplémentaires. Voir la section Catalogue sous Directives supplémentaires pour le champ de métadonnées pour plus de détails.

Domaine Étiqueter Définition Obligatoire
@le contexte Contexte des métadonnées URL ou objet JSON pour le contexte JSON-LD qui définit le schéma utilisé. Non
@identifiant ID du catalogue de métadonnées IRI pour l'identifiant de nœud JSON-LD du catalogue.Il doit s'agir de l'URL du fichier data.json lui-même. Non
@taper Type de métadonnées IRI pour le type de données JSON-LD. Cela devrait être dcat:Catalog pour le catalogue. Non
conforme à Version du schéma URI qui identifie la version du schéma Project Open Data utilisé. Toujours
décrit par Dictionnaire de données URL du fichier JSON Schema qui définit le schéma utilisé. Non
base de données Base de données Un conteneur pour le tableau d'objets Dataset. Voir Champs de jeu de données ci-dessous pour plus de détails. Toujours

Champs du jeu de données

Voir le Directives supplémentaires pour le champ de métadonnées pour en savoir plus sur l'utilisation de chaque élément, y compris la plage d'entrées valides, le cas échéant. Consultez les mappages de champs pour trouver les champs équivalents v1.0, DCAT, Schema.org et CKAN.

Domaine Étiqueter Définition Obligatoire
@taper Type de métadonnées IRI pour le type de données JSON-LD. Cela devrait être dcat:Dataset pour chaque ensemble de données. Non
Titre Titre Nom lisible de l'actif. Doit être rédigé en anglais simple et inclure suffisamment de détails pour faciliter la recherche et la découverte. Toujours
la description La description Description lisible par l'homme (par exemple, un résumé) avec suffisamment de détails pour permettre à un utilisateur de comprendre rapidement si l'actif présente un intérêt. Toujours
mot-clé Mots clés Les balises (ou mots-clés) aident les utilisateurs à découvrir votre ensemble de données, veuillez inclure des termes qui seraient utilisés par des utilisateurs techniques et non techniques. Toujours
modifié Dernière mise à jour Date la plus récente à laquelle l'ensemble de données a été modifié, mis à jour ou modifié. Toujours
éditeur Éditeur L'entité de publication et éventuellement leur(s) organisation(s) mère(s). Toujours
point de contact Nom et e-mail du contact Nom et adresse e-mail de la personne-ressource pour l'actif. Toujours
identifiant Identifiant unique Un identifiant unique pour l'ensemble de données ou l'API tel qu'il est conservé dans un catalogue ou une base de données d'agence. Toujours
niveau d'accès Niveau d'accès public Le degré auquel cet ensemble de données pouvait être rendu public, indépendamment du fait qu'il a été mis à disposition. Choix : public (l'actif de données est ou pourrait être mis à la disposition de tous sans restrictions), public restreint (l'actif de données est disponible sous certaines restrictions d'utilisation) ou non public (l'actif de données n'est pas disponible pour les membres du public). Toujours
bureauCode USG Code de bureau Agences fédérales, code combiné d'agence et de bureau de la circulaire OMB A-11, annexe C (PDF, CSV au format 015:11 . Toujours
code de programme USG Code de programme Agences fédérales, énumérez le programme principal lié à cet actif de données, à partir de l'inventaire des programmes fédéraux. Utilisez le format 015:001 . Toujours
Licence Licence Le statut de licence ou de non-licence (c'est-à-dire le domaine public) avec lequel l'ensemble de données ou l'API a été publié. Voir Licences ouvertes pour plus d'informations. Le cas échéant
droits Droits Cela peut inclure des informations concernant l'accès ou les restrictions basées sur la confidentialité, la sécurité ou d'autres politiques. Cela devrait également servir d'explication pour le « niveau d'accès » sélectionné, y compris des instructions sur la façon d'accéder à un fichier restreint, le cas échéant, ou une explication de la raison pour laquelle un actif de données « non public » ou « public restreint » n'est pas « public », si en vigueur. Texte, 255 caractères. Le cas échéant
spatial Spatial La plage d'applicabilité spatiale d'un ensemble de données. Peut inclure une région spatiale comme un cadre de délimitation ou un lieu nommé. Le cas échéant
temporel Temporel La plage d'applicabilité temporelle d'un ensemble de données (c'est-à-dire une date de début et de fin d'applicabilité pour les données). Le cas échéant
Distribution Distribution Un conteneur pour le tableau d'objets Distribution. Voir Champs de distribution du jeu de données ci-dessous pour plus de détails. Le cas échéant
cumulPériodicité La fréquence La fréquence à laquelle l'ensemble de données est publié. Non
conforme à Norme de données URI utilisé pour identifier une spécification standardisée à laquelle l'ensemble de données est conforme. Non
dataQuality USG Qualité des données Si l'ensemble de données respecte les directives de qualité de l'information de l'agence (vrai/faux). Non
décrit par Dictionnaire de données URL vers le dictionnaire de données pour l'ensemble de données. Notez qu'une documentation autre qu'un dictionnaire de données peut être référencée à l'aide de documents connexes ( références ). Non
décritParType Type de dictionnaire de données Le format de fichier lisible par machine (type de support IANA également connu sous le nom de type MIME) du dictionnaire de données de l'ensemble de données ( décrit par ). Non
fait partie de Collection Collection dont l'ensemble de données est un sous-ensemble. Non
Publié Date de sortie Date d'émission officielle. Non
Langue Langue La langue de l'ensemble de données. Non
page de destination Page d'accueil URL Ce champ n'est pas destiné à la page d'accueil d'une agence (par exemple, www.agency.gov), mais plutôt si un ensemble de données a un hub ou une page de destination convivial vers lequel les utilisateurs peuvent être dirigés pour toutes les ressources liées à l'ensemble de données. Non
primaireITInvestmentUII USG Investissement informatique primaire UII Pour lier un ensemble de données à un identifiant d'investissement unique (UII) informatique. Non
les références Documents connexes Documents connexes tels que des informations techniques sur un ensemble de données, la documentation du développeur, etc. Non
systemOfRecords USG Système d'enregistrement Si le système est désigné comme un système d'enregistrements en vertu de la loi sur la protection des renseignements personnels de 1974, fournissez l'URL de l'avis relatif au système d'enregistrements lié à cet ensemble de données. Non
thème Catégorie Catégorie thématique principale de l'ensemble de données. Non

Champs de distribution du jeu de données

Dans un jeu de données, Distribution est utilisé pour agréger les métadonnées spécifiques aux ressources d'un jeu de données (URL d'accès et URL de téléchargement), qui peut être décrit à l'aide des champs suivants. Chaque distribution doit contenir un URL d'accès ou alors URL de téléchargement. UNE URL de téléchargement doit toujours être accompagné type de support.

Domaine Étiqueter Définition Obligatoire
@taper Type de métadonnées IRI pour le type de données JSON-LD. Cela devrait être dcat:Distribution pour chaque distribution. Non
URL d'accès URL d'accès URL fournissant un accès indirect à un jeu de données, par exemple via une API ou une interface graphique. Le cas échéant
conforme à Norme de données URI utilisé pour identifier une spécification standardisée à laquelle la distribution se conforme. Non
décrit par Dictionnaire de données URL vers le dictionnaire de données pour la distribution trouvée à l'URL de téléchargement . Notez qu'une documentation autre qu'un dictionnaire de données peut être référencée à l'aide de documents connexes, comme indiqué dans les champs développés. Non
décritParType Type de dictionnaire de données Le format de fichier lisible par machine (type de support IANA ou type MIME) de l'URL décrite par la distribution. Non
la description La description Description lisible par l'homme de la distribution. Non
URL de téléchargement URL de téléchargement URL fournissant un accès direct à un fichier téléchargeable d'un ensemble de données. Le cas échéant
format Format Une description lisible par l'homme du format de fichier d'une distribution. Non
type de support Type de support Le format de fichier lisible par machine (IANA Media Type ou MIME Type) de l'URL de téléchargement de la distribution. Le cas échéant
Titre Titre Nom lisible de la distribution. Non

Extension du schéma

Des métadonnées « extensionnelles » et/ou spécifiques à un domaine peuvent facilement être ajoutées à l'aide d'autres vocabulaires, même s'il ne s'agit pas d'un terme (entité/propriété) qui sera indexé par les principaux moteurs de recherche - il pourrait toujours être indexé par d'autres moteurs de recherche personnalisés et par Data.gov. Les éditeurs sont encouragés à étendre leurs descriptions de métadonnées en utilisant des éléments de la liste « Champs étendus » ci-dessous, ou de tout vocabulaire bien connu (y compris Dublin Core, Schema.org, FGDC, ISO 19115 et NIEM) tant qu'ils sont correctement attribué. Il est également recommandé que ces extensions soient définies via les champs describeBy et @context en haut des métadonnées du catalogue.

Directives supplémentaires pour le champ de métadonnées

Des détails supplémentaires pour chaque champ sont fournis ici, répartis en sections pour le catalogue global, chaque ensemble de données et la distribution de chaque ensemble de données. Consultez les mappages de champs pour trouver les champs équivalents v1.0, DCAT, Schema.org et CKAN.

  • Clé
    • Obligatoire
    • Obligatoire le cas échéant
    • Étendu (facultatif)
    • Catalogue

    Champs du catalogue

    Domaine # @le contexte
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation L'URL ou l'objet JSON du contexte JSON-LD qui définit le schéma utilisé. L'URL de la version 1.1 du schéma est https://project-open-data.cio.gov/v1.1/schema/catalog.jsonld
    Exemple <"@context": "https://project-open-data.cio.gov/v1.1/schema/catalog.jsonld">
    Domaine # @identifiant
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (IRI)
    Notes d'utilisation Un identifiant unique pour le catalogue tel que défini par les identifiants de nœud JSON-LD. Cela devrait être l'URL du fichier data.json lui-même
    Exemple <"@id": "https://www.agency.gov/data.json">
    Domaine # @taper
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (IRI)
    Notes d'utilisation Le type de métadonnées tel que défini par les types de données JSON-LD. Cela devrait être dcat:Catalog pour le catalogue
    Exemple
    Domaine # conforme à
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne (URI)
    Notes d'utilisation Ceci est utilisé pour identifier la version du schéma à l'aide d'un URI. L'URI pour la version 1.1 du schéma est https://project-open-data.cio.gov/v1.1/schema
    Exemple <"conformsTo": "https://project-open-data.cio.gov/v1.1/schema">
    Domaine # décrit par
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Ceci est utilisé pour spécifier un fichier de schéma JSON qui définit tous les champs. Par défaut, il est recommandé que le fichier de schéma JSON canonique soit référencé (https://project-open-data.cio.gov/v1.1/schema/catalog.json) mais si le schéma avait été étendu, les éditeurs peuvent référencer un fichier qui définit ces extensions.
    Exemple <"describedBy": "https://project-open-data.cio.gov/v1.1/schema/catalog.json">
    Domaine # base de données
    Cardinalité (1,n)
    Obligatoire Oui toujours
    Valeurs acceptées Tableau d'objets
    Notes d'utilisation Ce champ est un conteneur pour un tableau d'objets Dataset. Voir les champs de jeu de données ci-dessous pour plus de détails
    Exemple

    Champs du jeu de données

    Domaine # @taper
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (IRI)
    Notes d'utilisation Le type de métadonnées tel que défini par les types de données JSON-LD. Cela devrait être dcat:Dataset pour l'ensemble de données
    Exemple
    Domaine # niveau d'accès
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Doit être l'un des suivants : « public », « restricted public », « non public »
    Notes d'utilisation Ce champ fait référence au degré auquel cet ensemble de données pourrait être mis à disposition au public, qu'il soit actuellement accessible au public. Par exemple, si un membre du public peut entrer dans votre agence et obtenir un ensemble de données, cette entrée est Publique même s'il n'y a pas de fichiers en ligne. UNE public restreint l'ensemble de données n'est disponible que sous certaines conditions ou pour certains publics (comme les chercheurs qui signent une renonciation). UNE non public L'ensemble de données est un ensemble qui ne pourrait jamais être mis à la disposition du public pour des raisons de confidentialité, de sécurité ou pour d'autres raisons déterminées par votre agence.
    Exemple
    Domaine # cumulPériodicité
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Durée de répétition ISO 8601 (ou irrégulière)
    Notes d'utilisation Doit être une durée de répétition ISO 8601, sauf si cela n'est pas possible car la périodicité d'accumulation est complètement irrégulière, auquel cas la valeur doit simplement être irrégulière . La valeur ne doit pas inclure de date de début ou de fin, mais exprimer simplement la durée entre la publication des données. Par exemple, un ensemble de données publié annuellement serait R/P1Y tous les trois mois serait R/P3M hebdomadaire serait R/P1W et quotidien serait R/P1D . D'autres exemples et documentations peuvent être trouvés ici.
    Exemple <"accrualPeriodicity":"R/P1Y">
    Domaine # bureauCode
    Cardinalité (0,n)
    Obligatoire Oui, pour les agences du gouvernement fédéral des États-Unis
    Valeurs acceptées Tableau de cordes
    Notes d'utilisation Représenter chaque bureau responsable de l'ensemble de données selon les codes trouvés dans la circulaire OMB A-11, annexe C (PDF, CSV). Commencez par le code de l'agence, puis deux points, puis le code du bureau.
    Exemple L'Office of the Solicitor (86) du ministère de l'Intérieur (010) serait : <"bureauCode":["010:86"]>. Si un deuxième bureau était également responsable, le format comme ceci : <"bureauCode":["010:86","010:04"]>.
    Domaine # conforme à
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URI)
    Notes d'utilisation Ceci est utilisé pour identifier une spécification standardisée à laquelle l'ensemble de données se conforme. S'il s'agit d'une spécification technique associée à une sérialisation particulière d'une distribution, cela doit être spécifié avec conformsTo au niveau de la distribution. Il est recommandé qu'il s'agisse d'un URI qui sert d'identifiant unique pour la norme. L'URI peut être ou non une URL qui fournit la documentation de la spécification.
    Exemple <"conformsTo": "http://www.agency.gov/common-vegetable-analysis-model/">
    Domaine # point de contact
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Objet vCard
    Notes d'utilisation Il s'agit d'un conteneur pour deux champs qui constituent ensemble les informations de contact pour l'ensemble de données. contactPoint doit toujours contenir à la fois le nom complet de la personne (fn) et son e-mail ( hasEmail ).
    Exemple Voir ci-dessous
    Domaine # ContactPoint → @type
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (IRI)
    Notes d'utilisation Le type de métadonnées tel que défini par les types de données JSON-LD. Cela devrait être vcard:Contact pour contactPoint
    Exemple
    Domaine # Point de contact → fn
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Cela devrait inclure inclus avec hasEmail dans le cadre du point de contact d'un enregistrement (voir l'exemple ci-dessus).
    Exemple
    Domaine # contactPoint → hasEmail
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Cela doit être formaté selon les spécifications de la vCard (voir l'exemple ci-dessous) et inclus avec fn dans le cadre du point de contact d'un enregistrement (voir l'exemple ci-dessus).
    Exemple
    Domaine # qualité des données
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Doit être une valeur booléenne true ou false (non contenue entre guillemets)
    Notes d'utilisation Indique si un ensemble de données est conforme aux directives de qualité de l'information de l'agence.
    Exemple
    Domaine # décrit par
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Ceci est utilisé pour spécifier un dictionnaire de données ou un schéma qui définit des champs ou des en-têtes de colonne dans l'ensemble de données. S'il s'agit d'un fichier lisible par une machine, il est recommandé de le spécifier avec describeBy au niveau de la distribution avec le describeByType associé. Au niveau de l'ensemble de données, il est supposé être une page Web HTML ou un document PDF lisible par l'homme. La documentation qui n'est pas spécifiquement un dictionnaire de données appartient aux « références »
    Exemple <"describedBy": "http://www.agency.gov/vegetables/definitions.pdf">
    Domaine # décritParType
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (type de média IANA)
    Notes d'utilisation Ceci est utilisé pour identifier le type de média (type de média IANA également connu sous le nom de type MIME) de l'URL utilisée pour le champ décritBy de l'ensemble de données. Cela doit être spécifié si describeBy n'est pas une page Web HTML.
    Exemple <"describedByType": "application/pdf">
    Domaine # la description
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Cela devrait être lisible par l'homme et compréhensible pour une personne moyenne.
    Exemple
    Domaine # Distribution
    Cardinalité (0,n)
    Obligatoire Oui, si l'ensemble de données a un accessURL ou downloadURL .
    Valeurs acceptées Tableau d'objets
    Notes d'utilisation Il s'agit d'un conteneur pour un ou plusieurs objets de distribution qui regroupent les champs : accessURL , conformsTo , downloadURL , describeBy , describeByType , description , format , mediaType et title .
    Exemple Voir ci-dessous
    Domaine # distribution → @type
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (IRI)
    Notes d'utilisation Le type de métadonnées tel que défini par les types de données JSON-LD. Cela devrait être dcat:Distribution pour chaque distribution
    Exemple
    Domaine # distribution → URL d'accès
    Cardinalité (0,1)
    Obligatoire Oui, si le fichier est accessible indirectement, par d'autres moyens que le téléchargement direct.
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Il doit s'agir de l'URL d'un moyen indirect d'accéder aux données, tel que la documentation de l'API, un « assistant » ou une autre interface graphique utilisée pour générer un téléchargement, un flux ou un formulaire de demande pour les données. Lorsque accessLevel est « public restreint » mais que l'ensemble de données est disponible en ligne indirectement, ce champ doit être l'URL qui fournit un accès indirect. Cela ne devrait pas être un direct URL de téléchargement. On suppose généralement que accessURL est une page Web HTML.
    Exemple <"accessURL":"http://www.agency.gov/api/vegetables/">
    Domaine # distribution → conforme
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URI)
    Notes d'utilisation Ceci est utilisé pour identifier une spécification normalisée à laquelle la distribution se conforme. Il est recommandé qu'il s'agisse d'un URI qui sert d'identifiant unique pour la norme. L'URI peut être ou non une URL qui fournit la documentation de la spécification.
    Exemple <"conformsTo": "http://www.agency.gov/vegetables-data-standard/">
    Domaine # distribution → URL de téléchargement
    Cardinalité (0,1)
    Obligatoire Oui, si le fichier est disponible en téléchargement public.
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Ce doit être le direct URL de téléchargement. D'autres moyens d'accéder à l'ensemble de données doivent être exprimés en utilisant accessURL . Cela doit toujours être accompagné de mediaType .
    Exemple <"downloadURL":"http://www.agency.gov/vegetables/listofvegetables.csv">
    Domaine # distribution → décrite par
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Ceci est utilisé pour spécifier un dictionnaire de données ou un schéma qui définit des champs ou des en-têtes de colonne dans la distribution. S'il s'agit d'un fichier lisible par une machine, le type de média doit être spécifié avec describeByType - sinon, il s'agit d'une page Web HTML lisible par l'homme.
    Exemple <"describedBy": "http://www.agency.gov/vegetables/schema.json">
    Domaine # distribution → décriteParType
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (type de média IANA)
    Notes d'utilisation Ceci est utilisé pour identifier le type de média (type de média IANA également connu sous le nom de type MIME) de l'URL utilisée pour le champ describeBy de la distribution. Ceci est particulièrement important si décrit par est un fichier lisible par machine.
    Exemple <"describedByType": "application/schema+json">
    Domaine # diffusion → description
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Cela devrait être une description lisible par l'homme de la distribution.
    Exemple
    Domaine # diffusion → format
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Il doit s'agir d'une description lisible par l'homme du format de fichier de l'ensemble de données, qui fournit des informations utiles qui pourraient ne pas être apparentes à partir de mediaType . Notez que l'API doit toujours être utilisée pour distinguer les API Web.
    Exemple
    Domaine # distribution → type de média
    Cardinalité (0,1)
    Obligatoire Oui, si le fichier est disponible en téléchargement public.
    Valeurs acceptées Chaîne (type de média IANA)
    Notes d'utilisation Cela doit décrire les fichiers exacts disponibles sur downloadURL en utilisant un type de média (type de média IANA également connu sous le nom de type MIME).Pour les fichiers Microsoft Office courants, consultez les types Office Open XML MIME
    Exemple <"mediaType":"text/csv">
    Domaine # diffusion → titre
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Cela devrait être un titre utile pour la distribution. Les acronymes doivent être évités.
    Exemple
    Domaine # identifiant
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Ce champ permet à des tiers de conserver un enregistrement cohérent pour les ensembles de données même si le titre ou les URL sont mis à jour. Les agences peuvent intégrer un système existant pour maintenir des identifiants uniques. Chaque identifiant doit être unique dans le catalogue de l'agence et rester fixe. Il est hautement recommandé qu'un URI (de préférence une URL HTTP) soit utilisé pour fournir un identifiant unique au monde. Les URL d'identifiant doivent être conçues et maintenues pour persister indéfiniment, que l'URL de la ressource elle-même change ou non.
    Exemple <"identifier":"http://dx.doi.org/10.7927/H4PZ56R2">
    Domaine # fait partie de
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Ce champ permet de regrouper plusieurs ensembles de données dans une « collection ». Ce champ doit être utilisé par les ensembles de données individuels qui forment ensemble une collection. La valeur de ce champ doit correspondre à l'identifiant de l'ensemble de données parent.
    Exemple <"isPartOf":"http://dx.doi.org/10.7927/H4PZ56R2">
    Domaine # Publié
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Date ISO 8601
    Notes d'utilisation Les dates doivent être ISO 8601 de moindre résolution. En d'autres termes, autant de AAAA-MM-JJThh:mm:ss.sTZD que pertinent pour cet ensemble de données.
    Exemple
    Domaine # mot-clé
    Cardinalité (1,n)
    Obligatoire Oui toujours
    Valeurs acceptées Tableau de cordes
    Notes d'utilisation Entourez chaque mot-clé de guillemets. Séparez les mots-clés par des virgules. Évitez les mots clés en double dans le même enregistrement.
    Exemple
    Domaine # page de destination
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Ce champ n'est pas destiné à la page d'accueil d'une agence (par exemple, www.agency.gov), mais plutôt si un ensemble de données a un hub ou une page de destination convivial vers lequel les utilisateurs peuvent être dirigés pour toutes les ressources liées à l'ensemble de données.
    Exemple <"landingPage":"http://www.agency.gov/vegetables">
    Domaine # Langue
    Cardinalité (0,n)
    Obligatoire Non
    Valeurs acceptées Tableau de cordes
    Notes d'utilisation Cela doit être conforme à la norme RFC 5646. Cette recherche de sous-étiquette de langue fournit un bon outil pour vérifier et vérifier les codes de langue. Une étiquette de langue est composée d'une ou de deux parties, la sous-étiquette de langue (comme en pour l'anglais, sp pour l'espagnol, wo pour le wolof) et la sous-étiquette régionale (comme US pour les États-Unis, GB pour la Grande-Bretagne, MX pour le Mexique ), séparés par un tiret. Les sous-étiquettes régionales ne doivent être fournies que lorsque cela est nécessaire pour distinguer une étiquette de langue d'une autre (comme l'anglais américain par rapport à l'anglais britannique).
    Exemple <"language":["en-US"]>ou si plusieurs langues,
    Domaine # Licence
    Cardinalité (0,1)
    Obligatoire Oui, le cas échéant
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Voir la liste des déclarations et des licences sans licence.
    Exemple <"license":"http://creativecommons.org/publicdomain/zero/1.0/">
    Domaine # modifié
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Date ISO 8601
    Notes d'utilisation Les dates doivent être ISO 8601 de la plus haute résolution. En d'autres termes, autant de AAAA-MM-JJThh:mm:ss.sTZD que pertinent pour cet ensemble de données. S'il est nécessaire de refléter que l'ensemble de données est continuellement mis à jour, le formatage ISO 8601 peut en tenir compte avec des intervalles répétés. Par exemple, R/P1D pour tous les jours, R/P2W pour toutes les deux semaines et R/PT5M pour toutes les cinq minutes.
    +Exemple <"modified":"2012-01-15">or <"modified":"R/P1D">
    Domaine # primaireITinvestissementUII
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation À utiliser pour lier un ensemble de données donné à son identifiant d'investissement unique informatique associé, qui se trouve souvent dans les documents de la pièce 53.
    Exemple
    Domaine # code de programme
    Cardinalité (0,n)
    Obligatoire Oui, pour les agences du gouvernement fédéral des États-Unis
    Valeurs acceptées Tableau de cordes
    Notes d'utilisation Fournissez un éventail de programmes liés à cet actif de données, à partir de l'inventaire des programmes fédéraux.
    Exemple <"programCode":["015:001"]>ou si plusieurs programmes,
    Domaine # éditeur
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Objet
    Notes d'utilisation Il s'agit d'un conteneur pour un objet éditeur qui regroupe les champs : name et subOrganization . Le champ subOrganization peut également contenir un objet éditeur qui permet de décrire la hiérarchie d'une organisation. Lorsqu'une plus grande spécificité est souhaitée, incluez autant de niveaux d'éditeurs que nécessaire, par ordre croissant, en utilisant le format ci-dessous.
    Exemple Voir ci-dessous
    Domaine # éditeur → @type
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (IRI)
    Notes d'utilisation Le type de métadonnées tel que défini par les types de données JSON-LD. Cela devrait être org:Organisation pour chaque éditeur
    Exemple
    Domaine # éditeur → nom
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Nom en clair de l'entité qui publie cet ensemble de données.
    Exemple
    Domaine # éditeur → subOrganizationOf
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées objet éditeur
    Notes d'utilisation Une entité organisationnelle parent décrite à l'aide des mêmes champs d'objet d'éditeur.
    Exemple "subOrganizationOf": <"name": "General Services Administration", "subOrganizationOf": <"name": "U.S. Government">>
    Domaine # les références
    Cardinalité (0,n)
    Obligatoire Non
    Valeurs acceptées Tableau de chaînes (URL)
    Notes d'utilisation Placez chaque URL dans des chaînes. Séparez plusieurs URL par une virgule.
    Exemple <"references":["http://www.agency.gov/legumes/legumes_data_documentation.html"]>or if multiple URLs, <"references":["http://www.agency.gov/legumes/legumes_data_documentation.html","http://www.agency.gov/fruits/fruit_data_documentation.html"]>
    Domaine # droits
    Cardinalité (0,1)
    Obligatoire Oui, si accessLevel est « restreint public » ou « non public »
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Cela peut inclure des informations concernant l'accès ou les restrictions basées sur la confidentialité, la sécurité ou d'autres politiques. Cela devrait également servir d'explication pour le « niveau d'accès » sélectionné, y compris des instructions sur la façon d'accéder à un fichier restreint, le cas échéant, ou une explication de la raison pour laquelle un actif de données « non public » ou « public restreint » n'est pas « public », si en vigueur. Si l'ensemble de données peut être mis à disposition indirectement via un site Web, utilisez accessURL pour l'URL qui fournit un tel accès.
    Exemple
    Domaine # spatial
    Cardinalité (0,1)
    Obligatoire Oui, si le jeu de données est spatial
    Valeurs acceptées Voir les notes d'utilisation
    Notes d'utilisation Ce champ doit contenir l'un des types de contenu suivants : (1) une boîte de coordonnées englobantes pour l'ensemble de données représenté en paires latitude/longitude où les coordonnées sont spécifiées en degrés décimaux et dans l'ordre suivant : longitude minimale, latitude minimale, longitude maximale , latitude maximale (2) une paire latitude/longitude (en degrés décimaux) représentant un point où le jeu de données est pertinent (3) une entité géographique exprimée en langage de balisage géographique à l'aide du profil d'entités simples ou (4) une entité géographique des GeoNames base de données.
    Exemple
    Domaine # systemOfRecords
    Cardinalité (0,1)
    Obligatoire Non
    Valeurs acceptées Chaîne (URL)
    Notes d'utilisation Ce champ doit être une URL vers le System of Records Notice (SORN) qui se rapporte à l'ensemble de données, en particulier à partir de FederalRegister.gov.
    Exemple <"systemOfRecords":"https://www.federalregister.gov/articles/2002/04/08/02-7376/privacy-act-of-1974-publication-in-full-of-all-notices-of-systems-of-records-including-several-new#p-361">
    Domaine # temporel
    Cardinalité (0,1)
    Obligatoire Oui, le cas échéant
    Valeurs acceptées Date ISO 8601
    Notes d'utilisation Ce champ doit contenir un intervalle de temps défini par les dates de début et de fin pour lesquelles l'ensemble de données est applicable. Les dates doivent être formatées sous forme de paires de au format ISO 8601. ISO 8601 spécifie que les dates-heures peuvent être formatées de plusieurs manières, y compris une simple année à quatre chiffres (par exemple 2013) à un AAAA-MM-JJTHH:MM:SSZ beaucoup plus spécifique, où le T spécifie un séparateur entre la date et l'heure et l'heure sont exprimées en notation 24 heures dans le fuseau horaire UTC (zoulou). (par exemple, 2011-02-14T12:00:00Z/2013-07-04T19:34:00Z). Utilisez un solidus ("/") pour séparer les heures de début et de fin. S'il est nécessaire de définir le début ou la fin de l'applicabilité en utilisant une durée plutôt qu'une date, le formatage ISO 8601 peut en tenir compte avec des intervalles basés sur la durée. Par exemple, l'applicabilité commençant en janvier 2010 et se poursuivant pendant un mois pourrait être représentée par 2010-01/P1M ou 2010-01/2010-02 . Cependant, lorsque cela est possible, les dates complètes sont préférées pour les heures de début et de fin.
    Exemple <"temporal":"2000-01-15T00:45:00Z/2010-01-15T00:06:00Z">or <"temporal":"2000-01-15T00:45:00Z/P1W">
    Domaine # thème
    Cardinalité (0,n)
    Obligatoire Non
    Valeurs acceptées Tableau de cordes
    Notes d'utilisation Séparez plusieurs catégories par une virgule. Pourrait inclure des catégories de sujets ISO.
    Exemples <"theme":["légumes"]>ou si plusieurs catégories,
    Domaine # Titre
    Cardinalité (1,1)
    Obligatoire Oui toujours
    Valeurs acceptées Chaîne de caractères
    Notes d'utilisation Les acronymes doivent être évités.
    Exemple

    Domaines du gouvernement fédéral

    USG — Les champs spécifiques au gouvernement fédéral des États-Unis ont été signalés par l'exposant USG. Le schéma de données ouvertes du projet a été développé dans le cadre d'une politique de données ouvertes du gouvernement fédéral américain. Cependant, tous les efforts ont été déployés pour aligner le schéma sur les normes internationales existantes et pour offrir des opportunités de réutilisation et d'interopérabilité avec les gouvernements étatiques et locaux ainsi qu'avec les organisations à but non lucratif, les établissements universitaires et les entreprises. Cependant, certains champs ont été introduits spécifiquement pour être utilisés par le gouvernement fédéral des États-Unis et ont une signification particulière dans ce contexte. Ces champs sont : bureauCode, code de programme, qualité des données, primaireITinvestissementUII, et systemOfRecords. Les éditeurs de données non fédéraux sont encouragés à utiliser ce schéma, mais ces champs ne doivent pas être considérés comme obligatoires et peuvent ne pas être pertinents pour ces entités.

    Justification de la nomenclature des métadonnées

    Nous avons cherché à être indépendants de la plate-forme et à nous aligner autant que possible sur les normes ouvertes existantes.

    À cette fin, nos noms de clé JSON sont directement tirés de DCAT, à quelques exceptions près.

    Nous avons ajouté le niveau d'accès pour aider à trier facilement les ensembles de données dans nos trois catégories existantes : public, public restreint et non public. Ce champ signifie qu'une agence peut exécuter un filtre de base sur son catalogue de données d'entreprise pour générer une liste publique d'ensembles de données qui sont, ou pourrait être un jour, mis à la disposition du public (ou, dans le cas de données restreintes, disponibles sous certaines conditions). Ce champ permet également à quiconque de générer facilement une liste d'ensembles de données qui pouvait être mis à disposition mais n'ont pas encore été diffusés par filtrage niveau d'accès à Publique et URL d'accès à Vide.

    Nous avons ajouté le droits domaine (anciennement accessNiveauCommentaire) pour que les gestionnaires de données expliquent comment accéder à des ensembles de données publics restreints, et pour que les agences aient un endroit pour enregistrer (même si ce n'est qu'en interne) la raison de ne pas publier un ensemble de données non public.

    Nous avons ajouté le systemOfRecords champ pour que les gestionnaires de données puissent éventuellement créer un lien vers une URL de notification du système d'enregistrements pertinente. Un système d'enregistrements est un groupe de tous les enregistrements sous le contrôle de toute agence à partir de laquelle des informations sont récupérées par le nom de l'individu ou par un numéro d'identification, un symbole ou un autre identifiant attribué à l'individu.

    Nous avons ajouté le bureauCode champ pour s'assurer que chaque ensemble de données est connecté de manière standard avec un bureau d'agence.

    Nous avons ajouté le code de programme champ pour s'assurer que, le cas échéant, chaque ensemble de données est connecté de manière standard avec un bureau de programme d'agence.

    Nous avons ajouté le qualité des données pour indiquer si les données satisfont ou non aux directives de qualité de l'information d'une agence.


    Données géospatiales

    Cette feuille de calcul répertorie tous les projets de photographie aérienne post-incendie pilotés par la région du sud-ouest. Avec des projets remontant à 1972, cette imagerie constitue un enregistrement important de l'étendue et des dommages du feu. Les caractéristiques géospatiales décrivant les centres de photos et les empreintes de ces projets sont accessibles dans le service d'entités de photographie aérienne historique ci-dessus, et les images peuvent être demandées auprès du bureau de terrain de la photographie aérienne.

    Caractéristiques construites (Région du sud-ouest)

    Unités d'intervention écologique (Région du Sud-Ouest)

    Unités d'intervention écologique (Version 5.3)

    Unités de réponse écologique - Le but de cette classe d'entités est d'être un outil de cartographie des écosystèmes dans tout l'Arizona et le Nouveau-Mexique.

    Les unités d'intervention écologique (URE) facilitent les analyses et la planification du paysage. Le cadre représente tous les principaux types d'écosystèmes de la région du sud-ouest et représente une stratification des thèmes biophysiques. Les URE sont utilisées pour définir les conditions historiques/de référence au sein d'une unité cartographique en intégrant le potentiel du site (propriétés physiques et chimiques du sol, géologie, géomorphologie, aspect, pente, variables climatiques et situation géographique), le régime des feux (historique et contemporain), la végétation voisine communautés et séquence d'états séquentiels.

    Les données du fichier de formes sont divisées en quatre mosaïques : Arizona Nord, Arizona Sud, Nouveau-Mexique Nord, Nouveau-Mexique Sud. Voir un exemple d'image des emplacements des tuiles

    Évaluation de la vulnérabilité au changement climatique

    Santé des forêts - Maladie des insectes (Région du sud-ouest)

    Ordres forestiers (Région du Sud-Ouest)

    Publié en tant que service de carte Quotidien

    Carte de l'ordre forestier. Les arrêtés forestiers sont des zones de la forêt où l'entrée ou l'utilisation est restreinte pour des raisons de sécurité et/ou de protection des ressources.

    Le titre 36, Code of Federal Regulations, Chapter II, Subpart B, peut fermer une zone à l'entrée ou peut restreindre l'utilisation d'une zone en appliquant tout ou partie des interdictions autorisées par le code of Regulations.

    Planification forestière (forêt individuelle)

    Zone de gestion Apache Sitgreaves 2015

    L'objectif de cette classe d'entités est de représenter et d'étiqueter une zone terrestre contiguë dans l'espace identifiée dans une zone de planification (la limite administrative). La classe d'entités sera utilisée pour fournir des informations de planification pour toute analyse nécessaire.

    Relevé général des écosystèmes terrestres (région du sud-ouest)

    Enquête générale sur les écosystèmes terrestres

    Enquête générale sur les écosystèmes terrestres - (United States Forest Service Région Sud-Ouest)

    L'ensemble de données est composé d'entités polygonales indiquant l'état du sol, le risque d'érosion, le potentiel de revégétalisation et la couverture végétale. L'échelle est de 1:250000. Cet ensemble de données a été créé pour l'enquête générale sur les écosystèmes terrestres de l'USFS. Son objectif est de délimiter les emplacements et les zones des différentes caractéristiques du GTES.

    Invasive (Région du Sud-Ouest)

    La classe d'entités Plantes envahissantes, invertébrés, pathogènes et vertébrés (envahissants) contient tous les polygones d'infestations envahissantes collectés par le National Invasive Plant Inventory Protocol. Comprend les observations les plus récentes ainsi que les observations historiques. Comprend l'ID du site, le code de la plante, le statut, etc. pour l'espèce infestante, la date, la zone et d'autres données de base.

    Cet ensemble de données à l'heure actuelle est principalement composé de plantes.

    Terre (Région du Sud-Ouest)

    Autre zone nationale désignée

    PLSS - Système d'arpentage public

    Section - Une zone définie par la grille du système d'arpentage des terres publiques. Normalement, 36 sections forment un canton.

    Canton - Une zone définie par la grille du système d'arpentage des terres publiques qui est référencée par ses numéros de niveau et de rang, et est normalement un rectangle d'environ 6 milles de côté avec des limites conformes aux méridiens et aux parallèles.

    Zone de gestion d'intérêt spécial

    Dissolution de la propriété de surface

    Loisirs (Région du Sud-Ouest)

    Point de site de loisirs et polygone de site de loisirs

    Représente des sites de loisirs aménagés, un début de sentier, une pêche, une aire de pique-nique, un terrain de camping

    Paramètres d'opportunité de loisirs

    Représente l'emplacement spatial des zones montrant le type de paramètres d'opportunités de loisirs qui existent (condition existante) soit sans déplacement ni utilisation sur la neige (saison estivale) ou toute l'année lorsqu'aucune variation saisonnière n'existe.

    RMU - Unités de gestion des parcours (Région du Sud-Ouest)

    RMU_Unit, RMU_SubUnit, RMU_WHB

    RMU_Unit (Allotments) - Représente les limites de la zone de gestion du pâturage brut (allotissement), les limites des zones de ressources générales de l'aire de répartition et les limites des territoires des chevaux sauvages.

    RMU_SubUnit (Pâturages) - Représente les limites de la zone de surveillance de la mise en œuvre du pâturage dans chaque pâturage.

    RMU_WHB (Zones Wild Horse et Burro) - Représente les zones Wild Horse et Burro

    Inventaire des unités écologiques terrestres (Région du sud-ouest)

    EVP, Unité Écologique Terrestre

    Inventaire des unités écologiques terrestres. Végétation naturelle potentielle et classe de sol. La classe d'entités Végétation, sol, géologie (LT_MapCompVegSoilGeology) de composant de carte de type de terre contient des informations de classification pour la végétation (potentielle et existante), le sol, la géologie, la géomorphologie, les types écologiques et diverses classifications. Les classifications sont affichées par ordre de dominance pour chaque type (PNV, sol, etc.) ainsi que le pourcentage basé sur l'agrégation des pourcentages réels des composants (les valeurs nulles sont traitées comme 0). S'il existe plusieurs classifications par composant, ce pourcentage de composant est divisé par le nombre de classifications associées à ce composant, puis ce pourcentage est agrégé jusqu'à l'unité de la carte. Carte Symbole Comp PCt Classe de végétation 22 1 45 VegClass1 22 2 30 Vegclass2 22 3 25 Vegclass1 Classe de végétation agrégée Vegclass1 - 70 PCt Vegclass2 - 30 PCt

    Transport (Région du Sud-Ouest)

    Données MVUM (Motor Vehicle Use Map)

    Données des cartes d'utilisation des véhicules motorisés (MVUM), ces cartes MVUM sont valides à compter de la date de publication et ont été désignées comme ouvertes aux véhicules motorisés en vertu de la règle de gestion des déplacements (36 CFR 212, sous-partie B, désignation des routes, des sentiers et des zones pour l'utilisation des véhicules à moteur). Les itinéraires non réservés à l'usage des véhicules à moteur (comme les sentiers non motorisés, les routes et sentiers à usage unique, les routes et sentiers non autorisés et les routes et sentiers temporaires) ne sont pas inclus.

    Types spécifiques de véhicules motorisés autorisés sur les routes/sentiers désignés et leurs saisons d'utilisation. Ces données représentent les classes de symboles de routes et de sentiers suivantes : Ouvert à tous les véhicules, Ouvert aux véhicules autorisés sur la route et Routes à désignations saisonnières.

    MVUM (Motor Vehicle Use Map) Cartes téléchargeables

    Végétation (Région du Sud-Ouest)

    INREV (Institut OSU Ressources Naturelles Végétation Existante)

    La cartographie de la végétation existante fournit des informations de base sur l'état actuel de la structure et de la composition de la végétation. À partir de 2004, la région du sud-ouest a élaboré une cartographie de la végétation existante à échelle moyenne sur toutes les forêts et prairies nationales (Mellin et al. 2008). La région du Sud-Ouest a collaboré avec l'Institut des ressources naturelles de l'OSU pour développer une nouvelle cartographie à moyenne échelle avec le projet INREV. La cartographie à mi-échelle est conforme aux directives techniques de l'agence pour la végétation existante (Brohman et Bryant 2005, Nelson et al. 2015). Pour les besoins commerciaux des organisations de ressources naturelles, la cartographie de la végétation existante représente un élément important dans un cadre global d'inventaire, de surveillance et d'analyse.

    Unités cartographiques de couverture végétale existantes à mi-échelle

    La canopée couvre les unités cartographiques d'arbres pour les polygones de forme de vie arborescente ou d'arbustes pour les polygones de forme de vie arbustive.Le programme de cartographie de la végétation existante de la région du Sud-Ouest (R3-EVP) est destiné à répondre aux besoins des révisions des plans forestiers, de la planification nationale des incendies et d'autres analyses au niveau du paysage en fournissant un ensemble de données cohérent à l'échelle de la région qui décrit la végétation existante à mi-parcours. niveau d'échelle.

    Unités cartographiques du type de dominance de la végétation existante à échelle moyenne

    Polygones de type dominance dans les unités de la carte. Les types de dominance sont définis par les espèces ou les genres les plus abondants, généralement ceux de la canopée la plus élevée de la communauté végétale. Le programme de cartographie de la végétation existante de la région du Sud-Ouest (R3-EVP) est destiné à répondre aux besoins des révisions des plans forestiers, de la planification nationale des incendies et d'autres analyses au niveau du paysage en fournissant un ensemble de données cohérent à l'échelle de la région qui décrit la végétation existante à mi-parcours. niveau d'échelle.

    Forme de vie de la végétation existante à mi-échelle

    Polygones représentant la forme de vie dominante. Le programme de cartographie de la végétation existante de la région du Sud-Ouest (R3-EVP) est destiné à répondre aux besoins des révisions des plans forestiers, de la planification nationale des incendies et d'autres analyses au niveau du paysage en fournissant un ensemble de données cohérent à l'échelle de la région qui décrit la végétation existante à mi-parcours. niveau d'échelle.

    Unités cartographiques de taille de végétation existantes à mi-échelle

    Unité cartographique de classe de diamètre des arbres dominants pour les polygones de forme de vie arborescente ou classe de hauteur d'arbuste pour les polygones de forme de vie arbustive. Le programme de cartographie de la végétation existante de la région du Sud-Ouest (R3-EVP) est destiné à répondre aux besoins des révisions des plans forestiers, de la planification nationale des incendies et d'autres analyses au niveau du paysage en fournissant un ensemble de données cohérent à l'échelle de la région qui décrit la végétation existante à mi-parcours. niveau d'échelle.

    Végétation existante riveraine​

      (10x) 16,8 Mo (10x) 8,9 Mo (10x) 10,0 Mo (10x) 6,5 Mo (10x) 8,8 Mo (10x) 25,1 Mo (10x) 5,5 Mo (10x) 3,3 Mo (10x) 10,9 Mo (10x) 8,4 Mo (10x) 16,6 Mo

    Cette classe d'entités contient des informations attributaires provenant de quatre cartes de végétation différentes (type de forme de vie, type de rétention des feuilles, couvert végétal et classe de taille) et des statistiques sur le NDVI et le lidar.

    Pour ce projet, la hauteur de la canopée et les données de couverture ont été dérivées des données lidar trouvées dans la forêt nationale de Prescott et utilisées pour cartographier la taille des arbres. Le lidar et d'autres variables prédictives issues de l'imagerie ont été utilisés pour segmenter la zone d'étude en objets présentant des caractéristiques similaires à utiliser dans la cartographie de la végétation. Les attributs de cartographie de la végétation ont ensuite été ajoutés à chaque segment tel que classé par le classificateur Random Decision Forest. Une zone tampon de 20 mètres à partir de la limite du RMAP a été créée comme zone d'étude. Deux produits finaux sont présentés, ce produit qui a été découpé à la limite du RMAP avec des caractéristiques cartographiques conçues pour répondre à une taille minimale de 0,25 hectare et un second qui comprend la zone tampon de 20 mètres et n'a pas d'unité cartographique minimale.

    Végétation potentielle riveraine​

    Végétation potentielle riveraine - Communautés végétales riveraines potentielles dans les forêts et les prairies de la région sud-ouest du US Forest Service. La végétation potentielle riveraine est dérivée de la couche des unités de réponse écologique (URE).

    Les unités d'intervention écologique (URE) facilitent les analyses et la planification du paysage. Le cadre représente tous les principaux types d'écosystèmes de la région du sud-ouest et représente une stratification des thèmes biophysiques. Les URE sont utilisées pour définir les conditions historiques/de référence au sein d'une unité cartographique en intégrant le potentiel du site (propriétés physiques et chimiques du sol, géologie, géomorphologie, aspect, pente, variables climatiques et situation géographique), le régime des feux (historique et contemporain), la végétation voisine les communautés et la séquence d'états en série.

    Périmètres de feux de forêt (région du sud-ouest)

    Occurrences de l'historique des incendies (points) et périmètres (polygones)

    La couche de points FireOccurrence représente les points d'allumage à partir desquels les incendies de forêt individuels ont commencé. Les données sont conservées au niveau de la forêt/du district, ou leur équivalent, pour suivre l'occurrence et l'origine des incendies de forêt individuels. Les enregistrements dans FireOccurrence incluent des enregistrements historiques de points d'incendie provenant de diverses sources. Depuis 1986, FIRESTAT, l'application informatique du système de statistiques sur les incendies, est la source de données faisant autorité pour tous les incendies de forêt sur les terres du système forestier national ou les terres forestières nationales protégées. FIRESTAT est utilisé par l'USFS pour saisir et conserver les informations du rapport individuel sur les incendies de forêt (FS-5100-29).

    La couche de polygones FirePerimeter représente les périmètres de feux de forêt cartographiés finaux. Des incidents de 10 acres ou plus sont attendus. Les incidents de moins de 10 acres peuvent également être inclus. Les données sont conservées au niveau de la forêt/du district, ou leur équivalent, pour suivre la zone touchée par les feux de forêt. Les enregistrements dans FirePerimeter incluent les périmètres pour les feux de végétation qui ont des enregistrements correspondants dans FIRESTAT, qui est la source de données faisant autorité pour tous les rapports sur les feux de végétation. FIRESTAT, l'application informatique du système de statistiques sur les incendies, requise par l'USFS pour tous les incendies de forêt sur les terres du système forestier national ou les terres protégées par les forêts nationales, est utilisée pour saisir et conserver les informations du rapport individuel sur les incendies (FS-5100-29).

    Périmètres de feu de forêt > 100 acres

    Zones d'interface urbaine sauvage (WUI) (région du sud-ouest)

    Zones d'interface urbaine sauvage (WUI) adjacentes aux terres du service forestier dans la région sud-ouest du service forestier

    Faune (région du sud-ouest)

    Ensembles de données forestières héritées

    Liens vers l'ensemble de données SIG hérité sur les pages Web individuelles de la forêt. Nous sommes en train de mettre à jour notre site Web et de transférer des données vers cette page régionale à partir des pages Forest.


    Monde

    Portails


      Liens vers les anciennes cartes (scans) mondiales, nationales et de la FAO, ainsi que les profils et rapports des sols, la dégradation des sols, la gestion, la biodiversité.

      Scans des anciennes cartes du monde entier, téléchargeables (et sur CD-ROM) et avec métadonnées. Pour être utilisables dans le SIG, ceux-ci doivent être géoréférencés, le dessin au trait numérisé et une base de données d'attributs liée créée. Référence : Panagos, P., Jones, A., Bosco, C., Senthil Kumar P.S. (2011) : Archives numériques européennes sur les cartes des sols (EuDASM) : conservation des données importantes sur les sols pour un accès public gratuit. Journal international de la Terre numérique 4(5) : 434-443. DOI : 10.1080/17538947.2011.596580. Une collection élargie de cartes pédologiques numérisées est disponible en ligne sur l'ISRIC.

      Collecte des ensembles de données des centres de données mondiaux et autres. L'ISRIC est un contributeur. La requête de « carte des sols » renvoie > 2 600 ensembles de données.

      Un courtier de données pour trouver des ensembles de données. Les termes de recherche incluent les propriétés du sol, l'humidité et la température du sol, la chimie du sol, le C du sol. Peut filtrer la recherche par pays/géographie et conditions d'accès aux données.
  • Catalogue des ensembles de données de paramètres du sol du Global Change Master Directory hébergé par Goddard Space Flight Center (NASA). Un très grand catalogue (plus de 1000 liens) de paramètres du sol (par exemple C, CEC, bilan thermique, macrofaune. ) avec des liens vers les données et métadonnées actuelles
    du Distributed Active Archive Center for Biogeochemical Dynamics du Oak Ridge National (USA) Laboratory destiné à la modélisation globale de la biogéochimie.
    du Consortium international de modélisation des sols (ISMC).
    Collections pertinentes pour la modélisation des processus du sol : hydrologie, physique des sols, pédogenèse. à des échelles allant du macropore au continental.
    accès aux données, depuis ISCN
    "un réseau scientifique qui facilite le partage de données, assemble des bases de données, identifie les lacunes dans la couverture des données et permet des évaluations spatialement explicites du carbone du sol dans le contexte du paysage, du climat, de l'utilisation des terres et des variables biotiques".
    (NCSCDv2), un ensemble de données spatiales créé dans le but de quantifier le stockage de carbone organique dans les sols de la région du pergélisol circumpolaire nord, du Centre Bolin de l'Université de Stockholm. Comprend des points téléchargeables (jusqu'à 3 m), des grilles et des polygones de stocks de C.
    10.1029/2019MS001784
    La méthode est expliquée dans cet article.
  • Polygones

    Grilles


      Comprend les propriétés de Open Land Map, la grille des sols et des paysages d'Australie, les données mondiales d'humidité du sol SMAP améliorées de la NASA-USDA. D'autres jeux de données sont régulièrement ajoutés.

      Ensembles de données GEE non officiels, fournis par "la communauté" des données ouvertes. Voir l'onglet "Géophysique". Comprend Geomorpho90, Soil Grids 250 v2.0, iSDAsoil Predicted Soil Properties for Africa 30m, Polaris 30m Probabilistic Soil Properties US, HiHydroSoil v2.0, Soil Organic Carbon Stocks & Trends South Africa. D'autres jeux de données sont régulièrement ajoutés.
      depuis OpenGeoHub
      « Accès et visualisations interactives des téraoctets de données haute résolution (1 km, 250 m ou mieux) produites par la Fondation OpenGeoHub et/ou les organisations participantes."
      Recherchez dans le panneau « Thèmes et ensembles de données » pour « Propriétés et classes du sol ». Celles-ci sont produites par des méthodes d'apprentissage automatique basées sur un grand nombre d'observations ponctuelles et de couches de covariables, comme expliqué ici.
      de la FAO, développé à l'origine par l'IIASA avec les contributions de nombreux partenaires, notamment l'ISRIC et l'Académie chinoise des sciences.

    La base de données mondiale harmonisée sur les sols est une base de données raster de 30 secondes d'arc avec plus de 15 000 unités de cartographie des sols différentes qui combine les mises à jour régionales et nationales existantes des informations sur les sols dans le monde (SOTER, ESD, carte des sols de Chine, WISE) avec les informations contenues dans le 1 :5 000 000 échelle FAO-UNESCO Carte des sols du monde (FAO, 1971--1981).

    Points


      Principalement aux États-Unis, mais comprend des données analytiques pour environ 1 100 pédons d'autres pays. Le lien ci-dessus décrit l'ensemble de données qu'il peut être téléchargé à partir de la page Base de données de caractérisation des sols du NCSS.

      Du projet OpenLandMap. Points collectés à partir de diverses sources, fournis sous licence de données ouvertes, avec des instructions détaillées sur la façon d'utiliser les données. Sources de données et formats expliqués ici. Deux ensembles : propriétés chimiques et physiques.
      HC27 : Profils de sol génériques/prototypiques
      27 profils de sols générés dans des formats compatibles avec les modèles de simulation de cultures DSSAT et APSIM. N'étant pas un ensemble géoréférencé, les modélisateurs doivent décider lequel des profils génériques utiliser, sur la base de cartes pédologiques ou d'enquêtes sur le terrain. Développé par l'IFPRI
      Cartes numérisées, avec métadonnées, de la collection ISRIC, traitées par le Bureau européen des sols. Qualité inégale, couverture inégale, mais une mine d'or de cartes historiques. DVD-ROM séparé et accès en ligne pour l'Afrique, l'Asie, le Canada, les Caraïbes, l'Europe, l'Amérique latine et les États-Unis. Référence : Panagos, P., Jones, A., Bosco, C., Senthil Kumar P.S. (2011) : Archives numériques européennes sur les cartes des sols (EuDASM) : conservation des données importantes sur les sols pour un accès public gratuit. Journal international de la Terre numérique 4(5) : 434-443. DOI : 10.1080/17538947.2011.596580
      de l'Université de Cranfield (Angleterre)
      « [A]n archive et catalogue de toutes les études de sol, rapports et cartes substantiels réalisés à l'étranger, avec une référence particulière à celles des entreprises et du personnel britanniques, afin de fournir un référentiel sûr pour les copies en danger et de rendre les informations accumulées largement disponibles pour consultation par les parties intéressées.". Les documents sont numérisés comme demandé, et s'ils sont numérisés gratuitement pour le téléchargement. Excellentes métadonnées et interface de recherche sur 23 000 articles catalogués.
      De Tom Hengl à OpenGeoHub. "Un recueil public d'échantillons de sol mondiaux, régionaux, nationaux et infranationaux et/ou d'ensembles de données de profil de sol (points avec observations et mesures des propriétés et caractéristiques du sol).

    Trouver des ensembles de données pour les événements actuels peut être délicat. Heureusement, certaines publications ont commencé à publier les ensembles de données qu'elles utilisent dans leurs articles.

    Agrégateurs :

      - FiveThirtyEight est un site d'actualités et de sport avec des articles basés sur des données. Ils rendent leurs ensembles de données librement disponibles sur Github. - BuzzFeed est devenu (in) célèbre pour ses listes et ses articles superficiels, mais ils se sont depuis étendus au journalisme d'investigation. Leurs jeux de données sont disponibles sur Github.