Suite

Où trouver des polygones administratifs L-2 sous licence ouverte ?

Où trouver des polygones administratifs L-2 sous licence ouverte ?


NaturalEarth fournit des fichiers de formes L-0 (pays) et L-1 (sous-division), mais pas de fichiers de formes L-2 (sous-sous-division).

GADM.org fournit des données L0 à L-5 et a une assez bonne couverture pour les fichiers de formes L-2 (sous-sous-division).

mais il est interdit pour un usage commercial.

Où puis-je trouver des polygones administratifs L-2 avec une couverture mondiale quasi similaire sous licence ouverte ?


Un utilisateur allemand a mis en place un service de visualisation et d'export des frontières au sein du projet OpenStreetmap :

https://osm.wno-edv-service.de/boundaries/

Cliquer sur le nœud du pays à gauche ouvrira les sous-niveaux.

Notez qu'OSM compte les niveaux un peu différemment : OSM-level 2 est GADM-level 0

Les données OSM peuvent être utilisées commercialement, tant que vous mentionnez d'où proviennent les données.


SIG et cartes

Identifiez votre quartier de mairie en tapant votre adresse.

Déterminez la juridiction d'un lieu en recherchant une adresse ou un nom de rue.

Le profil de la propriété répond aux questions sur les propriétés spécifiées et les règlements d'aménagement au sein de la ville. Avec Property Profile, vous pouvez rechercher des informations, voir des images aériennes, y compris des vues de rue, créer des cartes personnalisées, télécharger des données et exécuter un rapport détaillant les informations sur une propriété spécifiée.

Une carte interactive où vous pouvez trouver un parc, un sentier ou les parcs et installations de loisirs les plus proches.

Validez les informations sur le zonage, les cas de zonage, les ordonnances de zonage, les superpositions de zonage, l'utilisation future des terres et le plan de réglementation associés à une propriété.

Portail des pannes client. Affiche l'emplacement et la gravité des pannes de courant dans la ville.

Découvrez dans quel bassin versant vous vivez.

La carte de rachat de l'atténuation des inondations fournit l'état des activités de rachat de l'atténuation des inondations dans la ville d'Austin.

Contient une variété d'informations utiles sur les inondations à Austin.

Cette carte Web aidera l'utilisateur à avoir une meilleure idée de l'activité criminelle dans les zones d'Austin, dans l'espoir que l'utilisateur sera en mesure de prendre une décision plus éclairée sur la destination souhaitée.

Cette application est une carte Web adaptée aux mobiles pour les incidents criminels. Il aide le public à avoir une meilleure idée de l'activité criminelle dans sa région afin qu'il puisse prendre des décisions plus éclairées sur la façon de rester en sécurité.

La référence de style cartographique de la ville d'Austin est un guide complet qui détaille les propriétés de conception de la majorité des couches contenues dans le SIG de la ville. Le guide lui-même est une application html légère qui lit un fichier de configuration et affiche les propriétés de style de tout service de carte répertorié dans

Avertissement

Les produits ci-dessus sont à titre informatif et peuvent ne pas avoir été préparés ou ne pas convenir à des fins juridiques, d'ingénierie ou d'arpentage.
Ils ne représentent pas une enquête sur le terrain et ne représentent que l'emplacement relatif approximatif des limites de propriété.
Ces produits ont été fabriqués par la ville d'Austin dans le seul but de référence géographique.
Aucune garantie n'est donnée par la ville d'Austin concernant l'exactitude ou l'exhaustivité spécifique.


Qu'est-ce que le SIG ?

C'est probablement la question la plus posée aux personnes dans le domaine des systèmes d'information géographique (SIG) et c'est probablement la plus difficile à répondre de manière succincte et claire.

Le SIG est un domaine technologique qui incorpore des caractéristiques géographiques avec des données tabulaires afin de cartographier, d'analyser et d'évaluer les problèmes du monde réel. Le mot clé de cette technologie est Géographie - cela signifie que les données (ou au moins une partie des données) sont spatiales, en d'autres termes, des données qui sont en quelque sorte référencées à des emplacements sur la terre. Ces données sont généralement associées à des données tabulaires appelées données d'attribut. Les données d'attributs peuvent généralement être définies comme des informations supplémentaires sur chacune des caractéristiques spatiales. Un exemple de ceci serait les écoles. L'emplacement réel des écoles est les données spatiales. Des données supplémentaires telles que le nom de l'école, le niveau d'éducation enseigné, la capacité des élèves constitueraient les données d'attribut. C'est le partenariat de ces deux types de données qui permet au SIG d'être un outil de résolution de problèmes aussi efficace grâce à l'analyse spatiale.

Le SIG fonctionne à plusieurs niveaux. Au niveau le plus élémentaire, le SIG est utilisé comme cartographie informatique, c'est-à-dire cartographie. La véritable puissance du SIG réside dans l'utilisation de méthodes spatiales et statistiques pour analyser les attributs et les informations géographiques. Le résultat final de l'analyse peut être des informations dérivées, des informations interpolées ou des informations hiérarchisées.

D'autres citations pour répondre « Qu'est-ce que le SIG ? »

« Au sens strict, un SIG est un système informatique capable d'assembler, de stocker, de manipuler et d'afficher des informations référencées géographiquement, c'est-à-dire des données identifiées en fonction de leur localisation. Les praticiens considèrent également que le SIG total comprend le personnel d'exploitation et les données qui entrent dans le système. USGS

Un système d'information géographique (SIG) est un outil informatique permettant de cartographier et d'analyser les choses qui existent et les événements qui se produisent sur terre. La technologie SIG intègre des opérations de base de données courantes telles que les requêtes et l'analyse statistique avec les avantages uniques de visualisation et d'analyse géographique offerts par les cartes. ESRI

« Le SIG est un système intégré de matériel informatique, de logiciels et de personnel qualifié reliant les données topographiques, démographiques, utilitaires, d'installation, d'image et d'autres ressources qui sont référencées géographiquement. » NasaLe SIG a déjà affecté la plupart d'entre nous d'une manière ou d'une autre sans même que nous nous en rendions compte. Si vous avez déjà utilisé un programme de cartographie Internet pour trouver des directions, félicitations, vous avez personnellement utilisé le SIG. La nouvelle chaîne de supermarchés du coin a probablement été localisée à l'aide d'un SIG pour déterminer l'endroit le plus efficace pour répondre à la demande des clients.

Composants du SIG

La prochaine étape pour comprendre le SIG consiste à examiner chaque composant du SIG et comment ils fonctionnent ensemble. Ces composants sont :

Matériel

Le matériel comprend l'équipement nécessaire pour prendre en charge les nombreuses activités du SIG allant de la collecte de données à l'analyse des données. La pièce maîtresse de l'équipement est le poste de travail, qui exécute le logiciel SIG et est le point d'attache pour l'équipement auxiliaire. Les efforts de collecte de données peuvent également nécessiter l'utilisation d'un numériseur pour la conversion de données papier en données numériques et d'un enregistreur de données GPS pour collecter des données sur le terrain. L'utilisation de la technologie de terrain portable devient également un outil important de collecte de données dans les SIG. Avec l'avènement du SIG basé sur le Web, les serveurs Web sont également devenus un élément important de l'équipement du SIG.

Logiciel

Différents progiciels sont importants pour les SIG. Le package d'application SIG est au centre de tout cela. Un tel logiciel est essentiel pour créer, éditer et analyser des données spatiales et attributaires. Par conséquent, ces progiciels contiennent une myriade de fonctions SIG qui leur sont inhérentes. Les extensions ou modules complémentaires sont des logiciels qui étendent les capacités du progiciel SIG. Le logiciel SIG composant est l'opposé du logiciel d'application. Component GIS cherche à créer des applications logicielles qui répondent à un objectif spécifique et sont donc limitées dans leurs capacités d'analyse spatiale. Les utilitaires sont des programmes autonomes qui remplissent une fonction spécifique. Par exemple, un utilitaire de format de fichier qui convertit un type de fichier SIG en un autre. Il existe également un logiciel SIG Web qui permet de diffuser des données via des navigateurs Internet.

Les données sont au cœur de tout SIG. Il existe deux principaux types de données utilisées dans le SIG. Une géodatabase est une base de données qui est en quelque sorte référencée à des emplacements sur la terre. Les géodatabases sont regroupées en deux types différents : vecteur et raster. Les données vectorielles sont des données spatiales représentées sous forme de points, de lignes et de polygones. Les données raster sont des données cellulaires telles que l'imagerie aérienne et les modèles d'élévation numériques. Ces données sont généralement associées à des données appelées données d'attributs. Les données d'attributs sont généralement définies comme des informations supplémentaires sur chaque entité spatiale hébergée sous forme de tableau. La documentation des jeux de données SIG est connue sous le nom de métadonnées. Les métadonnées contiennent des informations telles que le système de coordonnées, quand les données ont été créées, quand elles ont été mises à jour pour la dernière fois, qui les a créées et comment les contacter et des définitions pour toutes les données d'attribut de code.

Gens

Des personnes bien formées connaissant l'analyse spatiale et qualifiées dans l'utilisation des logiciels SIG sont essentielles au processus SIG. Il y a trois facteurs à la composante des personnes : l'éducation, le cheminement de carrière et le réseautage. La bonne éducation est la clé pour la bonne combinaison de cours. Il est important de sélectionner le bon type de travail SIG. Une personne hautement qualifiée en analyse SIG ne devrait pas chercher un emploi en tant que développeur SIG si elle n'a pas suivi les cours de programmation nécessaires. Enfin, un réseautage continu avec d'autres professionnels du SIG est essentiel pour l'échange d'idées ainsi qu'une communauté de soutien.


Jeux de données liés au zonage

Base de données des lots fiscaux de zonage de NYC

La base de données des lots fiscaux de zonage est un format de fichier de valeurs séparées par des virgules (CSV) qui contient le zonage à jour par parcelle. La base de données comprend les désignations de zonage et la carte de zonage associées à un bloc fiscal et à un lot spécifiques. La base de données est mise à jour mensuellement pour refléter le rezonage et les corrections apportées au fichier.

Les données de zonage téléchargeables seront mises à jour sur une base mensuelle ou au besoin. Les mises à jour comprendront les récents changements de zonage adoptés par le conseil municipal.

Libérer. Mai 2021
Date des données. Mai 2021 (date des dernières adoptions du conseil municipal incluses dans les données : 27/5/21)

Il n'y aura pas de publication en juillet 2018 de la base de données mensuelle de NYC Zoning Tax Lot. La base de données des lots fiscaux de zonage actuellement disponible en téléchargement sur la page Bytes of the Big Apple du site Web du DCP est inchangée.

Fonctionnalités de zonage du SIG NYC

L'ensemble de données SIG Zoning Features est fourni en téléchargement gratuit dans les formats ESRI Shapefile et fichier de géodatabase. Il s'agit de formats de données SIG standard, compatibles avec la plupart des logiciels SIG et CAO, et également consultables à l'aide de visionneuses SIG gratuites comme ESRI & rsquos ArcGIS Explorer ou Google Earth. Cet ensemble de données est continu (transparent) à l'échelle de la ville et se compose de 6 classes de caractéristiques de zonage : districts de zonage, districts à usage spécial, sous-districts de district à usage spécial, districts à hauteur limitée, zones de superposition commerciales et modifications de la carte de zonage.

Bien que représentatif des informations contenues dans les cartes de zonage imprimées DCP, cet ensemble de données SIG n'est pas destiné à remplacer ces cartes, mais à fournir une source supplémentaire d'informations de zonage pour le grand public dans les applications de cartographie et d'analyse numériques.

Les données de zonage téléchargeables seront mises à jour sur une base mensuelle ou au besoin. Les mises à jour comprendront les récents changements de zonage adoptés par le conseil municipal.

Remarque aux utilisateurs :
1. Les données de zonage changent fréquemment et seront mises à jour au besoin ! Les mises à jour comprendront les récents changements de zonage adoptés par le conseil municipal.
2. Ces caractéristiques ne sont pas destinées à déterminer le zonage au niveau du lot fiscal individuel.

Libérer. Mai 2021
Date des données. Mai 2021 (date des dernières adoptions du conseil municipal incluses dans les données : 27/5/21)

Il n'y aura pas de publication en juillet 2018 des fonctionnalités mensuelles de zonage du SIG NYC. Les fonctionnalités de zonage du SIG NYC actuellement disponibles en téléchargement sur la page Bytes of the Big Apple du site Web DCP sont inchangées.

Cartes de zonage géoréférencées de NYC

Le jeu de données raster NYC Zoning Maps géoréférencées est destiné à être une représentation spatiale de l'ensemble du catalogue de cartes de zonage pour la ville de New York sous la forme d'une carte de zonage raster transparente à l'échelle de la ville sans cartouches. Ces cartes sont normalement conservées sous forme de 126 quarts de section individuels et imprimées périodiquement pour être incluses dans le volume III de la résolution de zonage de la ville. Cet ensemble de données comprend les modifications récentes apportées aux districts de zonage cartographiés ou aux modifications apportées au texte de zonage telles qu'elles sont adoptées par le conseil municipal ainsi que les modifications déposées sur la carte de la ville.

Libérer. Mai 2021
Date des données. Mai 2021 (date des dernières adoptions du conseil municipal incluses dans les données : 27/5/21)

Index de la carte de zonage de New York

L'index NYC Zoning Map est utilisé pour déterminer quelle carte de zonage est liée à une zone géographique spécifique de la ville de New York. Les cartes de zonage montrent les limites des districts de zonage dans toute la ville. Les cartes sont régulièrement mises à jour après que la commission d'urbanisme et le conseil municipal ont approuvé les changements de zonage proposés. L'ensemble de 126 cartes, qui font partie de la résolution de zonage, est présenté en 35 sections. Chaque section est identifiée par un numéro de 1 à 35 et est elle-même divisée en un à quatre quartiers, chacun identifié par une lettre a, b, c ou d (carte 8d ou 33c par exemple). Chaque carte couvre une superficie d'environ 8 000 pieds (nord/sud) sur 12 500 pieds (est/ouest) ou 100 millions de pieds carrés.

Libérer. Juillet 2019
Date des données. Juillet 2019

Il n'y aura pas de publication en juillet 2018 des cartes de zonage géoréférencées mensuelles de NYC. Les cartes de zonage géoréférencées de NYC actuellement disponibles en téléchargement sur la page Bytes of the Big Apple du site Web DCP sont inchangées.

Espaces publics privés (POPS)

Les espaces publics privés, également connus sous l'acronyme POPS, sont des espaces extérieurs et intérieurs mis à la disposition du public par des propriétaires privés en échange d'un bonus de surface au sol ou d'exonérations, une incitation introduite pour la première fois dans les règlements de zonage de la ville de New York en 1961. Pour en savoir plus à propos de POPS, visitez le site Web du Département de l'urbanisme à l'adresse http://nyc.gov/pops. Cette base de données contient des informations détaillées sur chaque espace public privé à New York.

Source de données : Privately Owned Public Space Database (2018), détenue et gérée par le New York City Department of City Planning et créée en collaboration avec Jerold S. Kayden et The Municipal Art Society of New York.

Libérer. Janvier 2021
Date des données. Janvier 2021

Logement d'inclusion obligatoire (MIH)

Le Logement inclusif obligatoire Un programme a été adopté en 2016 pour encourager la création de logements pour les familles à divers revenus dans les zones prévues pour la croissance de l'habitat. Lorsque les actions de la Commission augmentent considérablement la densité résidentielle, la Commission d'urbanisme et le conseil municipal appliqueront une ou plusieurs options pour exiger des logements abordables dans le cadre d'une nouvelle construction résidentielle.

Remarque aux utilisateurs :
Ces caractéristiques sont fournies à titre indicatif seulement et ne sont pas destinées à déterminer l'admissibilité au logement d'inclusion obligatoire au niveau du lot fiscal. Veuillez vous référer à l'ANNEXE F de la résolution de zonage de la ville de New York.

Libérer. Mai 2021
Date des données. Mai 2021 (date des dernières adoptions du conseil municipal incluses dans les données : 27/5/21)

Zones désignées pour le logement inclusif

Le programme de zones désignées pour le logement inclusif a été créé en 2005 pour encourager la création et la préservation de logements abordables dans les quartiers à densité moyenne et élevée en cours de rezonage afin de créer de nouvelles opportunités de logement. Le programme modifie le ratio de surface de plancher de base (FAR) disponible pour les développements et offre un bonus de surface de plancher pour les développements qui offrent des logements abordables sur place ou dans la communauté environnante.

Remarque aux utilisateurs :
Ces caractéristiques sont fournies à titre indicatif uniquement et ne sont pas destinées à déterminer l'admissibilité à la prime de logement inclusive au niveau du lot fiscal. Veuillez vous référer à l'ANNEXE F de la résolution de zonage de la ville de New York.

Libérer. juillet 2020
Date des données. Juillet 2020 (date des dernières adoptions du Conseil municipal incluses dans les données : 01/12/2014)

(E) Désignations

L'ensemble de données (E) Désignations est fourni en téléchargement gratuit aux formats ESRI Shapefile et CSV. Cet ensemble de données contient des désignations (E), y compris les exigences environnementales du CEQR (tableau 1) et les déclarations restrictives du CEQR (tableau 2), à l'annexe C de la résolution de zonage. Une désignation (E) fournit un avis de la présence d'une exigence environnementale concernant une contamination potentielle par des matières dangereuses, des niveaux de bruit ambiant élevés ou des problèmes d'émissions atmosphériques sur un lot fiscal particulier. Pour plus d'informations, consultez la FAQ électronique.

Bien que représentatif des informations contenues dans la résolution de zonage, cet ensemble de données n'est pas destiné à remplacer ou à remplacer les informations de la résolution de zonage, mais à fournir une source supplémentaire d'informations de zonage pour le grand public dans les applications de cartographie et d'analyse numériques.

  1. (E) Les désignations changent fréquemment et seront mises à jour au besoin ! Les mises à jour incluront les changements récents adoptés par le conseil municipal, la commission d'urbanisme et toute autre entité.
  2. Ces caractéristiques ne sont pas destinées à déterminer les désignations (E) au niveau du lot fiscal individuel.
  3. Les informations sur les lots fiscaux (BBL) sont enregistrées au moment où une désignation (E) est établie et ne sont pas mises à jour avec les modifications, divisions et fusions futures des lots fiscaux DOF.
  4. La version shapefile de l'ensemble de données n'est pas complète en raison des modifications, des divisions et des fusions des lots fiscaux DOF.


Libérer. Mai 2021
Date des données. Mai 2021 (date de la plus récente désignation (E) établie : 27/05/2021)

Il n'y aura pas de publication en juillet 2018 des désignations mensuelles (E). Les Désignations (E) actuellement disponibles en téléchargement sur la page Bytes of the Big Apple du site Web DCP sont inchangées.


Contexte et résumé

Les bases de données mondiales existantes sur la prévalence et l'intensité des catastrophes fournissent des informations importantes pour les politiques sur les principales tendances dans l'espace et dans le temps 1 et permettent des études agrégées sur la manière dont les catastrophes sont liées, entre autres, au changement climatique anthropique 2 et à la qualité de la gouvernance 3 , ainsi qu'à leurs conséquences macroéconomiques 4 . Cependant, la nature agrégée de ces bases de données, qui manquent généralement d'informations infranationales précises sur les lieux des catastrophes, empêche des enquêtes empiriques systématiques sur, par exemple, comment, pourquoi, où et quand les risques naturels se transforment en catastrophes dans tous les contextes, et comment les facteurs de vulnérabilité locale déterminent les conséquences de l'exposition aux dangers. Jusqu'à présent, les chercheurs n'ont pu répondre à ces questions que pour des cas sélectionnés ou à un niveau agrégé. Une compréhension plus complète et globale de ces processus nécessite de meilleures données à l'échelle locale 5 .

Cet article présente une nouvelle extension open source de la base de données sur les événements d'urgence (EM-DAT) 6 qui permet aux chercheurs, pour la première fois, d'explorer et d'utiliser des données géocodées sous-nationales sur les catastrophes majeures déclenchées par des risques naturels depuis 1960. EM- Le DAT, maintenu par le Centre de recherche sur l'épidémiologie des catastrophes (CRED) de l'Université catholique de Louvain en Belgique, constitue un catalogue multi-catastrophes complet et largement utilisé.Une recherche du terme « EM-DAT » dans Google Scholar renvoie plus de 17 000 résultats, ce qui témoigne de son application généralisée dans les travaux universitaires. La base de données EM-DAT enregistre les événements de catastrophe par pays et « emplacement » (c. cadre.

L'absence de données de localisation quantifiées (géométries) complique la détection et l'analyse des schémas spatio-temporels des impacts des catastrophes, et entrave davantage la connexion des informations disponibles dans la base de données EM-DAT avec des données tierces géoréférencées, telles que des données économiques 7 localisées, démographiques 8 et les conditions de sécurité 9 afin de comprendre la relation entre les catastrophes et la vulnérabilité sous-jacente des sociétés affectées 10 . Les risques de catastrophe, les vulnérabilités et l'exposition sont tous intrinsèquement locaux 11,12 , et il existe une gamme d'enquêtes infranationales pour des pays individuels et des catastrophes spécifiques 13 . L'ensemble de données présenté dans cet article s'ajoute au pool croissant de sources de données à haute résolution spatiale et temporelle.

Le jeu de données Geocoded Disasters (GDIS) fournit des géométries spatiales sous forme de polygones SIG ainsi que des coordonnées centroïdes de latitude et de longitude pour chaque entité administrative répertoriée comme emplacement de catastrophe dans la base de données EM-DAT. Au total, l'ensemble de données contient des informations spatiales sur 39 953 emplacements pour 9 924 catastrophes survenues dans le monde entre 1960 et 2018. Alors que les statistiques officielles EM-DAT fournissent des informations cruciales sur les schémas et les tendances générales des catastrophes dans l'espace et le temps pour les politiques et le public, cette nouvelle extension est destiné aux utilisateurs scientifiques qui ont besoin d'informations plus précises sur les catastrophes pour, par exemple, les évaluations d'impact et l'analyse des déterminants de la capacité d'adaptation. L'utilité des catastrophes géocodées pour la validation géographique de l'exposition est notée depuis un certain temps déjà 14 , et les données présentées ici permettent de telles analyses également au-delà du secteur de l'assurance et permettent aux utilisateurs de mener des évaluations d'impact spatialement sensibles.

Alors que les mesures de catastrophe fondées sur les conséquences sont en elles-mêmes endogènes à la vulnérabilité des sociétés affectées 15 , cette extension peut être utilisée pour explorer et, dans une certaine mesure, remédier à cette préoccupation. Une piste prometteuse à cet égard consiste à comparer les nouvelles catastrophes géolocalisées avec des données d'exposition aux aléas à haute résolution pour mieux comprendre les conditions dans lesquelles les extrêmes sont particulièrement susceptibles de se traduire en catastrophes matérielles et humaines. Une autre voie prometteuse consiste à combiner les nouvelles données sur les catastrophes avec des enquêtes auprès des ménages pour explorer la variation des impacts des catastrophes au niveau micro et si la mise en œuvre de programmes d'adaptation ou la fourniture d'une aide au développement augmente la résilience locale aux phénomènes météorologiques extrêmes 16,17.


Contenu

Le « globe », dans le concept DGG, n'a pas de sémantique stricte, mais en géodésie, ce qu'on appelle un « système de référence de grille » est une grille qui divise l'espace avec des positions précises par rapport à une donnée, c'est-à-dire une approximation d'un « modèle standard de le géoïde". Ainsi, dans le rôle du Géoïde, le « globe » couvert par un DGG peut être l'un des objets suivants :

  • Le surface topographique de la Terre, lorsque chaque cellule de la grille a ses coordonnées de position de surface et l'élévation par rapport au géoïde standard. Exemple : grille avec coordonnées (φ,λ,z) où z est l'altitude.
  • Une référence surface du géoïde. La coordonnée z est zéro pour toute la grille, peut donc être omis, (φ,λ).
    Les normes anciennes, avant 1687 (publication des Principia de Newton), utilisaient une "sphère de référence" de nos jours, le géoïde est mathématiquement abstrait comme un ellipsoïde de référence.
    • UNE géoïde simplifié: parfois une ancienne norme géodésique (ex. SAD69) ou une surface non géodésique (ex. surface parfaitement sphérique) doit être adoptée, et sera couverte par le maillage. Dans ce cas, les cellules doivent être étiquetées de manière non ambiguë, (φ',λ'), et la transformation (φ,λ)⟾(φ',λ') doit être connu.

    En tant que processus de modélisation global, les DGG modernes, lorsqu'ils incluent le processus de projection, ont tendance à éviter les surfaces comme les cylindres ou les solides coniques qui entraînent des discontinuités et des problèmes d'indexation. Des polyèdres réguliers et d'autres équivalents topologiques de la sphère ont conduit aux options connues les plus prometteuses à couvrir par les DGG, [1] parce que "les projections sphériques préservent la topologie correcte de la Terre - il n'y a pas de singularités ou de discontinuités à traiter". [4]

    Lorsqu'on travaille avec une DGG, il est important de préciser laquelle de ces options a été retenue. Ainsi, la caractérisation de la modèle de référence du globe d'un DGG peut se résumer par :

    • Le récupéré objet: le type d'objet dans le rôle de globe. S'il n'y a pas de projection, l'objet couvert par la grille est le Géoïde, la Terre ou une sphère sinon la classe géométrique de la surface de projection (par exemple un cylindre, un cube ou un cône).
    • Projection type : absent (pas de projection) ou présent. Lorsqu'elle est présente, sa caractérisation peut être résumée par la propriété de but de la projection (par exemple, aire égale, conforme, etc.) et la classe de la fonction corrective (par exemple, trigonométrique, linéaire, quadratique, etc.).

    REMARQUE : lorsque le DGG couvre une surface de projection, dans un contexte de provenance des données, les métadonnées sur le géoïde de référence sont également importantes - informant généralement sa valeur CRS ISO 19111, sans confusion avec la surface de projection.

    La principale caractéristique distinctive pour classer ou comparer les DGG est l'utilisation ou non de structures de grille hiérarchiques :

    • Dans hiérarchique systèmes de référence chaque cellule est une "référence de boîte" à un sous-ensemble de cellules, et les identificateurs de cellule peuvent exprimer cette hiérarchie dans sa logique ou sa structure de numérotation.
    • Dans non hiérarchique systèmes de référence, chaque cellule possède un identifiant distinct et représente une région à échelle fixe de l'espace. La discrétisation du système Latitude/Longitude est la plus répandue, et la référence standard pour les conversions.

    D'autres critères usuels pour classer un DGG sont la forme des tuiles et la granularité (résolution de la grille):

    • La régularité et la forme des carreaux: il existe un quadrillage régulier, semi-régulier ou irrégulier. Comme dans les carrelages génériques par polygones réguliers, il est possible de carrelage avec une face régulière (comme les carreaux muraux peuvent être rectangulaires, triangulaires, hexagonaux, etc.), ou avec le même type de face mais en changeant sa taille ou ses angles, résultant en des formes semi-régulières.
      L'uniformité de la forme et la régularité des métriques fournissent de meilleurs algorithmes d'indexation de grille. Bien qu'il ait une utilisation moins pratique, des grilles totalement irrégulières sont possibles, comme dans une couverture de Voronoi.
    • Fin ou grossier granulation (taille de cellule) : les DGG modernes sont paramétrables dans sa résolution de grille, c'est donc une caractéristique de l'instance DGG finale, mais pas utile pour classer les DGG, sauf lorsque le type DGG doit utiliser une résolution spécifique ou avoir une limite de discrétisation. Une grille de granulation "fine" est non limitée et "grossière" fait référence à une limitation drastique. Historiquement, les principales limitations sont liées aux supports numériques/analogiques, aux représentations compressées/étendues de la grille dans une base de données et aux limitations de mémoire pour stocker la grille. Lorsqu'une caractérisation quantitative est nécessaire, la surface moyenne des cellules de la grille ou la distance moyenne entre les centres des cellules peuvent être adoptées.

    Grilles non hiérarchiques Modifier

    La classe la plus courante de grilles globales discrètes est celle qui place les points centraux des cellules sur les méridiens et les parallèles de longitude/latitude, ou qui utilise les méridiens et les parallèles de longitude/latitude pour former les limites des cellules rectangulaires. Exemples de telles grilles, toutes basées sur la latitude/longitude :

    Zones UTM :
    Divise la Terre en soixante (bandes) zones, chacune étant une bande de six degrés de longitude. Dans les médias numériques supprime la zone de chevauchement. Utiliser la projection Mercator transversale sécante dans chaque zone. Définir 60 cylindres sécants, 1 par zone.
    Le Zones UTM a été amélioré par le système de référence de grille militaire (MGRS), par l'ajout des bandes de latitude.
    début: années 40 objet couvert : cylindre (60 options) projection: UTM ou latlong tuiles irrégulières : bandes polygonales granularité : grossier
    (moderne) UTM - Universal Transverse Mercator :
    Est une discrétisation de la grille UTM continue, avec une sorte de hiérarchie à 2 niveaux, où le premier niveau (gros grain) correspond aux "zones UTM avec bandes de latitude" (le MGRS), utilise les mêmes 60 cylindres comme référence-projection objets.
    Chaque cellule à grain fin est désignée par un identifiant structuré composé par "l'indicateur de zone de grille", "l'identifiant de 100 000 mètres carrés" et "l'emplacement numérique". La résolution de la grille est une fonction directe du nombre de chiffres dans les coordonnées, qui est également normalisé. Par exemple, la cellule 17N 630084 4833438 est un

    Grilles hiérarchiques Modifier

    L'illustration de droite montre 3 cartes des limites de la côte de la Grande-Bretagne. La première carte était couverte par une grille de niveau 0 avec des cellules de 150 km. Seule une cellule grise au centre, sans besoin de zoom pour les détails, reste de niveau 0. Toutes les autres cellules de la deuxième carte ont été partitionnées en quadrillage de quatre cellules (grille de niveau-1), chacune avec 75 km. Dans la troisième carte, 12 cellules de niveau 1 restent en gris, toutes les autres ont été à nouveau partitionnées, chaque cellule de niveau 1 transformée en une grille de niveau 2.
    Exemples de DGG qui utilisent un tel processus récursif, générant des grilles hiérarchiques, comprennent :

    Les cellules peuvent être des hexagones, des triangles ou des quadrilatères. Plusieurs résolutions sont indiquées en choisissant un ouverture, ou le rapport entre les zones de cellules à des résolutions consécutives. Certaines applications des DGG ISEA comprennent des produits de données générés par le satellite Soil Moisture and Ocean Salinity (SMOS) de l'Agence spatiale européenne, qui utilise un ISEA4H9 (ouverture 4 Hexagonal DGGS résolution 9), [11] et le logiciel commercial Global Grid Systems Insight, [ 12] qui utilise un ISEA3H (ouverture 3 Hexagonal DGGS).

    La projection habituelle est "H?4, K?3 projection HEALPix". Avantage principal, par rapport à d'autres de même niche d'indexation que S2, "est adapté aux calculs impliquant des harmoniques sphériques". [17]

    Grilles hiérarchiques standard à aires égales Modifier

    Il existe une classe de DGG hiérarchiques nommés par l'Open Geospatial Consortium (OGC) en tant que "Discrete Global Grid Systems" (DGGS), qui doivent satisfaire 18 exigences. Parmi eux, ce qui distingue le mieux cette classe des autres DGG hiérarchiques, c'est l'Exigence-8, "Pour chaque niveau successif de raffinement de la grille et pour chaque géométrie de cellule, (. ) Cellules qui sont de surface égale (. ) dans le niveau de précision spécifié". [24]

    Un DGGS est conçu comme un cadre d'information distinct des systèmes de référence de coordonnées conventionnels conçus à l'origine pour la navigation. Pour qu'un cadre d'information spatiale mondiale basé sur une grille fonctionne efficacement en tant que système analytique, il doit être construit à l'aide de cellules qui représentent uniformément la surface de la Terre. [24] La norme DGGS inclut dans ses exigences un ensemble de fonctions et d'opérations que le cadre doit offrir.

    Toutes les cellules de niveau 0 de DGGS sont des faces de surface égale d'un polyèdre régulier.

    Il existe de nombreux DGG car il existe de nombreuses alternatives de représentation, d'optimisation et de modélisation. Toute la grille DGG est une composition de ses cellules, et, dans la DGG hiérarchique, chaque cellule utilise une nouvelle grille sur sa région locale.

    L'illustration n'est pas adaptée aux cas TIN DEM et aux structures similaires de « données brutes », où la base de données n'utilise pas le concept de cellule (qui est géométriquement la région triangulaire), mais des nœuds et des arêtes : chaque nœud est une élévation et chaque arête est la distance entre deux nœuds.

    En général, chaque cellule de la DGG est identifiée par les coordonnées de sa région-point (illustrée comme le point central d'une représentation de base de données). Il est également possible, avec perte de fonctionnalité, d'utiliser un "identifiant libre", c'est-à-dire n'importe quel numéro unique ou étiquette symbolique unique par cellule, le identifiant de cellule. L'ID est généralement utilisé comme index spatial (comme l'arbre Quadtree interne ou l'arbre k-d), mais il est également possible de transformer l'ID en une étiquette lisible par l'homme pour les applications de géocodage.

    Les bases de données modernes (par exemple en utilisant la grille S2) utilisent également plusieurs représentations pour les mêmes données, offrant à la fois une grille (ou une région cellulaire) basée sur le géoïde et une grille basée sur la projection.

    Le cadre DGGS Modifier

    La norme définit le exigences d'une DGG hiérarchique, y compris comment faire fonctionner le réseau. Tout DGG qui satisfait à ces exigences peut être nommé DGGS. « Une spécification DGGS DOIT inclure un cadre de référence DGGS et les algorithmes fonctionnels associés tels que définis par le modèle de données conceptuel de base DGGS ». [25]

    1. éléments du cadre de référence, et,
    2. éléments d'algorithme fonctionnel comprenant :
      1. opérations de quantification,
      2. opérations algébriques, et
      3. opérations d'interopérabilité.

      Les grilles globales discrètes avec des régions cellulaires définies par des parallèles et des méridiens de latitude/longitude ont été utilisées depuis les premiers jours de l'informatique géospatiale mondiale. Avant cela, la discrétisation des coordonnées continues à des fins pratiques, avec des cartes papier, ne se faisait qu'avec une faible granularité. L'exemple le plus représentatif et le plus important de DGG de cette ère pré-numérique était peut-être les DGG militaires UTM des années 1940, avec une identification des cellules granulées plus fine à des fins de géocodage. De même certains grille hiérarchique existe avant l'informatique géospatiale, mais seulement en granulation grossière.

      Une surface globale n'est pas nécessaire pour une utilisation sur des cartes géographiques quotidiennes, et la mémoire était très chère avant les années 2000, pour mettre toutes les données planétaires dans le même ordinateur. Les premières grilles globales numériques ont été utilisées pour le traitement des données des images satellitaires et la modélisation globale (climatique et océanographique) de la dynamique des fluides.

      Les premières références publiées à Géodésique hiérarchique DGG Les systèmes sont des systèmes développés pour la modélisation atmosphérique et publiés en 1968. Ces systèmes ont des régions de cellules hexagonales créées à la surface d'un icosaèdre sphérique. [26] [27]

      Les grilles hiérarchiques spatiales ont fait l'objet d'études plus poussées dans les années 1980, [28] lorsque les structures principales, comme Quadtree, ont été adaptées en indexation d'images et bases de données.

      Bien que des cas spécifiques de ces grilles soient utilisés depuis des décennies, le terme Grilles globales discrètes ont été inventés par des chercheurs de l'Oregon State University en 1997 [2] pour décrire la classe de toutes ces entités.

      . Normalisation OGC en 2017.

      Comparaison et évolution Modifier

      La grille globale discrète d'évaluation comprend de nombreux aspects, notamment la zone, la forme, la compacité, etc. Les méthodes d'évaluation pour la projection cartographique, telles que l'indicateur de Tissot, conviennent également pour évaluer la grille mondiale discrète basée sur la projection cartographique.

      De plus, le rapport moyenné entre profils complémentaires (AveRaComp) [29] donne une bonne évaluation des distorsions de forme pour une grille globale discrète en forme de quadrilatère.

      Les choix et les adaptations de développement de bases de données sont orientés par des exigences pratiques pour une plus grande performance, fiabilité ou précision. Les meilleurs choix sont sélectionnés et adaptés aux besoins, favorisant l'évolution des architectures DGG. Exemples de ce processus d'évolution : des DGG non hiérarchiques aux DGG hiérarchiques à partir de l'utilisation d'index de courbe en Z (un algorithme naïf basé sur l'entrelacement de chiffres), utilisé par Geohash, aux index de courbe de Hilbert, utilisés dans les optimisations modernes, comme S2.

      En général chaque cellule de la grille est identifiée par les coordonnées de sa région-point, mais il est aussi possible de simplifier la syntaxe et la sémantique des coordonnées, d'obtenir un identifiant, comme dans une grille alphanumérique classique — et de retrouver les coordonnées d'une région -point à partir de son identifiant. Des représentations de coordonnées petites et rapides sont un objectif dans les implémentations d'ID de cellule, pour toutes les solutions DGG.

      Il n'y a pas de perte de fonctionnalité lors de l'utilisation d'un « identifiant libre » au lieu d'une coordonnée, c'est-à-dire un numéro unique (ou une étiquette symbolique unique) par point de région, le identifiant de cellule. Ainsi, transformer une coordonnée en une étiquette lisible par l'homme, et/ou compresser la longueur de l'étiquette, est une étape supplémentaire dans la représentation en grille. Cette représentation est nommée géocode.

      Certains "codes de lieu mondiaux" populaires comme ISO 3166-1 alpha-2 pour les régions administratives ou le code Longhurst pour les régions écologiques du globe, sont partiel dans la couverture du globe. Par ailleurs, n'importe quel ensemble d'identifiants de cellule d'un DGG spécifique peut être utilisé comme "codes de lieu à couverture complète". Chaque ensemble différent d'identifiants, lorsqu'il est utilisé comme norme à des fins d'échange de données, est appelé « système de géocodage ».

      Il existe de nombreuses façons de représenter la valeur d'un identifiant de cellule (ID-cellule) d'une grille : structurée ou monolithique, binaire ou non, lisible par l'homme ou non. Supposons une caractéristique cartographique, comme la fontaine Merlion de Singapour (

      entité à l'échelle de 5 m), représentée par sa cellule de délimitation minimale ou une cellule de point central, la identifiant de cellule sera:

      Identifiant de la cellule Nom et paramètres de la variante DGG ID structure grille résolution
      (1° 17′ 13,28″ N, 103° 51′ 16,88″ Est) ISO 6709/D en degrés (Annexe ), CRS=WGS84 latitude( deg min sec dir ) longue( deg min sec dir )
      secondes avec 2 décimales
      (1.286795, 103.854511) ISO 6709/F en décimal et CRS=WGS84 (lat, long) 6 places fractionnaires
      (1.65AJ, 2V.IBCF) ISO 6709/F en décimal en base36 (non ISO) et CRS=WGS84 (lat, long) 4 places fractionnaires
      w21z76281 Geohachage, base32, WGS84 monolithique 9 caractères
      6PH57VP3+PR PlusCode, base20, WGS84 monolithique 10 caractères
      48N 372579 142283 UTM, décimal standard, WGS84 zone lat long 3 + 6 + 6 chiffres
      48N 7ZHF 31SB UTM, coordonnées base36, WGS84 zone lat long 3 + 4 + 4 chiffres

      Tous ces géocodes représentent la même position dans le globe, avec une précision similaire, mais diffèrent par la longueur de la chaîne, l'utilisation des séparateurs et l'alphabet (caractères non séparateurs). Dans certains cas, la représentation "DGG originale" peut être utilisée. Les variantes sont des modifications mineures, n'affectant que la représentation finale, par exemple la base de la représentation numérique, ou l'entrelacement de parties de la structure en une seule représentation numérique ou codée. Les variantes les plus populaires sont utilisées pour les applications de géocodage.

      Grilles globales alphanumériques Modifier

      Les DGG et ses variantes, avec des identifiants de cellules lisibles par l'homme, ont été utilisés comme de facto standard pour les grilles alphanumériques. Il ne se limite pas aux symboles alphanumériques, mais « alphanumérique » est le terme le plus courant.

      Les géocodes sont des notations pour les emplacements, et dans un contexte DGG, des notations pour exprimer les identifiants des cellules de la grille. Il y a une évolution continue des normes numériques et des DGG, donc un changement continu de la popularité de chaque convention de géocodage au cours des dernières années. Une adoption plus large dépend également de l'adoption par le gouvernement du pays, de l'utilisation dans les plates-formes de cartographie populaires et de nombreux autres facteurs.

      Les exemples utilisés dans la liste suivante concernent une "cellule de grille mineure" contenant l'obélisque de Washington, 38° 53′ 22,11″ N, 77° 2′ 6,88″ W .

      Nom/var DGG Création et licence Résumé de la variante Description et exemple
      Zones UTM/non superposées Années 1940 - CC0 original sans chevauchement Divise la Terre en soixante bandes polygonales. Exemple : 18S
      UTM discret Années 1940 - CC0 original Entiers UTM Divise la Terre en soixante zones, chacune étant une bande de longitude de six degrés, et utilise une projection Mercator transversale sécante dans chaque zone. Aucune information sur la première utilisation numérique et les conventions. Supposons que les normalisations soient plus tard celles de l'ISO (années 1980). Exemple : 18S 323483 4306480
      ISO 6709 1983 - CC0 original représentation des degrés Les résolutions de la grille sont fonction du nombre de chiffres - avec des zéros non significatifs remplis si nécessaire, et une partie fractionnaire avec un nombre approprié de chiffres pour représenter la précision requise de la grille. Exemple : 38° 53′ 22,11″ N, 77° 2′ 6,88″ O .
      ISO 6709 1983 - CC0 Représentation à 7 chiffres décimaux Variante basée sur la représentation XML où la structure de données est un "le tuple composé de la latitude et de la longitude représente une position géographique bidimensionnelle", et chaque nombre du tuple est un nombre réel discrétisé avec 7 décimales. Exemple : 38.889475, -77.035244 .
      Code de carte 2001 - breveté original Le premier à adopter un code mix, en conjonction avec les codes ISO 3166 (pays ou ville). En 2001, les algorithmes ont été licenciés Apache2, mais tous les systèmes restent brevetés.
      Géohachage 2008 - CC0 original Est comme un latLong bit-entrelacé, et le résultat est représenté avec base32.
      Geohash-36 2011 - CC0 original Malgré le nom similaire, n'utilise pas le même algorithme que Geohash. Utilise une grille de 6 par 6 et associe une lettre à chaque cellule.
      Quoi3mots 2013 breveté original (Anglais) convertit des carrés de 3x3 mètres en 3 mots du dictionnaire anglais. [30]
      PlusCode 2014 - Apache2 [31] original Aussi appelé "Open Location Code". Les codes sont des nombres en base 20 et peuvent utiliser des noms de ville, réduisant le code de la taille du code de la zone de délimitation de la ville (comme la stratégie Mapcode). Exemple : 87C4VXQ7+QV .
      S2 ID de cellule/Base32 2015 - Apache2 [32] original Entier 64 bits exprimé en base32 Indexation de base de données hiérarchique et très efficace, mais pas de représentation standard pour les préfixes base32 et city, comme PlusCode.
      Quoi3mots/autreLang 2016 . 2017 - breveté autres langues Identique à l'anglais, mais en utilisant un autre dictionnaire comme référence pour les mots.
      Exemple portugais, et cellule 10x14m : tenaz.fatual.davam .

      Autres variantes documentées, mais censées ne pas être utilisées, ou n'être "jamais populaires":


      Notes d'utilisation

      Le référentiel de données suivant https://data.mendeley.com/datasets/z9zfhzk8cr/6 70 inclut les fichiers ESRI Shape dans le système de référence de coordonnées EPSG:4326. Tous les jeux de données sont disponibles à l'échelle nationale. Les informations incluses dans ces groupes sont l'identifiant, le nom du pays, la population, la classification urbaine-rurale, l'intensité lumineuse nocturne maximale et la population vivant dans des zones avec des lumières nocturnes visibles.

      Comme indiqué précédemment, les données décrivent les établissements humains, qui sont essentiels dans de nombreuses applications telles que, mais sans s'y limiter, la planification de l'électrification, la planification urbaine et la réponse aux catastrophes. Dans le cadre d'une intervention en cas de catastrophe, l'ensemble de données peut aider les chercheurs et les décideurs à mieux comprendre les effets observés sur différents établissements de population après une catastrophe, ce qui peut contribuer aux efforts d'atténuation et de réponse. Avec les données concernant le taux d'électrification et la fracture urbaine-rurale, ces ensembles de données peuvent fournir un point de départ pour les études d'électrification et les évaluations des inégalités d'électrification. Ces clusters de population basés sur des vecteurs capturent les géométries des implantations plus détaillées que les cellules raster, ce qui aide à la planification de l'électrification, par ex. permettant des évaluations de la conception des réseaux électriques ou la détermination des distances à différents types d'infrastructures avec plus de précision. Ces clusters ne sont pas destinés à remplacer les données raster existantes, mais plutôt à les compléter.


      Trouver le nom du comté pour une latitude/longitude

      J'essaie de trouver un service Web qui me permettra d'obtenir un nom de comté (pas de pays) pour une latitude/longitude spécifique. J'effectuerais la recherche dans une application serveur (probablement une application Java). Il n'a pas de service Web s'il existe une bibliothèque, je suppose, mais j'aimerais des informations à jour. J'ai pas mal cherché une API qui prend en charge cela, mais jusqu'à présent, je n'ai pas pu en trouver une qui fonctionne. J'ai essayé les API Yahoo comme ceci :

      Mais il ne remplit pas les informations d'adresse. J'ai essayé avec certaines des options "drapeaux" là aussi en vain.

      J'ai également examiné les API de Google, mais j'ai lu à plusieurs endroits qu'elles ne peuplent pas le comté.

      Alors, est-ce que quelqu'un connaît des API qui prendront une latitude/longitude et renverront le comté associé à cet emplacement ? Et si vous avez des exemples, ce serait sympa.

      J'aimerais également savoir quelles API permettent une utilisation dans une application commerciale. Beaucoup de données que j'ai trouvées disent que vous ne pouvez pas utiliser les données pour gagner de l'argent. Je les lis peut-être mal, mais je cherche à créer un service que je facturerais probablement et qui utiliserait ces données. J'aurais donc besoin d'options. Peut-être des services gratuits pendant que j'explore les options, et des services payants plus tard.


      Où trouver des polygones administratifs L-2 sous licence ouverte ? - Systèmes d'information géographique

      Données géospatiales: données avec une référence spatiale qui identifient les caractéristiques géographiques, les emplacements, les dimensions, les attributs, les informations temporelles, etc. Elles peuvent être consultées, traitées, analysées et visualisées pour des applications géospatiales, qui sont souvent menées à l'aide d'outils géospatiaux logiciel de système d'information (SIG) à des outils spécifiques). Les données raster et les données vectorielles sont les deux principaux types de données géospatiales. Chaque type de données peut être organisé et enregistré en utilisant diverses structures de données et différents formats de données.

      Données raster: un type de données lisible par machine qui représente des données continues ou catégorielles avec une structure en grille sur l'espace géographique, dans laquelle chaque pixel (ou cellule de grille) prend une valeur représentative, telle qu'une moyenne, de l'attribut d'intérêt dans la zone géographique espace couvert par le pixel. Les images numériques et les modèles altimétriques numériques (MNE) quadrillés sont des exemples de données raster.

      Données vectorielles: type de données lisible par machine utilisé pour représenter l'emplacement et la forme d'entités géographiques sous forme d'objets géométriques (par exemple, des points, des lignes et des polygones) avec des coordonnées spatiales explicites. Pour chaque objet géométrique individuel, les valeurs de ses attributs spatiaux et non spatiaux peuvent également être enregistrées.

      Système de référence spatiale (SRS): Également appelé système de référence de coordonnées (SRC), il s'agit d'un composant fondamental de toutes les données géospatiales, qui utilise des coordonnées pour aider à décrire l'emplacement des pixels ou des objets géométriques dans le monde réel. La plupart des SRS peuvent être divisés en deux catégories : géographiques et projetées. Un SRS géographique (également connu sous le nom de système de coordonnées géographiques) utilise une surface ellipsoïdale pour définir des emplacements sur la Terre (comme le célèbre WGS84), tandis qu'un SRS projeté utilise une surface cartésienne plate basée sur une projection cartographique avec un SRS géographique comme le datum géodésique (comme le Web Mercator basé sur WGS84). Voir Projections cartographiques et autres sujets dans Systèmes de géoréférencement dans la gestion des données.

      Bibliothèque de logiciels: Une bibliothèque logicielle fournit un ensemble de code pré-écrit (encapsulé sous forme de fonctions, classes, modules, scripts, etc.) pour la mise en œuvre de fonctionnalités spécifiques et fines (par exemple, la manipulation de chaînes) qui peuvent être réutilisées dans le code. En appelant ou en appelant les codes d'une bibliothèque logicielle (souvent écrite par d'autres), les développeurs peuvent gagner du temps et des efforts et garantir la qualité lors du développement d'applications.

      Utilitaires de ligne de commande: Une manière classique d'exécuter un programme en tapant directement sa commande correspondante dans l'espace d'affichage d'une interface de ligne de commande tout texte (CLI par exemple, coquille bash sur les systèmes Linux et macOS, ou cmd/PowerShell sur les systèmes Windows). Un exemple simple et fréquemment utilisé d'utilitaire de ligne de commande fourni par les systèmes d'exploitation est la commande réal (ou alors ls, selon le système d'exploitation) pour lister le contenu du répertoire courant.

      La lecture et l'écriture de données géospatiales est la procédure la plus fondamentale dans les applications d'analyse géospatiale. Cependant, il s'agit également d'une étape compliquée face à divers types et formats de données géospatiales, en particulier lors de leur combinaison avec divers systèmes de référence spatiale (SRS). Les données raster et les données vectorielles sont deux types principaux de données géospatiales. Chaque type de données a différents formats de données, en raison des diverses justifications de leur développement (par exemple, des domaines spécifiques, des fournisseurs, des applications, etc.).

      Les bibliothèques d'entrée/sortie (IO) de données géospatiales sont conçues et mises à disposition pour aider au développement de procédures de lecture et d'écriture de données géospatiales de manière simple et unifiée. Ces bibliothèques masquent les détails techniques de mise en œuvre des E/S aux utilisateurs finaux et aux développeurs, afin de fournir des interfaces de programmation d'applications (API) concises que les utilisateurs peuvent appeler ou invoquer. Avec une telle bibliothèque, les développeurs peuvent se concentrer davantage sur les algorithmes de base pour l'analyse géospatiale au lieu des détails compliqués de l'ouverture, de la lecture, de l'écriture et de la fermeture des données géospatiales avec divers formats et SRS. Cela facilite et simplifie grandement le développement de nouvelles applications géospatiales.

      Les bibliothèques d'E/S de données géospatiales comprennent des bibliothèques spécifiques et des bibliothèques universelles. Une bibliothèque spécifique peut servir pour un format de données géospatiales spécifique, par exemple, libgeotiff pour GeoTIFF, libhdf5 pour HDF5, ou shapelib pour ESRI Shapefile. Une bibliothèque universelle est généralement construite sur un modèle de données abstrait (c. données géospatiales matricielles et vectorielles, ou Pédale (Point Data Abstraction Library) pour les données de nuages ​​de points.

      Cette entrée présente la bibliothèque universelle d'E/S de données géospatiales la plus populaire et la plus polyvalente, GDAL/OGR, comme exemple de bibliothèques d'E/S de données géospatiales, et discute de sa conception, de son utilisation et de ses orientations futures.

      GDAL/OGR est une bibliothèque d'E/S de données géospatiales open source avec un ensemble d'utilitaires de ligne de commande qui est publié sous une licence open source de style MIT/X. GDAL/OGR, « une bibliothèque de traduction pour les formats de données géospatiales matricielles et vectorielles » selon la définition sur son site Web, https://gdal.org/, se concentre sur la traduction de données géospatiales matricielles et vectorielles avec différents formats de données et projections cartographiques adoptées en pratique.

      GDAL a été lancé par Frank Warmerdam en 1998 et est officiellement maintenu par l'Open Source Geospatial Foundation (OSGeo) depuis 2008. Frank Warmerdam a également créé OGR, une bibliothèque d'E/S distincte pour les données vectorielles inspirée de la spécification OpenGIS Simple Feature. Alors que GDAL était spécifique aux données géospatiales raster au départ, OGR a été officiellement intégré à GDAL depuis la version 2.0 de GDAL en 2015.

      La dernière version de GDAL, 3.1.2 publiée en juillet 2020, fournit jusqu'à 168 implémentations spécifiques (appelées pilotes) basées sur un modèle de données abstrait raster unique pour prendre en charge différents formats et protocoles de données raster (tels que JPEG, GeoTIFF, Web Map Services (WMS), etc.), tandis qu'OGR fournit jusqu'à 99 pilotes basés sur un modèle de données abstrait vectoriel unique pour les formats de données vectorielles (tels que la conception assistée par ordinateur (CAO), ESRI Shapefile, Web Feature Service (WFS), etc.) (Contributeurs GDAL/OGR, 2020).

      Pour les développeurs de la communauté Free and Open Source for Geospatial (FOSS4G en abrégé) et les utilisateurs finaux qui ont besoin de gérer des données géospatiales, GDAL/OGR offre une utilité considérable pour réduire leur charge lorsqu'ils travaillent avec les divers formats de données géospatiales utilisés dans la pratique (Figure 1) (Warmerdam, 2008). GDAL/OGR est devenu une pierre angulaire des données géospatiales IO dans divers logiciels FOSS4G (tels que GRASS GIS, QGIS et SAGA) et logiciels propriétaires (tels que FME et ArcGIS), en raison 1) de sa haute compatibilité avec divers formats de données géospatiales et SRS, 2) la flexibilité des interfaces de programmation et 3) l'efficacité du traitement de données géospatiales volumineuses.

      Figure 1. GDAL/OGR réduit le fardeau de l'utilisateur lorsqu'il travaille avec divers formats de données géospatiales et systèmes de référence spatiale dans les applications géospatiales. Source : auteurs.

      4.1 Haute compatibilité avec les formats de données géospatiales et les systèmes de référence spatiale (SRS)

      Sur la base de la conception de ses systèmes de référence spatiale et de ses modèles de données abstraites raster et vectoriel (Figure 2), GDAL/OGR implémente une variété de pilotes de données pour charger et gérer toutes sortes de données géospatiales avec les formats pris en charge (couvrant la plupart, sinon tous, des formats de données géospatiales en pratique) grâce à des interfaces unifiées pour les utilisateurs.

      Figure 2. Diagramme schématique des modèles de données abstraits matriciels et vectoriels, ainsi que du système de référence spatiale (SRS) dans GDAL/OGR. Le SRS est le composant fondamental de toutes les données géospatiales et contient deux types principaux : géographique et projeté. Le modèle de données abstrait raster contient deux composants clés : les canaux raster et les métadonnées. Chaque canal raster a un ensemble de propriétés et peut avoir de zéro à plusieurs aperçus. Le modèle de données abstrait vectoriel comprend principalement des couches vectorielles d'entités. Chaque entité est composée d'un type de géométrie et des attributs associés. Source : auteurs.

      4.1.1 Référentiels spatiaux dans GDAL/OGR

      Le système de référence spatiale (SRS) ou système de coordonnées de référence (CRS) est la composante fondamentale de toutes les données géospatiales. Les données géospatiales couvrant la même zone géographique mais dérivées de sources différentes peuvent avoir des SRS distincts, selon les types de SRS (par exemple, SRS géographique et SRS projeté), la méthode de projection cartographique et ses paramètres, et le système géodésique basé sur un ellipsoïde de référence terrestre, etc. (Figure 2, les lecteurs intéressés peuvent rechercher des SRS par emplacement via https://epsg.org/search/map). Les transformations d'un SRS à un autre sont d'une importance vitale lors du traitement des données géospatiales et peuvent être très compliquées compte tenu de la précision de la conversion (contributeurs PROJ, 2020).

      Dans GDAL/OGR, les SRS sont représentés au format OpenGIS Well Known Text (WKT) pour être compatibles avec les codes du European Petroleum Survey Group (EPSG) pour les SRS prédéfinis, le format ESRI WKT, etc. GDAL/OGR prend non seulement en charge tous les SRS définis dans les bases de données EPSG et ESRI, mais permet également aux utilisateurs de définir de nouveaux SRS en définissant des paramètres clés (y compris le nom de l'ellipsoïde/sphéroïde avec un demi-grand axe et un aplatissement inverse, le nom du premier méridien et le décalage de Greenwich, la méthode de projection et les paramètres (par exemple, le méridien central ), nom de l'unité et facteurs de conversion en mètres ou radians, etc.). Il convient de mentionner que les bases de données spatiales communes prises en charge par GDAL/OGR ont généralement trois manières de gérer les SRS : (1) utiliser GeoJSON pour stocker des données géospatiales et ainsi ne prendre en charge que le SRS de WGS 84 (c'est-à-dire EPSG 4326), de la manière adoptée pour MongoDB (2) utiliser une syntaxe SRS spécifique et accepter les SRS définis par l'utilisateur, de la manière adoptée pour DB2 Spatial Extender et (3) prédéfinir les SRS basés sur la base de données EPSG, puis adopter la représentation ou les variantes OpenGIS WKT, comme cela est fait dans Oracle Spatial, PostGIS et MySQL.

      GDAL/OGR adopte un puissant moteur générique de transformation de coordonnées (les contributeurs PROJ de la bibliothèque PROJ, 2020) comme moteur intégré pour effectuer des projections et des transformations entre différents SRS. Cela permet à GDAL/OGR d'effectuer à la fois des projections cartographiques à grande échelle et des transformations de coordonnées avec une précision géodésique élevée pour la plupart des SRS utilisés dans la pratique. GDAL/OGR conserve des mises à jour presque synchrones avec PROJ. Au moment de la rédaction de cette entrée, la dernière version de PROJ 7.1.0 le 1er juillet 2020 a été prise en charge par la dernière GDAL/OGR 3.1.2 publiée le 7 juillet 2020.

      4.1.2 Modèle de données abstrait raster GDAL

      Le modèle de données abstrait raster GDAL a une compatibilité élevée avec la plupart (sinon tous) les formats et protocoles de données raster en pratique, y compris les images géoréférencées (par exemple, GeoTIFF), les bases de données relationnelles (par exemple, Oracle Spatial et PostGIS), les bases de données portables (par exemple, Rasterlite ), et ainsi de suite (Figure 1).

      Outre le SRS, deux composants clés sont inclus dans le modèle de données abstrait raster GDAL : les canaux raster et les métadonnées (Figure 2). Les canaux raster sont composés d'un groupe de canaux raster individuels avec la même plage de coordonnées d'image (c'est-à-dire des colonnes et des lignes). Chaque canal raster individuel représente logiquement un canal, un canal ou une couche unique des données raster sous la forme d'une image bidimensionnelle à l'aide de colonnes et de lignes. Un ensemble de propriétés est associé à chaque bande raster, par exemple, la largeur et la hauteur de chaque cellule, la taille de bloc liée au mode de stockage physique, les statistiques stockées dans les métadonnées, etc. Chaque position de cellule individuelle (col, ligne) dans un raster peut être transformé en coordonnées géoréférencées (X, oui) ou alors (longitude, latitude) via : (1) les points de contrôle au sol (GCP), (2) la transformation affine basée sur les coordonnées du coin supérieur gauche du raster ainsi que la largeur et la hauteur de la cellule, et (3) le modèle géométrique à coefficient polynomial rationnel (RPC), si disponible. De plus, chaque bande raster peut avoir zéro ou plusieurs aperçus qui ont des tailles différentes (en colonnes et en lignes) mais couvrent la même région géographique (Section 4.3).

      Les métadonnées du modèle de données abstrait raster GDAL fournissent une structure de données auxiliaire pour stocker des données textuelles spécifiques à l'application sous forme de liste de paires nom/valeur, qui sont divisées en plusieurs groupes (appelés domaines Figure 2). Ces domaines incluent le domaine "Par défaut" pour enregistrer des éléments avec une sémantique bien définie (par exemple, les valeurs NODATA), le domaine "SUBDATASETS" pour enregistrer les pointeurs vers une liste d'images dans un seul raster multidimensionnel (par exemple, HDF5 (Hierarchical Data Format 5), un format populaire dans la communauté scientifique pour stocker des structures de données multi-objets telles que des images raster et des tableaux multidimensionnels), le domaine "IMAGE_STRUCTURE" pour enregistrer la méthode de stockage de l'image raster sur disque (par exemple, le type de compression), le domaine « IMAGERY » pour les données de télédétection, si disponibles, et les domaines « xml : » pour le stockage des documents XML.

      4.1.3 Modèle de données abstrait vectoriel OGR

      Grâce à une interface unifiée pour les utilisateurs, le modèle de données abstrait vectoriel OGR prend en charge de nombreux formats de données vectorielles couramment utilisés, y compris les formats spécifiques au SIG (par exemple, ESRI Shapefile et Geodatabase et Mapinfo), CAD (par exemple, DXF), RDBMS (par exemple, PostGIS, Oracle), bases de données NoSQL (par exemple, MongoDB), bases de données portables (par exemple, Spatialite), formats d'échange (par exemple, KML et GeoJSON), WebService (par exemple, WFS et CartoDB), etc. (Figure 1).

      Le modèle de données abstrait vectoriel OGR comprend principalement des couches vectorielles et leur SRS (Figure 2). Les couches vectorielles représentent un ensemble d'objets géométriques (appelés entités) avec une ou plusieurs couches. Chaque couche peut avoir plusieurs caractéristiques qui consistent généralement en un type de classe géométrique (par exemple, des polygones pour représenter les districts administratifs) ainsi qu'un ensemble d'attributs (par exemple, la population de chaque district administratif individuel). En tant qu'éléments de base du modèle de données abstrait vectoriel OGR, les classes de géométrie encapsulent les données vectorielles du modèle OpenGIS et représentent divers types de géométrie vectorielle (notamment point, ligne, polygone, multipoint, multiligne, multipolygone, etc. ).

      La capacité des données vectorielles à représenter les relations spatiales entre les objets géométriques, en particulier les relations topologiques (par exemple, la connectivité entre les lignes, la contiguïté entre les polygones et l'enceinte entre les polygones imbriqués), est un avantage important lors de l'exécution d'une analyse géospatiale (par exemple, une analyse de réseau). Certains formats de données vectorielles existants, tels que le format vectoriel TopoJSON et GRASS GIS, prennent en charge cette capacité en déclarant et en stockant explicitement les relations topologiques. Cependant, le modèle de données abstrait vectoriel OGR ne prend pas en charge nativement la création ou la préservation de données de relations topologiques, bien que cette fonctionnalité ait été proposée comme une future orientation potentielle du développement de GDAL/OGR (Rouault, 2017). Par conséquent, OGR peut actuellement lire des données vectorielles à partir de ces formats qui stockent des relations topologiques, mais ne peut pas écrire les données de relations topologiques dans ces formats.

      OGR adopte nativement SQL (Structured Query Language) pour gérer les objets géométriques dans les données vectorielles, telles que la sélection et la mise à jour des objets par attributs ou types de géométrie. Alternativement, il est possible d'utiliser le dialecte SQLite, et ainsi de bénéficier des fonctions spatiales fournies par les extensions spatiales de SQLite-Spatialite, par exemple, interroger des objets géométriques qui coupent une zone rectangulaire donnée. De plus, pour les données vectorielles qui stockent les attributs de couche dans une base de données, OGR peut obtenir des fonctionnalités plus riches en transmettant les commandes SQL au pilote de base de données sous-jacent.

      4.2 Grande flexibilité des interfaces de programmation

      Warmerdam (2008) a déclaré : «les bibliothèques doivent rendre les interfaces telles que la gestion des erreurs et les E/S du système de fichiers hookables pour un contrôle maximal des applications,” et cette directive est implémentée dans la bibliothèque GDAL/OGR. GDAL/OGR fournit aux développeurs de nombreuses API fines pour contrôler avec précision le flux de travail général des E/S, comme l'ouverture du fichier de données (ou de la base de données), la récupération d'une bande raster ou d'une couche vectorielle, la lecture de données, la création du fichier de sortie et la libération de ressources. Les développeurs peuvent non seulement invoquer ces API pour manipuler les données géospatiales avec les formats pris en charge, mais également créer leurs propres pilotes pour les formats de données spécifiques à l'application (les lecteurs intéressés peuvent se référer aux didacticiels officiels GDAL/OGR d'implémentation du pilote raster et du pilote vectoriel).

      Puisqu'il est écrit en langage C/C++, GDAL/OGR est intrinsèquement compatible avec toutes les plates-formes et portable, il est donc capable de fonctionner sur presque tous les systèmes grand public (y compris Linux, Windows, macOS, Andriod, etc.). Les API GDAL/OGR peuvent être utilisées directement à partir de C/C++ et peuvent également être « encapsulées » pour une utilisation avec d'autres langages de programmation dominants (Python, Perl, VB, C#, Java, etc.).

      4.3 Haute efficacité du traitement de données géospatiales volumineuses

      Comme les applications géospatiales doivent gérer des volumes de données de plus en plus volumineux, GDAL fournit trois techniques principales pour accéder ou parcourir plus efficacement une bande raster avec une grande quantité de données : aperçus, tuiles et pyramides. Un aperçu est éventuellement généré en sous-échantillonnant la bande raster à une résolution plus grossière et peut être stocké dans un fichier externe (par exemple, un fichier avec le suffixe ".ovr” pour GeoTIFF) ou inclus dans les données raster (Figure 2). La vue d'ensemble est utile pour afficher rapidement la bande raster sous-jacente avec une résolution plus grossière. Les tuiles sont conçues comme des sous-ensembles de la bande raster à la même résolution et enregistrées en tant que fichiers séparés auxquels on peut accéder plus efficacement pour les sous-zones d'intérêt dans la bande raster, ce qui est particulièrement utile dans le contexte des applications de services Web. Les pyramides sont des combinaisons de tuiles et d'aperçus à différents niveaux. À chaque niveau, la bande raster avec une résolution grossière (c'est-à-dire la vue d'ensemble à ce niveau) est divisée en un certain nombre de tuiles. Toutes les tuiles ont la même taille, quel que soit le niveau (par exemple, 256 × 256 cellules). Les pyramides sont utiles pour accélérer les opérations de zoom avant/arrière dans les applications SIG telles qu'ArcMap et Google Earth.

      Conçus pour les données raster à grand volume hébergées sur le réseau, les systèmes de fichiers virtuels GDAL prennent en charge l'accès direct aux données stockées sur un réseau plutôt que de télécharger l'ensemble de données complet sur un disque local, ce qui est important pour utiliser efficacement les données géospatiales ouvertes qui sont de plus en plus disponible sur le net. Depuis la version 3.1, GDAL prend en charge Cloud Optimized GeoTIFF (COG), qui est un GeoTIFF standard avec un fichier externe supplémentaire stockant les métadonnées, les aperçus et les informations de tuilage nécessaires pour localiser efficacement les données requises pour le traitement géospatial sans serveur spécialisé.

      En ce qui concerne les données vectorielles, l'OGR prend en charge l'indexation spatiale basée sur le quadtree pour accélérer l'accès (c'est-à-dire l'interrogation) aux données filtrées spatialement. Par exemple, le pilote OGR Shapefile utilise un fichier d'indexation spatiale (.qix), qui a le même format que celui de MapServer.

      Outre l'accès et l'exploration hautement efficaces des données géospatiales introduits ci-dessus, deux mécanismes importants ont été conçus pour que GDAL/OGR traite efficacement de gros volumes de données géospatiales (par exemple, la réalisation d'algèbres raster) : la mise en cache de blocs et la cartographie de la mémoire virtuelle (cette dernière n'est actuellement que implémenté pour Linux). Dans le mécanisme de mise en cache de bloc, un bloc correspond à la taille de stockage physique successive des données de bande raster sur le disque, qui peuvent être des bandes d'une ou plusieurs lignes de balayage ou tuiles avec une hauteur et une largeur uniformes (Figure 2). En exposant la taille du bloc à GDAL, les données raster volumineuses peuvent être lues et traitées efficacement bloc par bloc avec une surcharge minimale. Lorsque les utilisateurs souhaitent effectuer des calculs globaux, zonaux et focaux sur des données raster volumineuses, la pratique régulière consistant à charger l'intégralité des données en mémoire peut échouer si la capacité de RAM du système est dépassée. Pour résoudre ce problème, le mécanisme de mappage de mémoire virtuelle permet de créer un tableau de manière transparente sans lire aucune valeur de cellule, puis les données correspondant aux zones d'intérêt et aux cellules voisines sont récupérées si nécessaire. Les données récupérées sont conservées dans un cache RAM (10 Mo par défaut) avec une stratégie la moins récemment utilisée.

      Les trois méthodes directes d'utilisation de GDAL/OGR sont (1) la méthode par programmation, c'est-à-dire dans laquelle les API GDAL/OGR sont invoquées pour accéder aux données géospatiales (2) la méthode en ligne de commande, dans laquelle des utilitaires GDAL/OGR spécifiques sont exécutés pour traiter les données géospatiales dans un environnement de ligne de commande et (3) la méthode GUI, dans laquelle les utilitaires GDAL/OGR sont encapsulés en tant qu'interfaces utilisateur dans un logiciel SIG (par exemple, QGIS) afin d'assembler les commandes requises et de les exécuter en arrière-plan. La figure 3 illustre un exemple simple de calcul de statistiques pour les bandes raster dans les données GeoTIFF à l'aide de chacune de ces trois méthodes. En utilisant la méthode par programmation, trois API principales sont utilisées dans l'exemple d'extrait de code Python, c'est-à-dire ouvrir un fichier de données, obtenir des données de bande raster unique et obtenir/calculer des statistiques pour cette bande raster (Figure 3). En utilisant la méthode de ligne de commande, une commande de l'utilitaire GDAL (gdalinfo) imprime des statistiques détaillées pour chaque bande raster ainsi que d'autres métadonnées des données GeoTIFF (Figure 3). La méthode GUI fournit un guide convivial pour exécuter la méthode de ligne de commande, mais sans paramétrage manuel sujet aux erreurs (Figure 3).

      Figure 3. Trois méthodes directes d'utilisation de GDAL/OGR : un exemple de calcul de statistiques de bandes raster dans des données GeoTIFF. Source : auteurs.

      En général, la méthode programmatique permet aux développeurs utilisant les API GDAL/OGR de contrôler les données géospatiales dans leurs applications spécifiques à des problèmes d'une manière précise, mais peut-être fastidieuse. Dans la méthode de ligne de commande, les utilitaires GDAL/OGR traitent de manière efficace et concise les données géospatiales dans le cadre de leurs fonctionnalités limitées. La méthode GUI peut efficacement soulager les utilisateurs (en particulier les utilisateurs peu familiers avec les interfaces de ligne de commande) du fardeau d'apprendre à utiliser directement les utilitaires GDAL/OGR et leurs paramètres correspondants.

      Le tableau 1 répertorie brièvement quatre catégories principales d'utilitaires GDAL/OGR actuels pour la manipulation de données géospatiales, notamment la découverte de données, l'unification des formats de données et des systèmes de référence spatiale, le traitement DEM et l'optimisation de l'accès aux données géospatiales. Les lecteurs intéressés peuvent trouver une liste complète sur https://gdal.org/programs/index.html.

      • Informations de liste (métadonnées, statistiques, listes de champs, etc.) de raster (gdalinfo) ou vecteur (ogrinfo) données géospatiales.
      • Interrogation des informations d'une cellule (par exemple, emplacement et valeurs) dans les données raster (gdallocationinfo) ou les caractéristiques géographiques d'une donnée vectorielle sélectionnée par cadre de délimitation ou expression SQL (ogrinfo).
      • Extraction de données raster dans une sous-fenêtre (gdal_translate) ou des données vectorielles via une expression SQL (ogr2ogr).
      • Conversion de formats de données (gdal_translate et ogr2ogr).
      • Géoréférencement, reprojection et transformation pour un SRS cohérent (gdalwarp, gdaltransformer, et ogr2ogr).
      • Polygonisation à partir d'un raster (gdal_polygoniser) ou rastériser à partir de géométries vectorielles (gdal_rasterize).
      • Rééchantillonnage et mosaïquage de données raster (gdalwarp, gdal_merge, et gdalbuildvrt) ou fusionner des données vectorielles (ogrmerge).
      • Création d'un DEM à partir de données dispersées (gdal_grid) ou des courbes de niveau (gdal_rasterize + gdal_fillnodata.py, les données de démonstration et les commandes peuvent être trouvées à partir de ce lien).
      • Remplissage des vides (ou des cellules NODATA) dans une donnée raster en tant que DEM (gdal_fillnodata).
      • Dérivation des courbes de niveau (gdal_contour) ou des ensembles de données d'attributs topographiques communs (par exemple, ombrage, pente, aspect et bassin de vision) (gdaldem et gdal_viewshed) d'un DEM.
      • Utilisation d'un mode de stockage physique spécifique (c'est-à-dire, mode tuile ou mode bande, voir Figure 2) pour stocker les données raster (gdal_translate).
      • Génération de tuiles de raster (gdal2tiles) et vecteur (ogrtindex) données pour WebService.
      • Création d'aperçus pour les données raster (gdaladdo).

      Du point de vue de la prise en charge de divers formats de données géospatiales, une partie de la puissance de GDAL/OGR peut également être attribuée au fait qu'il est couplé ou intégré à d'autres bibliothèques d'E/S de données géospatiales crédibles existantes pour des formats de données spécifiques. Parmi celles-ci se trouvent trois bibliothèques qui ont été des contributeurs majeurs à GDAL depuis ses débuts : libyen, libgeotiff, et shapelib. Ces bibliothèques peuvent se substituer à GDAL/OGR dans les cas de programmation où seuls leurs formats spécifiques doivent être pris en compte, tels que le libhdf5 bibliothèque pour le format HDF5, libnetcdf pour NetCDF (Network Common Data Form), et libspatialite pour Spatilité.

      Certaines bibliothèques d'E/S de données géospatiales qui pourraient être plus adaptées aux débutants ont également été développées sur la base de GDAL/OGR, en particulier pour les développeurs utilisant d'autres langages (par exemple, Python). Les API GDAL/OGR qui ont été encapsulées pour d'autres langages (par exemple, Python) exposent autant d'interfaces détaillées que les API C/C++ d'origine en invoquant directement les fonctions C correspondantes. Étant donné que les API encapsulées fournissent une abstraction très limitée pour leurs API C, le code d'appel peut être fastidieux et non intuitif. Par exemple, la procédure pour obtenir un nombre de fonctionnalités dans un Shapefile avec GDAL/OGR rappelle un style de codage C++, plutôt qu'un style construit autour de la manipulation d'objets de type fichier Python (par exemple, en utilisant avec déclaration). De plus, les développeurs doivent tenir compte des problèmes de gestion de la mémoire induits par l'utilisation du langage C (par exemple, libérer explicitement des ressources après leur utilisation). Cette situation n'est pas conviviale pour les développeurs qui ne sont pas familiarisés avec C/C++. Par conséquent, certaines bibliothèques basées sur GDAL/OGR ont été construites, telles que les bibliothèques Python Rasterio et Fiona, qui se concentrent respectivement sur les données raster et vectorielles. Ils utilisent des types de données, des fonctions et des classes Python plus idiomatiques et peuvent donc être plus conviviaux pour les débutants.

      Les tendances récentes de développement et d'utilisation de GDAL/OGR ont été motivées par le volume croissant de données géospatiales (en particulier les gros volumes de données disponibles sur le Web) plutôt que par la croissance du nombre de formats de données disponibles, et cela devrait se poursuivre dans le avenir. Les processus d'E/S de données gourmands en ressources nécessaires pour gérer ces grands ensembles de données ont été et continueront d'être un goulot d'étranglement pour les applications d'analyse géospatiale. À l'ère du big data et du cloud computing, la haute performance devrait être une préoccupation majeure, afin que les applications d'analyse géospatiale puissent tirer pleinement parti de la cyberinfrastructure et faciliter les tâches d'analyse géospatiale complexes pour les utilisateurs.

      L'E/S de données parallèles est une solution directe et de longue date au problème des goulots d'étranglement. Les E/S de données parallèles permettent plusieurs unités de traitement, qui peuvent varier entre différents modèles de calcul parallèles (par exemple, fils dans le modèle de multitraitement ouvert (OpenMP) disponible pour les processeurs multicœurs, ou processus dans le modèle d'interface de passage de messages (MPI) disponible pour un ordinateur ou un cluster), pour lire et écrire leurs données simultanément. Étant donné qu'un ensemble de données au sein de GDAL/OGR ne peut pas être utilisé par plusieurs threads en même temps (c'est-à-dire que GDAL/OGR n'est pas sécurisé pour les threads), certains efforts visant à obtenir des E/S de données parallèles au niveau du processus (Qin et al., 2014 Tarboton, 2016 Miao et al., 2017) ont été réalisés ces dernières années pour implémenter des E/S de données parallèles basées sur MPI au format GeoTIFF, qui est l'un des formats de données raster géospatiales les plus utilisés. Qin et al. (2014) ont montré que lors de la décomposition de domaine par colonne ou par bloc, l'E/S de données parallèle utilisant GDAL est très inefficace et ne peut pas produire une sortie correcte. Ils ont proposé une stratégie d'E/S en deux phases pour surmonter ce problème en mappant et en répartissant les données entre plusieurs processus avant le début des opérations d'écriture (Qin et al., 2014). Cette stratégie n'a été testée que sur des données raster stockées en mode bande et n'est applicable que pour l'équilibrage de charge statique. Miao et al. (2017) ont proposé une stratégie de planification dynamique via des techniques de mappage de stockage et d'arrangement des données qui peuvent synchroniser les E/S de données pour les données raster stockées à l'aide du mode bande ou tuile.

      Les orientations futures du développement de GDAL/OGR peuvent inclure : (1) la résolution des problèmes de thread-safe des ensembles de données GDAL pour autant de pilotes de formats de données géospatiales communs que possible et (2) la prise en charge native des E/S de données parallèles sur différents types de machines informatiques, en particulier l'environnement informatique en nuage distribué, pour promouvoir des applications d'analyse géospatiale basées sur le nuage hautes performances et permettre un traitement géospatial à la volée. Cette dernière direction devrait être particulièrement ciblée pour GDAL/OGR ainsi que pour d'autres bibliothèques d'E/S potentielles.

      Contributeurs GDAL/OGR (2020). Bibliothèque de logiciels d'abstraction de données géospatiales GDAL/OGR. Fondation Géospatiale Open Source. URL https://gdal.org

      Miao, J., Guan, Q., & Hu, S. (2017). pRPL + pGTIOL : Le mariage d'une bibliothèque de traitement parallèle et d'une bibliothèque d'E/S parallèles pour les données raster volumineuses. Modélisation environnementale et logiciel d'amp, 96, 347-360. DOI : 10.1016/j.envsoft.2017.06.031

      Contributeurs PROJ (2020). Bibliothèque logicielle de transformation de coordonnées PROJ. Fondation Géospatiale Open Source. URL https://proj.org/

      Qin, C.-Z., Zhan, L.-J., & Zhu, A.-X. (2014). Comment appliquer correctement la bibliothèque d'abstraction de données géospatiales (GDAL) aux E/S raster géospatiales parallèles ? Transactions en SIG, 18(6), 950-957. DOI : 10.1111/tgis.12068

      Rouault, E. (2017). GDAL 2.2 – Quoi de neuf ? FOSS4G EUROPE 2017, 18-22 juillet, Paris.

      Tarboton, D.G. (2016). Analyse de terrain à l'aide de modèles d'altitude numériques (TauDEM 5.3.7). http://hydrology.usu.edu/taudem/. (Consulté le 19 octobre 2016).

      Warmerdam, F. (2008). La bibliothèque d'abstraction de données géospatiales. Dans G. B. Hall & M. G. Leahy (Eds.), Open Source Approaches in Spatial Data Handling (pp. 87-104). Springer. DOI : 10.1007/978-3-540-74831-1_5


      Matériel pédagogique

      L'information géospatiale ouverte et son rôle dans la réponse aux objectifs de développement durable des Nations Unies

      L'idée de ce matériel de formation est basée sur le fait qu'au cours des deux dernières décennies, d'importantes quantités de données géospatiales sont devenues librement disponibles et accessibles. Cette situation s'est traduite par une multitude d'initiatives mondiales, ainsi que par des services Web locaux et des projets sur un éventail de sujets et, en tant que relation de cause à effet cyclique, cela a conduit à un mouvement de données ouvertes qui s'est propagé des données de recherche aux données publiques, pour données pilotées par la communauté. Le tableau suivant présente quelques ensembles de données géospatiales disponibles gratuitement qui ont été pris en compte, en ce qui concerne leur applicabilité pour une analyse d'indicateurs ODD géospatiaux. Attention, ce tableau est loin d'être exhaustif, mais plutôt vivant. Nous invitons quiconque à ajouter d'autres ensembles de données géospatiales disponibles.

      Non. Sujet Collecte de noms/ensemble de données Abstrait indicateurs Producteur/collectionneur Propriétaire Licence Type de données Format Échelle/résolution spatiale Édition SCR Couverture géographique URL
      1 Eau Carte hydrogéologique mondiale Les objectifs du Programme mondial de cartographie et d'évaluation hydrogéologiques (WHYMAP) sont de résumer les informations sur les eaux souterraines à l'échelle mondiale, de montrer les données sur les eaux souterraines sur des cartes et des applications cartographiques. ressources en eaux souterraines, bassins fluviaux et souterrains, aquifère karstique UNESCO&all BGR et l'UNESCO détiennent les droits d'auteur sur les données et les cartes fournies ici. style="width: 200px"Les cartes peuvent être reproduites sans autre autorisation du propriétaire du droit d'auteur à condition qu'une mention à BGR & UNESCO soit incluse dans les présentations et les publications. vecteur Géodatabase Esri, SHP Exemple 2008 Géographique WGS84 Exemple Exemple
      2 Eau Ensemble de données global des largeurs de rivière Ensemble de données mondial sur la largeur des rivières développé à partir d'images Landsat largeurs de rivière Allen, George H., & Pavelsky, Tamlin M. n / A CC BY 4.0 vecteur, raster Fichier de formes ESRI, TIFF 30 mètres 2018 Géographique WGS84 Global https://zenodo.org/record/1297434
      3 Eau GFPLAIN250m Un jeu de données mondial haute résolution des plaines inondables de la Terre. plaines inondables Nardi, F. et al. Part de figue n / A CC BY 4.0 raster TIF 250 mètres 2018 Géographique WGS84 Global https://www.nature.com/articles/sdata2018309#data-records
      4 Développement urbain Établissement humain mondial Couche d'informations multitemporelles sur la présence accumulée dérivée des collections d'images Landsat (GLS1975, GLS1990, GLS2000 et collection ad hoc Landsat 8 2013/2014). accumulation distribution spatiale, population Centre commun de recherche UE Centre commun de recherche UE Politique de l'UE sur les données libres et ouvertes raster TIF 38 mètres 1975, 1990, 2000, 2014/ 2015 Mercator sphérique (EPSG:3857) Global https://ghsl.jrc.ec.europa.eu/datasets.php
      5 Changement climatique FOODSEC Météodonnées FOODSEC reçoit les sorties quotidiennes, décennales et mensuelles des modèles de circulation mondiale de l'ECMWF (Centre européen de prévision météorologique à moyen terme). Toutes les données sont agrégées pour des périodes de 10 jours. Estimation des précipitations, rayonnement solaire, évapotranspiration et température (min, max, moy) MétéoConsult Union européenne, 2011-2014. Données EC-JRC-MARS créées par MeteoConsult sur la base des sorties du modèle ECWMF (Centre européen pour les prévisions météorologiques à moyen terme) n / A raster Format SPIRITUEUX 0,25 X 0,25 degrés intérimaire : 1989 - 2012 / opérationnel : 2008 - présent Géographique WGS84 Global http://spirits.jrc.ec.europa.eu/download/downloaddata/downloadmeteodata/
      6 Changement climatique CHIRPS Climate Hazards Group InfraRed Precipitation with Station data (CHIRPS) est un ensemble de données pluviométriques quasi-globales de plus de 30 ans. S'étendant de 50 ° S à 50 ° N (et toutes les longitudes), à partir de 1981 jusqu'à aujourd'hui, CHIRPS intègre des images satellite à une résolution de 0,05 ° avec des données de station in situ pour créer des séries chronologiques de précipitations maillées pour l'analyse des tendances et la surveillance saisonnière de la sécheresse. Depuis le 12 février 2015, la version 2.0 de CHIRPS est complète et disponible au public. pluie USGS USGS (?) CC0 raster TIF BIL, NetCDF 0,05 x 0,05 degré 1981 - presque présent Géographique WGS84 global http://chg.geog.ucsb.edu/data/chirps/
      7 Développement urbain GUF GUF est une carte raster mondiale des modèles de peuplement dans le monde construite à l'aide de l'imagerie satellite radar (SAR) des deux satellites allemands TerraSAR X et TanDEM X. Un ensemble de données d'environ 180 000 images SAR à très haute résolution avec une résolution au sol d'environ 3 m a été traité. pour cet ensemble de données. établissements humains DLR DLR =HYPERLINK("https://www.dlr.de/eoc/en/Portaldata/60/Resources/dokumente/guf/DLR-GUF_LicenseAgreement-and-OrderForm.pdf","ouvert pour les portées scientifiques et non commerciales") raster GéoTIFF 12, 84 mètres 2016 Géographique WGS84 global https://www.dlr.de/eoc/en/desktopdefault.aspx/tabid-11725/20508_read-47944/
      8 Santé, nutrition et population Population maillée du monde La collection Gridded Population of the World (GPW), maintenant dans sa quatrième version (GPWv4), modélise la distribution de la population humaine (nombres et densités) sur une surface raster globale continue. Les intrants essentiels de GPW ont été les tableaux de recensement de la population et les limites géographiques correspondantes. L'objectif de GPW est de fournir une couche de population spatialement désagrégée qui est compatible avec les ensembles de données des disciplines sociales, économiques et des sciences de la Terre, et de la télédétection. nombres de population répartis dans l'espace Institut de la Terre, Université Columbia Université Columbia CC BY 4.0 raster GéoTIFF, ASCII 30 secondes d'arc (environ 1 km) 2000, 2005, 2010, 2015, 2020 Géographique WGS84 global http://sedac.ciesin.columbia.edu/data/collection/gpw-v4
      9 Santé, nutrition et population WorldPop Des données contemporaines à haute résolution sur la répartition des populations humaines et leurs compositions sont une condition préalable à la mesure précise des impacts de la croissance démographique, au suivi des changements et à la planification des interventions. Le projet WorldPop a été lancé en 2013 pour unir les projets continentaux AfriPop, AsiaPop et AmeriPop, dans le but de produire des cartes de répartition et de composition de la population détaillées et librement disponibles pour l'ensemble de l'Amérique centrale et du Sud, de l'Afrique et de l'Asie. densité de population, naissances, grossesses, changements urbains, indicateurs de développement et de santé, structures par âge, rations de dépendances, flux migratoires internes, données de vol mondiales Institut GeoData, Univ. de Southampton Institut GeoData, Univ. de Southampton CC BY 4.0 raster GéoTIFF 100 mètres divers, selon le pays Géographique WGS84 Afrique, Asie Centrale+Amérique du Sud http://www.worldpop.org.uk/data/get_data/
      10 Eau Surface mondiale de l'eau Les jeux de données disponibles sont destinés à montrer différentes facettes de la distribution spatiale et temporelle des eaux de surface au cours des 32 dernières années. Certains de ces ensembles de données sont destinés à être cartographiés (par exemple, la couche de saisonnalité) et d'autres sont destinés à montrer le changement temporel à des emplacements spécifiques (c'est-à-dire l'histoire de l'eau). occurrence de l'eau de surface, intensité du changement d'occurrence, saisonnalité, récurrence, transition, étendue maximale de l'eau, récurrence mensuelle, histoire mensuelle de l'eau, Centre commun de recherche UE Centre commun de recherche UE Politique de données ouvertes de Copernicus raster GéoTIFF 30 mètres 1984 - 2015, 1984-1999 et 2000-2015, 2014-2015, 1984-2015, 2014-2015, 1984-2015 Géographique WGS84 global https://global-surface-water.appspot.com/download
      11 Environnement et ressources naturelles Arpentage mondial des terres - GLS La collection Global Land Survey se compose d'images acquises de 1972 à 2012 combinées en un seul ensemble de données. Tous les jeux de données Global Land Survey contiennent les bandes Landsat standard désignées pour chaque capteur. Exemple NASA&USGS NASA&USGS données ouvertes (?!) raster GéoTIFF 30 m, 60 m - MS 1975, 1990, 2000, 2005, 2010 UTM global https://landsat.usgs.gov/global-land-surveys-gls
      12 Environnement et ressources naturelles Initiative sur le changement climatique - Couverture terrestre Dans le cadre de la Climate Change Inititiave (CCI) de l'ESA, le projet Land_Cover_cci s'intéresse à la génération de la variable climatique essentielle de l'occupation du sol. La couverture terrestre est définie comme la matière physique à la surface de la terre. Les couvertures terrestres comprennent l'herbe, l'asphalte, les arbres, le sol nu, l'eau, etc. couverture terrestre, NDVI, neige, zones brûléesa, plans d'eau Agence spatiale européenne Agence spatiale européenne Politique de données ouvertes de Copernicus raster GéoTIFF, NetCDF4 Résolution spatiale de 300 m pour trois périodes de 5 ans centrées sur les années 2010 (2008-2012), 2005 (2003-2007) et 2000 (1998-2002) 2010 (2008-2012), 2005 (2003-2007) et 2000 (1998-2002) Géographique WGS84 global https://www.esa-landcover-cci.org/?q=node/164
      13 Agriculture et sécurité alimentaire La Banque mondiale - Indicateurs du développement dans le monde La principale collection d'indicateurs de développement de la Banque mondiale, compilée à partir de sources internationales officiellement reconnues. Il présente les données de développement mondial les plus récentes et les plus précises disponibles, et comprend des estimations nationales, régionales et mondiales. Agriculture et développement rural Banque mondiale Banque mondiale données ouvertes tabulaire csv, xls n / A 2005-2018 n / A global https://data.worldbank.org/indicator
      14 Agriculture et sécurité alimentaire Perspectives agricoles de l'OCDE-FAO (Édition 2017) Les bases de données de l'OCDE sur l'agriculture constituent une collection unique de statistiques agricoles et fournissent un cadre pour la quantification et l'analyse de l'économie agricole. Cela comprend des prévisions concernant l'évolution des principaux marchés et produits agricoles, des estimations détaillées du soutien politique, ainsi que des indicateurs de performance environnementale de l'agriculture. Les données concernent à la fois les pays de l'OCDE et les économies non membres. Production agricole, politique agricole, pêche, agriculture durable Organisation de coopération et de développement économiques Organisation de coopération et de développement économiques données ouvertes tabulaire xls, csv, xml n / A 2016 - 2026 n / A cvasi-global https://data.oecd.org/agriculture.htm
      15 Eau HydroCABANONS HydroSHEDS (données et cartes hydrologiques basées sur les dérivés d'élévation de la navette à plusieurs échelles) fournit des informations hydrographiques dans un format cohérent et complet pour les applications à l'échelle régionale et mondiale. les réseaux de cours d'eau, les limites des bassins versants, les directions de drainage et les couches de données auxiliaires telles que les accumulations de débit, les distances et les informations sur la topologie des rivières. US Geological Survey (USGS) le Centre international d'agriculture tropicale (CIAT) The Nature Conservancy (TNC) Université McGill, Montréal, Canada l'Australian National University, Canberra, Australie et le Center for Environmental Systems Research (CESR), Université de Kassel, Allemagne. US Geological Survey (USGS) le Centre international d'agriculture tropicale (CIAT) The Nature Conservancy (TNC) Université McGill, Montréal, Canada l'Australian National University, Canberra, Australie et le Center for Environmental Systems Research (CESR), Université de Kassel, Allemagne. données ouvertes vecteur, raster shp, ESRI GRID, ESRI BIL 3s (environ 90m), 15s (environ 500m), 30s (environ 1km), 5m (environ 10 km) selon les régions, 2006, 2007, 2008 ou 2009 Géographique WGS84 global https://hydrosheds.cr.usgs.gov/dataavail.php
      16 Développement urbain Couches d'unités administratives globales (GAUL) Le GAUL compile et diffuse les meilleures informations disponibles sur les unités administratives pour tous les pays du monde, apportant une contribution à la standardisation du jeu de données spatiales représentant les unités administratives. Parce que GAUL travaille au niveau mondial, des territoires non colonisés sont signalés. GAUL est publié une fois par an et le bénéficiaire cible des données GAUL est la communauté des Nations Unies et d'autres partenaires internationaux et nationaux autorisés. Les données peuvent ne pas être officiellement validées par des sources nationales faisant autorité et ne peuvent pas être distribuées au grand public. Une clause de non-responsabilité doit toujours accompagner toute utilisation des données GAUL. couches mondiales avec un système de codage unifié au niveau des pays, premier (par exemple, départements) et deuxième niveaux administratifs (par exemple, districts). Lorsque des données sont disponibles, elles fournissent des couches pays par pays jusqu'aux troisième, quatrième et niveaux inférieurs. FAO-ONU FAO-ONU données non ouvertes vecteur, raster n / A n / A 1990 - 2015 Géographique WGS84 global http://www.fao.org/geonetwork/srv/en/metadata.show?id=12691
      17 Développement urbain Base de données des zones administratives mondiales Le GADM veut cartographier les zones administratives de tous les pays, à tous les niveaux d'arrondissement. Une résolution spatiale élevée et un ensemble étendu d'attributs sont utilisés. unités administratives Université de Californie, Davis. n / A usage non commercial vecteur Geopackage, shpafile, KMZ n / A 2018 Géographique WGS84 global https://gadm.org/data.html


      Description de l'ensemble de données sur la population
      Description du jeu de données sur les unités administratives globales
      Pour les données relatives aux routes, nous avons décidé d'utiliser les données OpenStreetMap car il s'agit du seul ensemble de données mondialement conçu de manière homogène. Sans aucun doute, la quantité et la qualité des données disponibles pour diverses régions du monde peuvent varier de manière constante. Cependant, étant donné la définition claire et cohérente de chaque élément de carte et balise, cet exercice devrait être reproductible dans n'importe quelle autre partie du monde.
      Pourtant, compte tenu de notre zone d'intérêt, le comté de Tabora en Tanzanie, nous devons prendre en considération les développements spécifiques pour l'Afrique, plus précisément, le Highway Tag Africa - Topology of Road Network in African countries, et en outre, les East Africa Tagging Guidelines.
      Cependant, compte tenu de la réplicabilité globale de notre matériel pédagogique, nous insérerons également des spécifications à une échelle plus générale. Bien entendu, il faut reconnaître que le workflow présenté ici pourrait nécessiter d'autres ajustements par rapport à la spécificité du jeu de données routières utilisé dans le calcul.

      Préparation des données géospatiales

      Pour la portée de cet exercice, nous avons choisi le comté de Tabora en Tanzanie. Alors que nous nous efforçons de créer un matériel pédagogique pouvant être appliqué quelle que soit la région d'intérêt, la décision a été prise d'utiliser les ensembles de données disponibles, au niveau mondial. Le tableau suivant présente les jeux de données utilisés :


      Voir la vidéo: Le périmètre dune figure