Export e-recolnat (darwin-core)
- Présentation générale
- Comment exporter une sélection de notices
- Comment préparer ou conserver un lot de notices exportées
- Particularités des données à exporter
- Détail des champs exportés
- Paramétrages à mettre en oeuvre
Présentation générale
L'export E-Recolnat permet de récupérer les données saisie dans Flora en générant automatiquement un fichier zip au format Darwin-Core
Ce standard est utilisé par les plus grandes entités internationales aggrégatrices des données sur la biodiversité. [ The Global Biodiversity Information Facility (GBIF) , The Encyclopedia of Life , The Atlas of Living Australia (ALA), The Ocean Biogeographic Information System (OBIS), Online Zoological Collections of Australian Museums (OZCAM), Mammal Networked Information System (MaNIS), ...]
Se conformer au label ReColNat, c'est donc la possibilité d'échanger ces données avec l'ensemble de ces organisations.
Définitions des entités
L'entité centrale du système d'information e-ReColNat est le spécimen lié à son image numérisée(Media) et ses références bibliographiques éventuelles. Au cours des siècles, le besoin naturel de regroupement des organismes vivants a vu l'émergence d'entités conceptuelles appelé taxon (Taxon). e-ReColNat mettra à disposition des chercheurs (Personne) des outils pour faciliter l'attribution d'un spécimen à un taxon. C'est la détermination. Le spécimen est stocké au sein d'une institution composée de chercheurs, et est issu d'une récolte. Cette dernière est définie par un lieu géographique bien précis et des récolteurs (Personne).
Entités Recolnat | Bases et Tables Flora |
Specimen : représente le spécimen physique identifié et maintenu dans des collections biologiques ou paléontologiques. | Biens et ensembles |
Media : représente une ressource multimédia, en l'occurrence une image, à noter que cette ressource possède une uri unique et persistante.(GUID) | Phototheque |
Bibliographie : concerne les références bibliographiques de la désignation de spécimens-types | Bibliothèque |
Taxon : représente les données liées à la taxonomie observables sur les étiquettes des images numérisées. | Noms scientifiques |
Récolte : “Quand, où, comment et par qui” un spécimen a été récolté. | Dans la notice Biens et ensemble de chaque spécimen. Une table Opérations est en cours de développement |
Géographie : représente avec précision où le spécimen a été récolté. | Lieux et Sites |
Biostratigraphie : répartition des espèces(souvent fossiles) dans les strates sédimentaires | Stratigraphie (table en cours de développement) |
Personne : représente les personnes physiques qui travaillent sur les collections : auteurs, déterminateurs, collecteurs. Ne sont pas représentés les utilisateurs du portail qui feront l'objet d'une autre spécification. | Personnes |
Institution : représente l'organisme (muséum, université, particulier, ...) qui collectionne et possède les spécimens en tant qu'objet physique. | Organismes |
Les identifiants uniques
Pour assurer le caractère unique des entités et facilité l'interopérabilité entre les systèmes distants, e-ReColNat génère pour chaque entité des identifiants uniques basé sur la norme UUID8.
6985ca4e-cc9a-11e4-a37b-b44a45aa1d54.
Dans l'export RecolNat de Flora ce sont les clés uniques (UNIQUE_KEY, nombre entiers) qui sont envoyées pour chaque entité et qui et utilisées par RecolNat pour la génération de cet identifian
Comment exporter une sélection de notices
Se connecter avec un utilisateur flora habilité à réaliser des exports eRecolnat
De facto, sur tous les résultats de recherches, apparaitra l'icône permettant de lancer l'export e-Recolnat de la selection de notices (ou de toutes les notices recherchées si vous n'en selectionnez aucune)
Choisir le modèle de publication. Si Flora hébérge plusieurs institutions, il faut choisir le modèle adapté à chacune d'elle (adresse, mail, noms...)
Récupérer le fichier zip en local sur le poste de travail
Le zip est généré avec le nom du modèle de publication et la date-heure du jour
C'est ce fichier zip qui doit être envoyé à recolnat, toutefois il est fortement recommandé de le passer dans le validateur du gbif avant envoi pour repérer les éventuelles anomalies
Comment préparer ou conserver un lot de notices exportées
dans la grille de saisie complete, le champ Lot d'export recolnat a été ajouté pour permettre de noter dans chaque notice le lot d'export en préparation ou réalisé. Ce champ peut être alimenté par modification par lot et les données de la liste de contrôles sont ouvertes
Ce champ est interrogeable en recherche experte sur les biens
Particularités des données à exporter
Correspondance du champ Nature
Ce champ est utilisé pour alimenter le champ BasisOfRecord qui est obligatoire, mais ne peut contenir que les valeurs en anglais définies ici http://rs.tdwg.org/dwc/terms/basisOfRecord
Pour éviter toute double saisie dans les notices des spécimens, la correspondance sera définie dans le thésaurus NATURE en utilisant le terme anglais de chaque terme. Exemple pour naturalisation
Cette correspondance de données doit etre réalisée avant l'export par l'administrateur de la base Flora
Export des photos liées
les fichiers images ne seront pas exportés en tant que tels. Le contenu du champ https://dwc.tdwg.org/list/#dwc_associatedMedia n'est constitué que d'url pointant vers des images accessibles en ligne sans vérification de droits d'accés préalable.
Les images gérées dans la photothèque de Flora seront donc exportées vers eRecolnat via leurs ark respectives; exemple : https://demobam.decalog.net/demov45/ark:/12345/003972356/doc/100153/medium
Cela présuppose que les ark ont été activées sur l'application Flora et que l'application est accessible en ligne sur internet
Détail des champs exportés
la liste de ces champs provient de
et de la documentation technique darwin-core dont les liens sont fournis ci dessous dans la colonne champ Recolnat. Ces llens permettent de connaitre les éventuelles règles de saisie pour le champ concernéexemple avec Nature du spécimen, ou seuls quelques termes en anglais sont acceptés,
Table des biens
LIbellé FLORA | Champ FLORA | LIbellé RECOLNAT | Champ RECOLNAT | Obligatoire | |
Clé Unique | UNIQUE_KEY | Identifiant unique et persistant représentant le spécimen
| http://rs.tdwg.org/dwc/terms/occurrenceID | o | |
valeur par défaut = fr | Langage | http://purl.org/dc/terms/language | |||
valeur par défaut=présent | Statut | http://rs.tdwg.org/dwc/terms/occurrenceStatus | |||
Numéro d'inventaire | NUM_INVENTAIRE | Code barre
| http://rs.tdwg.org/dwc/terms/catalogNumber | o | |
Modifié le | MODIFY_DATE | Date à laquelle le spécimen a été modifié | http://purl.org/dc/terms/modified | o | |
Nature | NATURE_SN | Nature du spécimen | http://rs.tdwg.org/dwc/terms/basisOfRecord | o | |
Champs texte libre du bloc découverte | PRECISIONS_COLLECTE, PRECISIONS_DECOUVERTE,PRECISIONS8GEO | Notes ou commentaires sur le spécimen | http://rs.tdwg.org/dwc/terms/occurrenceRemarks | ||
Numéro de fouille | NUM_FOUILLE | - | http://rs.tdwg.org/dwc/terms/recordNumber | ||
Inventeur découvreur collecteur | INVENTEUR | - | http://rs.tdwg.org/dwc/terms/recordedBy | ||
Nb objets | NB_OBJETS_LOT valeur par défaut 1 | - | http://rs.tdwg.org/dwc/terms/individualCount | ||
Sexe | SEXE_SN | sexe | http://rs.tdwg.org/dwc/terms/sex | ||
Phase | PHASE_SN | Stade de vie du spécimen au moment de sa récolte | http://rs.tdwg.org/dwc/terms/lifeStage | ||
Nature | NATURE_SN, termes en français | - | http://rs.tdwg.org/dwc/terms/preparations | ||
Copyright de la notice | COPYRIGHT | Information sur les droits de la ressource | http://purl.org/dc/terms/rightsHolder | ||
Précision mention des droits | PRECISION_MENTION_DROITS |
| http://purl.org/dc/terms/accessRights | ||
Constante définie dans le paramétrage | Nom ou acronyme de l'institution possédant les droits sur la ressource | http://rs.tdwg.org/dwc/terms/ownerInstitutionCode | |||
- | http://rs.tdwg.org/dwc/terms/collectionCode | ||||
Référence bibliographique | REF_BIBLIO | - | http://rs.tdwg.org/dwc/terms/associatedReferences | ||
Photo de consultation | PHOTO_INV.MUS_PHOTO.UNIQUE_KEY Attention le filtre de selection des images à exporter doit etre adapté dans la configuration de l'export, par défaut toutes les images sont exportées | Identifiant unique globale du média associé au spécimen on n'exporte pas l'image, mais un lien perenne permettant son affichage dans le fichier multimedia | https://dwc.tdwg.org/list/#dwc_associatedMedia | ||
Hote | HOTE | - | http://rs.tdwg.org/dwc/terms/associatedTaxa | ||
Autres numéros | NUM | - | http://rs.tdwg.org/dwc/terms/otherCatalogNumbers | ||
Lieu de découverte, site de fouille | SITE_DECOUVERTE terme en français du lieu et de ses parents hiérarchiques | - | http://rs.tdwg.org/dwc/terms/higherGeography | ||
Lieu de découverte, site de fouille | SITE_DECOUVERTE clé unique | - | http://rs.tdwg.org/dwc/terms/locationID | ||
Lieu de découverte, site de fouille | SITE_DECOUVERTE terme en français de plus bas niveau dans la hiérarchie | - | http://rs.tdwg.org/dwc/terms/locality | ||
Date de collecte | DATE_COLLECTE_DEBUT | - | http://rs.tdwg.org/dwc/terms/eventDate | ||
Nom du gisement | NOM_GISEMENT | - | http://rs.tdwg.org/dwc/terms/verbatimLocality | ||
Altitude basee | ALTITUDE_BASSE | - | http://rs.tdwg.org/dwc/terms/minimumElevationInMeters | ||
Altitude haute | ALTITUDE_HAUTE | - | http://rs.tdwg.org/dwc/terms/maximumElevationInMeters | ||
Profondeur | PROFONDEUR_SN | - | http://rs.tdwg.org/dwc/terms/verbatimDepth | ||
Lieu de découverte - coordonnées géo | SITE_DECOUVERTE.LATITUDE_GEO | - | http://rs.tdwg.org/dwc/terms/decimalLatitude | ||
Lieu de découverte - coordonnées géo | SITE_DECOUVERTE.LONGITUDE_GEO | - | http://rs.tdwg.org/dwc/terms/decimalLongitude | ||
Lieu de découverte - coordonnées géo | SITE_DECOUVERTE.PROJECTION_GEO Flora travaillant par défaut en RGF93? l'exporet prend en charge la conversion en WGS84 | - | http://rs.tdwg.org/dwc/terms/geodeticDatum | ||
Précisions découverte | PRECISIONS_DECOUVERTE | - | http://rs.tdwg.org/dwc/terms/georeferenceRemarks | ||
Identification du specimen | IDENTIFICATION_SPECIMEN on ne prend que l'identification actuelle | Nom complet taxonomique | http://rs.tdwg.org/dwc/terms/scientificName | ||
Identificateur | IDENTIFICATEUR | - | http://rs.tdwg.org/dwc/terms/identifiedBy | ||
Date identification | DATE_IDENTIFICATION | - | http://rs.tdwg.org/dwc/terms/dateIdentified | ||
Note sur l'identification | PRECISIONS_IDENTIFICATION | - | http://rs.tdwg.org/dwc/terms/identificationRemarks |
Paramétrages à mettre en oeuvre
Dans le profil de l'utilisateur réalisant l'export
Ajouter au groupe ou à l'utilisateur, le rôle ci dessous
une fois ce rôle attribué, l'icône d'export e-Recolnat apparaitra systématiquement sur tous les résultats de recherche de la table des biens
Dans les fichiers de configuration de l'export recolnat
conf/local/export/erecolnat/erecolnat_common.properties
Code de l'institution et lien vers l'organisme
on y définira le code de votre institution ainsi que le recordId de la notice Organisme contenant les données administratives
# Code de l'institution
dwc.terms.ownerInstitutionCode=NPS
# RecordId de la notice organisme contenant le nom, adresse, email du musée
eml.organisme.recordId=system:ORGANISME:1
# RecordId de la notice utilisateur contenant le Nom et prénom de l'utilisateur nommé dans le fichier eml de l'export
eml.utilisateur.recorId=system:UTILISATEUR:355
il est possible d'utiliser le nom et prénom de l'utilisateur conecté réalisant l'export, pour cela idiquer le paramétrage ci dessous
eml.utilisateur.recorId=${eml.session.user.recordId}
Url de l'application flora pour l'accés public aux ark images
Attention, les images ne sont pas envoyées en tant que fichier mais en tant que lien url vers l'image stockée dans la Photheque. il faut donc qu'un acces public aninyme soit activé sur l'application flora et que le service ark soit mis en oeuvre et opérationnel
# Chemin absolu de la racine de l'url a ajouter aux URL des ARK images
# Concernant la variable ${flora-url} :
# - sa valeur par defaut "http://localhost:8080/flora" est definie
# dans le parametre "default/flora-url" du fichier ../conf/app.xml
# - elle peut etre definie dans context.xml de la fa�on suivante :
# Exemple :
# <Environment name="flora-url" value="http://localhost:8080/flora"
# type="java.lang.String" override="false"/>
meta.ark.root.url=https://demobam.decalog.net/demov45/ark:
# Taille de l'image a ajouter aux URL des ARK images: [/low], [/medium], [/high]
meta.ark.image.size=/medium
Dans la table ORGANISME
renseigner leschamps ci dessous qui sont utilisé dans le fichier eml de l'export
Créer un modèle de publication e-Recolnat
Si le modèle de publication n'est pas déclaré dans la table system.REPORT, vérifier que le rôle "Administration modele de publication" dispose de la grille de saisie ci dessous
Puis créer le modele avec les données ci dessous
Comment gérer plusieurs institutions dans une même application FLora
il faudra dupliquer les modèles de publication de type Recolnat (11) et faire pointer chacun d'eux sur le fichier conf/local/export/erecolnat/erecolnat_common.properties concerné pour les rattacher au bon code d'institution et à la bonne notice de la table ORGANISME
exemple : premier modèle
deuxieme modele
interface pour déposer les fichiers properties dédiés aprés les avoir personnalisés
généralement, on ne modifiera que le fichier des paramétres spécifiques à l'institution, mais il faudra dupliquer le fichier erecolnat.properties pour pointer sur le bon fichier de paramétres d'institution. Il y aura donc à minima, deux fichiers à dupliquer par institution