Numérisation
Introduction
Le terme “numérisation” décrit l’enregistrement de l’information provenant des spécimens dans une forme numérique, ce qui permet à la fois la publication des données et une meilleure gestion des collections. La publication des données permet de les utiliser et de les étudier de différentes manières. La numérisation comprend les deux sous-catégories suivantes :
- La numérisation de l’information textuelle vise à enregistrer sous forme de texte l’information inscrite sur les étiquettes des spécimens. Par le terme “numérisation” on entend généralement la numérisation de l’information textuelle.
- La photographie vise à créer des images numériques des spécimens. Veuillez vous référer à la page photographie pour plus d’information.
La numérisation est un long processus et il est important d’optimiser son rendement et d’éliminer le plus possible les erreurs. Voir les documents pour de plus amples informations.
Outils
- Liste de de logiciels pour la gestion de collections biologiques
- North Carolina State University Chirographum Historicum, échantillons manuscripts des étiquettes de plus de 75 botanistes.
- Conservatoire et Jardin botaniques de la Ville de Genève Auxilium Ad Botanicorum Graphicem, échantillons manuscripts de botanistes, tels que publiés dans Candollea entre 1972 et 1979.
Documents
- Larry Speers, 2009. From ink to electrons : Issues to be considered
- GBIF, 2008. GBIF Training Manual 1 : Digitization of natural history collections data
- Frazier et al., 2008. Initiating a collection digitization project
- Morris, 2005. Relational database design and implementation for biodiversity informatics.
- Willemse & Mols, 2007. Data guidelines : Collection data registration at the Nationaal Herbarium Nederland
- Utah Valley University Herbarium How to build your own virtual herbarium
- Lampe & Striebing, 2005. How to digitize large insect collections? – Preliminary results of the dig project
Priorités du réseau Canadensys
Seulement une partie des collections du réseau Canadensys peuvent être numérisées grâce au financement disponible actuellement. Afin de maximiser l’utilisation des données générées aux fins de recherche, nous devons décider quels sont les priorités de numérisation.
L’information textuelle provenant de l’étiquette du spécimen est suffisante pour la plupart des recherches utilisant des données de collections biologiques. En général, cette information est le « Quoi, Où, Quand » d’un spécimen, mais bien souvent une information beaucoup plus riche se retrouve sur les spécimens et pourrait être utilisée. Il est difficile de prévoir toutes les utilisations qui vont être faites d’un jeu de données (voir Uses of primary species-occurrence data), et c’est donc toujours plus profitable de collecter le plus d’informations possible.
Étant donnée que toutes les informations sont publiées sous le standard Darwin Core, la consultation du guide de référence des termes Darwin Core donne d’excellentes indications quant à l’information à numériser : ces termes sont les éléments d’information sur la biodiversité les plus souvents utilisés et sont le résultats de plusieurs analyses de cas.
Les collections devraient également prioriser la numérisation des groupes taxonomiques et géographiques les plus importants et utiles pour la recherche. Ceci inclut les groupes uniques ou largement représentés dans une collection, ainsi que les groupes au coeur des problématiques de recherche des différentes collections ou de la communauté Canadensys (e.g. le genre Carex), les espèces rares ou invasives, ainsi que les groupes qui contribuent aux études sur les changements climatiques.