Fiabilité
Mesurer la fiabilité d'une généalogie
La prochaine étape sera-t-elle celle de la fiabilité de nos informations ?
Nous commençons à être submergés sous l'information généalogique. Oui, mais quelle information ?
Quelle confiance pouvons-nous accorder à une information trouvée sur internet ?
Il est toujours possible de répondre : aucune. Il faut vérifier par soi-même : tout !
Il est normal de trouver des erreurs dans une généalogie publiée. Supposons 100 ancêtres et pour chacun plusieurs informations (nom, prénom, date, lieu de naissance, mariage et décès), soit 800 informations. Supposons par exemple 2% d'erreurs d'inattention. Résultats 16 erreurs ou 16% des personnes dans l'arbre. Techniquement c'est même encore plus important car les patronymes des parents peuvent donc être aussi faux. Ajoutons-y les erreurs sur les actes originaux. Donc statistiquement il y a déjà un pourcentage d'erreurs. Enfin si c'est quelqu'un a recopié un autre, les erreurs se multiplient, surtout si le copieur essaie de corriger les erreurs par de la logique. C'est pourquoi il faut retourner aux actes (1re main) ou au moins à leur résumé (2e main) et tout valider.
Cependant le chercheur professionnel ne va pas systématiquement tout revérifier pour avancer dans une tâche. Il a un degré de confiance selon la notoriété de l'auteur. Les sujets ci-dessous tentent de répondre à ces questions avec des approches très différentes.
Ce qui existe dans Gedcom GenTech créer un TAG Gedcom utilisateur ce qu'en dit le projet gentech ISO Indice de qualité : le projet taïons
Gedcom
Ce que Gedcom propose
CERTAINTY_ASSESSMENT: = {Size=1:1} [ 0 | 1 | 2 | 3 ]
The QUAY tag's value conveys the submitter's quantitative evaluation of the credibility of a piece of information, based upon its supporting evidence. Some systems use this feature to rank multiple conflicting opinions for display of most likely information first. It is not intended to eliminate the receiver's need to evaluate the evidence for themselves.
- 0 =Unreliable evidence or estimated data
- 1 =Questionable reliability of evidence (interviews, census, oral genealogies, or potential for bias for example, an autobiography)
- 2 =Secondary evidence, data officially recorded sometime after event
- 3 =Direct and primary evidence used, or by dominance of the evidence
tag QUAY :
QUAY {QUALITY_OF_DATA}:= An assessment of the certainty of the evidence to support the conclusion drawn from evidence.
et ne donne d'exemple de son utilisation que pour la description des sources. Le tag QUAY n'est donc envisagé que pour permettre au généalogiste de documenter le degré de confiance que LUI-MÊME accorde à une Source dans un contexte particulier. Le tag QUAY est basé sur la citation de source (non géré ni par Heredis ni par Généatique).
Utilisation de pseudos-sources : à rechercher, à vérifier, à corriger.
TAG Gedcom utilisateur
Un tag gedcom utilisateur sur la fiabilité de la filiation en fiche individuelle :
1 _HYP (Sans doute / peut-être / hypothétique)
L'utilisation d'un Champ utilisateur permet de mettre en évidence l'existence d'un doute. La contrainte imposée est qu'il s'applique au niveau global d'un individu.
Il est possible de préciser en partie variable le doute.
(exemple : "mariage semble trop tardif" ou "peut-être à dédoubler" ou "décès à revoir" plus une Note (Individuelle/Union ou d'un Evénement) détaillant où il y a doute et pourquoi.
Le tag est en fait _HYP pour respecter la règle qu'un TAG personnel doit commencer par _ C'est un effectivement un événement individuel qui indique la fiabilité de la filiation. Exemple de la filiation supposée entre les carolingiens et les mérovingiens :
0 @I2268@ INDI 1 NAME Berthe /de Prüm/ 1 SEX F 1 BIRT 2 DATE ABT 685 1 _HYP peut-être 1 DEAT 2 DATE AFT 721 1 FAMC @F834@ ... 0 @F834@ FAM 1 HUSB @I2269@ 1 WIFE @I2270@ ... 0 @I2269@ INDI 1 NAME Thierry III /Mérovingien/ ... 0 @I2270@ INDI 1 NAME Clotilde /Dode/
On traduit par Berthe de Prüm est peut être la fille de Thierry III et Clotilde Dode.
La construction gedcom "officielle" est délirante et gérée par pratiquement aucun programme qui n'est pas "total-gedcom" (LifeLines ou GenJ) : <CHILD_TO_FAMILY_LINK> p33 demande de mettre une note à FAMC et d'associer une citation de source à cette note, soit :
0 @I2268@ INDI 1 NAME Berthe /de Prüm/ 1 SEX F 1 BIRT 2 DATE ABT 685 1 DEAT 2 DATE AFT 721 1 FAMC @F834@ 2 NOTE Donné par Christian Settipani dans les ancêtres de 3 CONC Charlemagne. 3 SOUR @S99@ 4 PAGE 99 4 QUAY 1
La valeur de QUAY est difficile à définir tellement il est inadapté à autre chose qu'une généalogie contemporaine.
Gentech
Si nos recherches et les informations qui en découlent suivaient le modele de Gentech tel qu'indiqué dans son diagramme des étapes du processus ca aiderait certainement à ce que nos bases soient correctes et puissent s'échanger sans trop d'inconvénients :
https://www.ngsgenealogy.org/ngsgentech/projects/Gdm/Process_GENTECH_Data_Model_1.0.pdf
Ca suppose aussi que l'on dispose de logiciels (et d'utilisateurs) sachant gérer les sources.
Citations de sources : http://legoux.org/article34.html Logiciels recommandés sur ce point : Legacy, GenJ, Gramps, PAF (?).
ISO
Généalogie et ISO 9000 ? : http://www.roelly.org/~genealogie/entraide/iso9000.htm
Article précurseur écrit en 2001 - page de Guillaume Roelly
L'évocation des normes ISO9001 et ISO9002 n'est faite que pour introduire des conseils sur l'enregistrement, le classement et la transmission d'une collection de sources.
Indice de qualité
Le site http://taions.free.fr/indice/fr/index.php propose d'attribuer un indice à chaque généalogie soumise pour déterminer un "niveau" de qualité (janvier 2006).
Le calcul du TAÏONS fournit un indice sur la confiance à accorder à une étude généalogique basé sur le rapport entre le nombre total d'individus qu'elle contient et le nombre total de sources, les sources à retenir n'étant, semblerait-il, que celles établissant des naissance/union/décès.
Cet indice dépend largement de l'opinion du généalogiste sur ses propres recherches. L'exposé de cette notion est assorti de conseils sur le classement et l'enregistrement des sources.
La démarche est critiquée sur les points suivants:
- Il est dit sur le site "Nous prenons pour principe simple qu'une généalogie de qualité rassemble en moyenne 2,5 documents par individu."
D'où sort le chiffre qu'une personne doit avoir 2,5 documents ?
- La notion de document n'est pas défini sur le site. Le chiffre de 2,5 fait penser à des NMD en prennant en compte les difficultés à retrouver parfois les décès. C'est presque un label de non-qualité que de se limiter à l'état-civil.
- Il semble qu'il faille une copie de tous les documents utilisés pour une certification : la perte de temps va être énorme pour photographier des passionnants « le 10 mai, fut inhumé Jean Tartempion, du village de Trifouillis-les-Oies, âgé de 50 ans environ ».
- On n'étudie pas toutes les branches de la même manière : la certification d'un fichier de dizaines de miliers de personnes n'aurait aucun sens.
- Rien n'est dit sur les incertitudes.
- Suggestion d'amélioration
- indices types du genre
0 à 30 : faible
31 à 100 : moyen
100 à 200 : excellent avec modalités (ou coefficient) selon nombre de générations