[FrancoGène] > [Internet] > [Fichiers Gedcom]

Les fichiers GEDCOM en quelques mots.

Ceci est une page destinée à expliquer sommairement ce qu'est un fichier GEDCOM et comment le lire sans outil.  Elle n'a pas pour but de vous montrer comment écrire un logiciel pouvant lire ou produire un fichier GEDCOM.

Plan

Définition

Un fichier GEDCOM est tout bonnement un fichier texte pour des échanges d'informations généalogiques.  Le but, c'est d'avoir une structure simple, éventuellement compréhensible sans outil, mais qui permet tout de même de lire et traiter automatiquement l'information contenue dans le fichier.

[Index]

Un logiciel GEDCOM ?

Il n'y a pas un « logiciel GEDCOM ».  En fait, la plupart des logiciels modernes de généalogie permettent de lire un fichier GEDCOM ou d'en exporter un.

Donc, si vous recevez un fichier GEDCOM et n'avez pas de logiciel de lecture, la façon simple de s'en sortir, c'est de trouver un logiciel gratuit et de l'utiliser pour lire votre fichier.  Par la suite, à vous de décider si vous faites le saut ou non.

[Index]

Une façon rapide de s'en sortir...

Il y a quelques logiciels gratuits ou payables après essai.  Si le besoin est "lire un fichier GEDCOM le plus tôt", il suffit d'installer par exemple PAF, Brothers Keeper ou Cumberland Tree.  Si le besoin est plutôt "utiliser un logiciel de généalogie dans l'avenir", il est préférable de faire le tour des démonstrateurs disponibles.

Désolé, mais je n'ai pas développé cet aspect.  Pour le moment, j'ai choisi TMG ou The Master Genealogist, en particulier parce qu'il a la réputation d'être un vrai logiciel de généalogie et d'offrir un vrai environnement favorisant la recherche, plutôt qu'un logiciel pour imprimer des jolis arbres (mais il imprime quand même de jolis arbres :-)  ).

[Index]

Si vous lisez sans outil

Voici un exemple de fichier GEDCOM, au cas où vous voudriez consulter directement ce fichier.

[Index]

Structure générale

Un fichier GEDCOM ressemble à ceci:

0 HEAD
1 SOUR FTW
1 DEST PAF
1 DATE 8 Nov 1995
1 CHAR IBMPC
1 FILE D:\BIN\FTW\MARCHAND\PAPINEAP.GED
0 @I001@ INDI
1 NAME Louis-Joseph /Papineau/
1 SEX M
1 BIRT
2 DATE 1789
1 DEAT
2 DATE 1871
1 CHR
2 DATE 10 Oct 1789
2 PLAC Montreal
1 BURI
2 DATE 24 Sep 1871
2 PLAC Montebello
1 FAMS @F01@
1 FAMC @F02@
0 @I002@ INDI
1 NAME Julie /Bruneau/

Il est important de savoir que beaucoup de logiciels ne produisent pas du vrai GEDCOM.  Donc, la description donnée plus bas peut parfois varier.

[Index]

De gauche à droite...

Une ligne contient dans l'ordre ces informations:
  1. Niveau d'imbrication.  Chaque fiche commence par un niveau 0.  Les lignes de niveau 1 sont les éléments principaux d'une fiche.  Les lignes de niveau 2 sont des données appartenant aux lignes de niveau 1.  De même pour les autres niveaux.  À noter qu'il n'y a pas de ligne de fin.  La fiche se termine quand la suivante débute.
  2. Numéro de fiche (facultatif).  Toujours entouré des symboles @, c'est le numéro de l'individu, de la famille, de la source, etc. qui suit.
  3. Étiquette (tag).  C'est l'utilité de cette ligne.  Ainsi, la ligne 1 NAME est le nom de l'individu.  La ligne 2 DATE est une date.
  4. Contenu.  Lorsque requis, c'est le contenu de la ligne.
[Index]

De haut en bas, les sections

Un fichier GEDCOM comprend un ensemble de sections.  Dans chaque section, les lignes de niveau 0 sont semblables (mais avec un numéro de fiche différent).  Il est important de noter qu'en théorie, l'ordre des sections est sans importance et qu'il est même possible d'alterner les sections (famille 1, individus de la famille 1, sources utilisées, famille 2, individus de la famille 2 qui n'ont pas été mentionnés sous la famille 1, etc.).  Mais en général, l'ordre est souvent celui que l'on verra ci-dessous.
 
0 HEAD En-tête du fichier.  Nous n'en parlerons pas davantage car cette section ne contient aucune information généalogique et ne sert que pour faciliter la lecture du fichier par un logiciel de généalogie ou pour en indiquer l'origine
0 @S1@ SUBM Fournisseur du fichier.  En général, nom et adresse de celui qui a produit le fichier GEDCOM.  Nous n'en parlerons pas davantage pour la même raison que précédemment.  Cette section peut être omise.
0 @I001@ INDI Fiche d'un individu.  En général, le numéro contenu entre les deux @ est une lettre suivie d'un numéro.  Mais quelques logiciels utilisent seulement un numéro.  Dans le vrai GEDCOM, chaque numéro est unique (ou la lettre avec le numéro).
0 @F1@ FAM Fiche d'une famille.  En fait, il s'agit d'un couple avec deux parents et un nombre variable d'enfants.  Il peut arriver qu'une famille ne comprennent qu'un individu.
0 @E1@ EVEN Événement.   Rarissime (seulement TMG?).  Nous n'en parlerons pas davantage mais approfondirons dans une version ultérieure de ce texte.
0 @S1@ SOUR Source.  Une description de la souce de l'information.  Dans de nombreux logiciels, la source n'est pas indiquée par une fiche mais seulement par une ligne accompagnant une information.  Nous n'en parlerons pas davantage.
0 @N1@ NOTE Note.  Du texte non structuré.  C'est comme une note de bas de page.  Nous n'en parlerons pas davantage.
0 @C1@ CSTA Constante.  Rarissime (seulement le logiciel Reunion?).  Nous n'en parlerons pas davantage.
0 TRLR Dernière ligne du fichier.  Si cette ligne manque, le fichier est probablement tronqué.

[Index]

Fiche INDI décrivant un individu

Une fiche INDI décrit les attributs et événements personnels d'un individu, principalement son nom, son sexe, son occupation, les événements le concernant (sauf le mariage), la famille dont il est issu et celle(s) dont il fait partie comme conjoint.

Voici un exemple de fiche:

0 @I001@ INDI
1 NAME André /JARRET/
1 SEX M
1 CHR
2 DATE  9 AUG 1642
2 PLAC Vignieu, Isère, France
2 SOUR Copie du registre, fonds André Beauregard
1 DEAT
2 DATE ABT 1690
2 PLAC Verchères, Verchères, Québec
2 NOTE Entre 9 mois avant la naissance de son cadet et la 1re fois où son épouse est dite veuve
1 FAMS @F0001@
1 FAMC @F0002@

Voici les explications sur les lignes concernant l'individu.  Nous traiterons des lignes génériques (DATE, PLAC, NOTE et SOUR) plus loin.
 
Niveau Numéro Étiquette Contenu Description
0 @I001@ INDI Début de la fiche de l'individu I001
1 NAME André /JARRET/ Nom de l'individu.  Elle comprend le prénom, le nom de famille et les surnoms, et un suffixe éventuel ("père", "jr", etc.).  Il peut ou non y avoir un espace avant la première oblique.  Parfois, la deuxième oblique est facultative.
1 SEX M Sexe de l'individu.  Normalement M pour masculin et F pour féminin.  Si le sexe est inconnu, on trouve U (unknown) ou ?
1 OCCU Occupation de l'individu.
1 BIRT Naissance de l'individu.  Voir les lignes génériques d'un événement.
1 CHR Le fait de donner un nom à l'individu (christening).  Certains logiciels préfèrent BAPT pour baptême. Voir les lignes génériques d'un événement.
1 BAPT Baptême d'un individu.  Voir les lignes génériques d'un événement.
1 DEAT Décès d'un individu.  Voir les lignes génériques d'un événement.
1 BURI Inhumation ou sépulture d'un individu.  Chez les catholiques, il s'agit en général de l'inscription du décès dans un registre lors de la sépulture.  Voir les lignes génériques d'un événement.
1 EVEN Autre événement.  Dans certaines logiciels, il peut s'agir du baptême ou de la sépulture.  On trouve alors un mot clé indiquant le type d'événement.  Dans d'autres logiciels, il s'agit du numéro d'une fiche d'événement qui contient alors les détails sur cet événement. Voir les lignes génériques d'un événement.
1 FAMS @F0001@ Famille F0001 dont l'individu est un des parents.  Cette fiche familiale devrait contenir un conjoint "HUSB" ou "WIFE" correspondant à cet individu.
1 FAMC @F0002@ Famille F0002 des parents de l'individu.  Cette fiche familiale devrait contenir un enfant "CHIL" correspondant à cet individu.

Notons un certain nombre d'événements individuels qui ont parfois leur propre étiquette (selon le logiciel utilisé):
 
ADOP Adoption
CENS Recensement
CONF Confirmation
CRIM Crime
DONA Donation
EDUC Éducation
EMIG Émigration, départ d'un endroit
EMPL Emploi
FCOM Première communion
FUNE Funérailles
HIST Historique, chronologie de l'individu
IMMI Immigration, arrivée dans un endroit
LVG Vivant (living)
NATU Naturalisation
NOBL Anoblissement
ONDO Ondoiement
ORDN Ordination, entrée en religion
PASL Liste de passagers
PROB Ouverture d'un testament (probate)
RELI Religion pratiquée
RESI Résidence
RETI Retraite
RMRK Remarque
TBS Pierre tombale (tombstone)
WILL Testament

[Index]

Fiche FAM décrivant une famille

Une fiche FAM décrit les attributs et événements personnels d'une famille dans le sens traditionnel (père, mère et enfants), principalement les parents, la date du mariage et parfois du divorce, et la liste des enfants.

Voici un exemple de fiche:

0 @F1@ FAM
1 HUSB @I1@
1 WIFE @I2@
1 MARR
2 DATE 12 JAN 1676
2 PLAC Montréal, Ile de Montréal, Québec
1 CHIL @I3@
1 CHIL @I4@

Voici les explications sur les lignes concernant la famille.  Nous traiterons des lignes génériques (DATE, PLAC, NOTE et SOUR) plus loin.
 
Niveau Numéro Étiquette Contenu Description
0 @F001@ FAM Début de la fiche de la famille F001.  Le GEDCOM ne couvre pas de relation directe entre deux individus et il faut donc une famille dès qu'on établir des relations du genre parent-enfant ou frère-soeur entre deux individus.
1 HUSB @I1@ Numéro de fiche I1 du père dans cette famille, du conjoint indiqué par la ligne WIFE, du fiancé si le mariage n'a pas eu lieu (contrat de mariage annulé par exemple), ou du père d'un enfant naturel (dans le sens de bâtard).  Nous appelerons "parents" les individus HUSB et WIFE.
1 WIFE @I2@ Numéro de fiche I2 de la mère dans cette famille, du conjoint indiqué par la ligne HUSB, de la fiancée si le mariage n'a pas eu lieu (contrat de mariage annulé par exemple), ou de la mère d'un enfant naturel (dans le sens de bâtard).  Nous appelerons "parents" les individus HUSB et WIFE.
1 MARR Mariage des parents.  Voir les lignes génériques d'un événement.
1 MARC Contrat de mariage des parents.  Voir les lignes génériques d'un événement.
1 CONT Contrat de mariage des parents (alternative, MARC est l'étiquette officielle).  Voir les lignes génériques d'un événement.
1 CHIL @I3@ Enfant dans cette famille.  S'ils sont mentionnés, enfants des parents.  La séquence des enfants n'est pas réglementée dans un ficher GEDCOM.  Donc, la première ligne CHIL n'est pas toujours celle du premier né.
Notons un certain nombre d'événements familiaux qui ont parfois leur propre étiquette (selon le logiciel utilisé):
 
 
ANUL Annulation d'un mariage
DIV Divorce
ENGA Fiançailles (engagement)
MARB Bans de mariage
MARE Fiançailles (engagement)
MARL License de mariage
SEP ou SEPA Séparation

[Index]

Lignes génériques d'un événement

Les fiches individuelles INDI et familiales FAM contiennent un certain nombre d'événements.  Ceux-ci sont composés d'une ligne de niveau 1 identifiant l'événement, et d'une série de lignes de niveau 2 avec les détails pertinents.  Certains logiciels donnent toutes les lignes, donc certaines lignes sont vides.  D'autres (le cas général) ne produisent que les lignes avec une information.
 
 
Niveau Étiquette Contenu Description
1 BIRT, CHR, MARR, DEAT, BURI, etc. Toujours l'identification de l'événement.  Si un événement est répété (2 mariages par exemple), il n'y a pas de numéro de séquence, mais seulement deux sous-fiches débutant toutes deux avec une ligne de niveau 1.
2 DATE 9 AUG 1642 Date de l'événement.  Le modèle est très simplifié.  Par exemple, au lieu d'avoir la date de l'événement, de sa célébration religieuse et de son enregistrement, on trouve deux événements avec chacun une date.  La célébration religieuse et l'enregistrement sont souvent confondus, ce qui est généralement le cas, mais pas toujours.  Voir le format d'une date plus loin.
2 PLAC Vignieu, Isère, France Lieu de l'événement.  Le modèle est très simplifié.  Par exemple, au lieu d'avoir le lieu de l'événement (la résidence si c'est une naissance à la maison), le lieu de la célébration religieuse (église où l'enfant est baptisé) et le lieu de son enregistrement (le registre contenant l'acte de baptême), on trouve deux événements avec chacun une date (naissance et baptême dans ce cas-ci).  La célébration religieuse et l'enregistrement sont souvent confondus, ce qui est généralement le cas, mais pas toujours (pour un missionnaire par exemple, qui dessert une paroisse une fois par année, le lieu du baptême ne correspond pas au registre où se trouve l'acte)..
2 SOUR Copie du registre Source de l'information.  Selon le logiciel, on aura un texte ou un numéro de fiche décrivant la source de l'information.
2 NOTE Photocopie Autre commentaire sur l'événement.

[Index]

Format des dates

Dans le vrai GEDCOM, une date comprend:
  1. un préfixe optionnel, choisi parmi: ABT (environ), BEF (avant), AFT (après).  Certains logiciels ont ajouté EST (estimé) ou WFT EST (estimé par World Family Tree)
  2. un quantième optionel
  3. un mois optionnel, en lettre choisi parmi: JAN, FEB, MAR, APR, MAY, JUN, JUL, AUG, SEP, OCT, NOV, DEC.  Certains logiciels francisés ont remplacé les mois par l'équivalent français (fév, avr, mai, aou, déc) et ces dates peuvent être perdues quand elles sont relues par d'autres logiciels ou une configuration différente.
  4. une année optionnelle.  Il est impossible d'avoir seulement le quantième car il devient alors l'année.
Vous remarquerez que tout est optionnel !  Il arrive en fait qu'une ligne DATE soit vide...  Certains logiciels exigent que le format soit précis (2 chiffres pour le quantième par exemple).

Certains logiciels permettent aussi du texte libre (donc, illisible par d'autres logiciels).



[FrancoGène] > [Internet] > [Fichiers Gedcom]


Copyrights 1999-2000 Productions FrancoGene, Denis Beauregard
www.francogene.com/internet/gedcom.php