Dienst Computergenealogie

NGV GEDCOM

GEDCOM

Een pagina met beknopte informatie over de GEDCOM standaard. Voor een complete beschrijving van de GEDCOM, zie: The GEDCOM Standard (Uitgave van de Family History Department van The Church of Jesus Christ of Latter-day Saints). Een verduidelijking vind u in Personal Ancestral File eveneens uitgegeven door dezelfde uitgever.

Op GEDCOM Tools vindt u een aantal verwijzingen naar programma's, die u in staat stellen met GEDCOM te werken.

Inleiding

Het GEDCOM bestandsformaat is te beschouwen als een uitwisselingstaal, die gebruikt wordt om op computers de uitwisseling van genealogische gegevens te standaardiseren. De naam GEDCOM staat voor GEnealogische Data COMmunikatie. De gebruikersomgeving is het werkterrein van genealogie-beoefenaars, historici en andere onderzoekers, werkzaam op aanverwante gebieden. Het GEDCOM bestandsformaat is ontwikkeld door de Familie Afstammelingen Afdeling van de Kerk van Jezus Christus van de Heiligen der Laatste Dagen, kortweg de Mormoonse kerk. De ontwikkeling van dit bestandsformaat stamt uit 1984. Sindsdien zijn er een aantal aanpassingen en modificaties geweest. Er dient uitdrukkelijk vermeld te worden dat het GEDCOM formaat een platformonafhankelijk formaat is en dat dit formaat op generlei wijze gekoppeld is aan een instituut, instelling of onderneming. De huidige versie van GEDCOM biedt bv. veel meer mogelijkheden dan het door de Mormonen kerk gevoerde PAF programma.

Nogal wat programma's baseren zich op deze GEDCOM-standaard. Elk genealogieprogramma heeft wel de mogelijkheid om te importeren of te exporteren volgens deze standaard. Verder zijn er ook gespecialiseerde programma's bv. om webpagina's te maken uitgaande van een GEDCOM-bestand of het GEDCOM-bestand uit te dunnen volgens een aantal criteria.
De huidige GEDCOM standaard is versie 5.5 en laat toe personen en hun familierelaties door te geven (ouder van ..., echtgenoot van ...). Uitgebreide stamboomprogramma's kunnen ook nog andere relaties bewaren zoals X was de peter van Y of Z was getuige bij het huwelijk van W. De toekomstige GEDCOM 6.0 XML standaard zal op dat gebied veel meer mogelijk maken en bovendien zullen die GEDCOM-bestanden ook begrijpelijker worden voor de leek (let wel: de XML standaard is in 2002 gepubliceerd, maar wordt tot op heden niet of nauwelijks ondersteund door genealogieprogramma's).

Het bestandsformaat in het kort

Het GEDCOM formaat is taalonafhankelijk d.w.z. U kunt er in elke taal uw gegevens in onderbrengen. Voor de goede orde hier de te gebruiken termen verklaard:

    File = Bestand (bv. het Familiebestand Jansen). Een bestand bestaat uit meerdere records en begint altijd met een Header record (0 HEAD) en eindigt altijd met een Trailer regel (0 TRLR).
    Record = Onderdeel uit het bestand (bv. gegevens van n persoon uit de familie Jansen).
    Field = Veld welke een bepaald soort gegeven bevat (bv. naam of geboortedatum van n persoon).
     

Inhoud van een GEDCOM-record

Een lijn begint met een niveaunummer. Zo wil "0 @I2160@ INDI" zeggen dat er vanaf nu gegevens volgen over een nieuwe persoon (INDIvidu met interne code I2160 in de oorspronkelijke databank, dit kan best een ander nummer elders worden. Het nummer wordt echter ook gebruikt om binnen het GEDCOM-bestand relaties te leggen bv. met echtgenote of kinderen. Op een volgende lijn en een lager niveau kan bv. de naam komen te staan bv. "1 NAME Joseph/Abri/".

Elke om te zetten GEDCOM-record bevat de volgende kenmerken:

    Een beginlijn met niveaunummer 0. De beginlijn identificeert het record.
    Dan volgen n of meerdere ondergeschikte lijnen aangegeven door nummers:
    Nr.1 is voor de eerste getrapte ondergeschikte lijn
    Nr 2 is voor de tweede getrapte ondergeschikte lijn.
    Nr 3 is voor de derde getrapte ondergeschikte lijn
    enz.
     

Alle bovengenoemde lijnnummers worden gevolgd door een 4 letter code (Etiket, Tag) welke de soort informatie weergeeft. Dit etiket overigens -zijnde het besturende - bestandsonderdeel van het formaat wordt in de gespecificeerde vorm (Engelse taal) toegepast om een internationale uitwisseling te waarborgen. Enkele voorkomende etiketten (Tags) zijn:

    HEAD voor header
    INDI voor individuele persoon
    FAMS voor huwelijk
    FAMC voor kind uit huwelijk
    CHILD kind
    DATE datum
    HUSB man
    WIFE vrouw

De dagelijkse praktijk

Het bovenstaande, hoe verklaarbaar dan ook in programmeer-termen, blijft bij de normale toepassing van de bestandsuitwisseling geheel onder de oppervlakte. U hoeft zich er geen zorgen over te maken. Zeker al niet bij bestandsuitwisseling tussen dezelfde programma's. Bij gebruik van verschillende programma's kunnen er mogelijk verschillen van de uit te wisselen gegevens optreden en moet u oppassen.

Dataverlies kan optreden wanneer u meer gegevens aanbiedt dan het ontvangende programma kan opnemen. Dit zijn gegevens afkomstig uit velden welke in het ontvangende programma als zodanig niet voorkomen, dus niet herkend worden. Het ontvangende programma zal deze gegevens in de meeste gevallen in een opmerkingenveld schrijven. Echter er zijn ook programma's welke de gegevens eenvoudigweg niet opnemen. Bijvoorbeeld:

Een gegevensbestand opgebouwd met een programma A kent mogelijk meer kenmerken dan een programma B. Belangrijk is dat de het programma A bij export de juiste 'tags' toekent aan de gegevens die in de GEDCOM file worden geschreven. Het kan echter zijn dat bepaalde gegevens (nog) niet zijn gedefinieerd in de GEDCOM specificatie. Dit type gegevens kan dan niet worden doorgegeven aan het ontvangende programma B. Het programma B zal op zijn beurt de GEDCOM file lezen en de tags vertalen naar zijn database. Het kan voorkomen, dat programma B bepaalde tags niet kent. Deze worden dan niet verwerkt en komen dan niet terug in de database van het programma B. Om dit te voorkomen kunt u vr het exporteren naar de GEDCOM file in programma A de betreffende gegevens naar bijvoorbeeld een opmerkingen veld verplaatsen. Dit veld wordt wel herkend door het ontvangende programma B. De informatie komt dan weliswaar niet terecht in het specifieke veld, maar de gegevens gaan dan niet verloren.

Controleer bij een proef-export/import of alle data overgedragen wordt en, voorzover mogelijk, in de goede velden terecht komt!

Een voorbeeld hoe een Familie record eruit kan zien:

0 @I1@ INDI
1 NAME Jan.Jansen
1 TITL Jr.
1 SEX M
1 BIRT
2 DATE 1 JAN 1910
2 PLAC Amsterdam,N.Holland,Nederland
1 DEAT
2 DATE 31 DEC 1985,N.Holland,Nederland
1 NOTE Bronvermelding
1 FAMS @F1@
0 @F1@ FAM
1 HUSB @ I1@
1 WIFE @ I2@
1 CHIL @I3@
1 MARR
2 DATE 1 JUN 1945
2 PLAC Amsterdam

De @ tekens dienen als scheidingstekens en hebben verder geen betekenis. Dit is een korte weergave van een GEDCOM record