door Andrea de Leeuw van Weenen
Wie op eigen houtje oudijslands (oudnoords) wil leren, bewandelt een stenig pad. Je moet in ieder geval een globaal overzicht van de grammatica hebben, maar ook teksten leren lezen, beginnend met genormaliseerde teksten. Er zijn een paar geannoteerde teksten voor beginners, maar als je zelfstandig aan de gang wilt, ben je al gauw in de positie dat je op een woord stuit dat je niet kan thuisbrengen en ook na lang zoeken in een woordenboek niet kan vinden. Je komt er niet zo gauw op dat je erni onder ørn moet zoeken.
Er is nu een makkelijkere manier, een electronische tekst waar je desgewenst spieken kan met welke woordsoort je te doen hebt en bij welk lemma het hoort.
Veel teksten zijn niet in genormaliseerde vorm beschikbaar, maar bijvoorbeeld als diplomatische tekst. In een electronische diplomatische tekst is het mogelijk de genormaliseerde vormen op de achtergrond te hebben, zodat je kunt spieken of de letter e staat voor /e/, /é/, /æ/, /ei/, of voor de onbetoonde /ɪ/ (genormaliseerd i).
In de jaren ’80 zijn in het kader van een ZWO-project de saga’s in het veertiende-eeuwse handschrift AM 132 fol., beter bekend als Möðruvallabók, machineleesbaar gemaakt en vervolgens gelemmatiseerd en morfologisch geanalyseerd.
Inmiddels zijn de acht kortere saga’s uit Möðruvallabók omgezet van het oorspronkelijke databasisformaat naar XML, en wel op 3 niveaus: facsimile, diplomatisch en genormaliseerd. Vanuit het XML-formaat is er voor iedere saga afzonderlijk een drietal XHTML-versies gemaakt, met de bijzonderheid dat in iedere versie door de cursor over een woord te bewegen extra informatie kan worden opgeroepen, te weten:
- lemma,
- woordsoort,
- verdere grammatikale informatie, zoals naamval bij substantieven of tijd en persoon bij werkwoorden,
- de vormen van het woord in de beide andere versies,
- de plaats in het handschrift.
Verder zijn bij iedere saga foto’s van de relevante handschriftpagina’s gevoegd.
Met name de facsimileversie heeft veel speciale tekens, die niet in de gebruikelijke fonts zitten. Hiervoor zijn de speciale vrije fonts Andron Scriptor en MUFI Additional nodig.
Het verwerven van een basiswoordenschat is natuurlijk een wezenlijk bestanddeel van de leesvaardigheid. Om dit zo efficiënt mogelijk te doen is er een op de frequentielijsten van Möðruvallabók gebaseerde woordenlijst (met vertaling in het duits) beschikbaar.
Het eerste deel geeft de 100 meest voorkomende vormen, waarbij homografen gedisambigueerd zijn. Dit blijkt al de helft van de tekst af te dekken. Met het leren van de 100 meest voorkomende lemmata kunt u al tweederde van de tekst lezen. Het loont dus de moeite. De volgende 1200 lemmata brengen het dekkingspercentage op 88%. En omdat eigennamen een flink deel uitmaken van de resterende 12% en veel samengestelde woorden tamelijk doorzichtig zijn, is het in de praktijk tegen de 95%.
Klik op de onderstaande ‘download’ link om de fonts, een saga naar keuze, en/of de woordenlijst te downloaden: