MTA Nyelvtudományi Intézet Finnugor és nyelvtörténeti osztály

Department of Finno-Ugric and Historical Lingustics, RIL HAS

  • A betűméret növelése
  • Alapértelmezett betűméret
  • A betűméret csökkentése
Home Pályázatok / Competitions Befejezett / Completed NKFP-5/135/01: Komplex uráli nyelvészeti adatbázis

NKFP-5/135/01: Komplex uráli nyelvészeti adatbázis

E-mail Nyomtatás PDF

[A Complex Uralic Linguistic Database: in English see bellow]

A projektum célja három komponensből álló számítógépes adatbázis, illetőleg elemző létrehozása volt: Uráli Etimológiai Adatbázis: az uráli nyelvek közös szókincsének szótári adatbázisa; Uráli Morfológiai Elemző: kilenc uráli nyelv egységes szempontú morfológiai leírásán alapuló számítógépes morfológiai elemzése (a nyelvi szövegeket a program elemzi, s megmutatja, hogy a szöveget alkotó szavaknak melyek az alaktani összetevői); Osztják (hanti) értelmezőszótár és szöveggyűjtemény: az osztják nyelv szinjai nyelvjárásának értelmező szótára, valamint szurguti nyelvjárásának folklór szöveggyűjteménye (hangzó anyaggal) elektronikus adathordozón. Mindhárom résztéma hiányzott nemcsak a hazai, de a nemzetközi finnugrisztikai kutatásokból is. A leírt, feldolgozott nyelvek veszélyeztetettek.

 

A CD-én terjesztendő számítógépes etimológiai adatbázis egyáltalán nem létezik a világon. Az adatbázis nem egy elektronikusan olvasható szótárt kínál, hanem olyan anyagot, amely különféle szempontok szerint teszi lehetővé a tartalom lekérdezését, bővítését. A morfológiai elemző legfőbb tudományos eredménye kilenc kisebb uráli nyelv – az északi számi (lapp), a(z erza) mordvin, a mari (cseremisz), az udmurt (votják), a komi-zürjén, az északi manysi (vogul), a szurguti hanti (osztják), a nyenyec és a nganaszan – morfonológiai és morfológiai tulajdonságairól való ismereteinknek bővülése, a számítógépes elemző program hátterét képező nyelvi leírások elkészítése és hat nyelv elemzőjének a létrehozása. A hanti értelmezőszótár és szöveggyűjtemény két, eleddig csak szerényebben ismert, veszélyeztetett nyelvjárás feltárása. A szinjai értelmezőszótár egyetlen közlő teljes mentális lexikonát tartalmazza elektronikus formában. A szurguti gyűjtések e nyelvjárás folklór anyagát ölelik fel, s teszik közzé hangzó-anyaggal együtt CD-én.

A szerződésben vállalt főbb célkitűzéseket a konzorcium teljesítette: működőképesen létrehozta az Uráli Etimológiai Adatbázist, elkészítette működőképes állapotban a komi-zürjén, az udmurt, a mari, a manysi, a nyenyec és a nganaszan morfológiai elemzőt, továbbá kidolgozta az északi-számi, az erza-mordvin és a szurguti hanti elemzők nyelvészeti hátterét; szerkesztett állapotba hozta és elektronikus szótári konvertálásra előkészítette a szinjai osztják értelmező szótárat, továbbá teljesítette a kb. 12 ív terjedelmű folklóranyag lejegyzését és fordítását valamint elkezdte a hangzó anyaggal együtt annak CD-én való közzétételét. A morfológiai elemzők kidolgozása során egy sor, eddig tisztázatlan vagy a korábbi nyelvészeti feldolgozásokból teljes mértékben hiányzó grammatikai részkérdésre derült fény, ami azt jelenti, hogy nem csupán az elemzők, illetőleg azok nyelvi háttere alakult ki, hanem e nyelvek pontosabb megismerése is lehetővé vált. Ugyanez mondható el a szinjai hanti értelmezőszótár munkálatairól: egy sor hangtani és jelentéstani kérdés tisztázásához segített hozzá. A projekt legfőbb hozadéka az erősen vagy kevésbé erősen veszélyeztetett nyelvek, illetőleg egyes esetekben a teljes kihalás szélén álló nyelvek (pl. manysi vagy nganaszan) nyelvi anyagának feldolgozása, mentése, a világhálón közzéteendő elemzők révén pedig e beszélők nyelvi öntudatának megtámogatása.

The aim of the three module project was to set up electric databases and morphological analysers for Uralic languages. Uralic Etymological Database: electric database of the common Uralic vocabulary, Uralic morphological analyser: computer-based morphological analysis of nine smaller Uralic languages with a unified morphological and morphonological description as background (texts are analysed by a program showing the morphological components of the words), Ostyak (Khanty) monolingual electronic dictionary for the Sinya dialect, and Surgut-Khanti folklore texts with translations and recorded sound materials on CD. All three moduls were missing not only from the Hungarian but from the international Finno-Ugric researches as well. Languages/dialects involved are endangered ones. Electric etymological database did not exist according to our information. The Uralic Etymological database is not a simple electronic dictionary; it offers the function of multiple database querries and ensures the possibility of its expension too. The main scientific result of the morphological analyser is new informations on the morphological and morphonological characteristics of nine Uralic languages (Northern Saami, Erzya-Mordva, Mari, Udmurt, Komi, Northern Mansi, Surgut-Khanti, Nenets and Nganasan), compilation of the linguistic background of the analysis-program for nine languages, and setting up of the analysers for six languages. The Khanty monolingual dictionary and the folklore texts are giving new informations on two, less revealed, endangered dialects. The Sinya-Khanti monolingual dictionary provides us with the mental lexicon of a single speaker, whereas the Surgut material is the compendium of folklore traditions.

The main objectives of the contract have been fulfilled by the consortium, i.e. the operability of the Uralic Etymological Database has been created, the morphological analysers of Komi, Udmurt, Mari, Northern Mansi, Nenets, and Nganasan languages/dialects have also been produced, and the linguistic background of Northern Sami, Erzya-Mordva, and Surgut Khanty analysers have been elaborated, the material of the Synya Khanty monolingual dictionary has been edited, and prepared for electronic conversion. In addition, the folklore texts running to twelve printed sheets were taken down and translated, furthermore, with the recorded texts, the publishing has also commenced. In the course of the elaboration of the morphological analysers, a number of points, which had been problematic or absent from former descriptive grammars, have been cleared up, which means at the same time, that it is not only the analysers that resulted from this work but also it led to a more precise knowing of the languages in question. The same applies to the Synya Khanty monolingual dictionary: in the course of the work several phonological and semantic problems were solved. The most important result of the project is that it is a number of endangered, or moribund (e.g. Mansi, Nganasan) languages whose material was processed, saved, furthermore, by publishing the above mentioned texts via internet we may enhance the linguistic identity of the speakers of the languages concerned.

Módosítás dátuma: 2009. február 02. hétfő, 21:45