Hatajkodom a Nemzeti Szövegtárban

Saját szavaim a 187 millió között... Még nincs egy hónapja, hogy immár működik, azaz "kereshető", kutatói és egyéni célokra ingyenesen használható a Magyar Nemzeti Szövegtár. A projektum fontos mozzanata, hogy a nemzeti nyelvi korpusz kiegészült a határon túli magyarság szóállományával.

Még nincs egy hónapja, hogy immár működik, azaz "kereshető", kutatói és egyéni célokra ingyenesen használható a Magyar Nemzeti Szövegtár. A projektum fontos mozzanata, hogy a nemzeti nyelvi korpusz kiegészült a határon túli magyarság szóállományával. A pontosság kedvéért idézek az MNSZ honlapjáról:

 

"A Magyar Nemzeti Szövegtár (MNSZ) munkálatai 1998 elején kezdődtek el a Magyar Tudományos Akadémia Nyelvtudományi Intézetének Korpusznyelvészeti Osztályán Váradi Tamás vezetésével. A cél egy 100 millió szavas szövegkorpusz létrehozása volt, amely lehetőségeihez mérten reprezentatívan tartalmazza a mai magyar nyelv jellegzetes megnyilvánulásait. A munkálatok 2002-től a Kárpát-medencei Magyar Nyelvi Korpusz projekt keretében kiegészültek a teljes Kárpát-medence magyar nyelvhasználatára kiterjedő gyűjtéssel. Itt a cél egy 15 millió szavas határon túli korpusz létrehozása volt. "

 

Ebből a 15-ből mintegy 3 millió szót tesz ki a kárpátaljai állomány. Ennek felgyűjtését és feldolgozását a beregszászi főiskola fiatal kutatói végezték. A dolog nem kis mértékben érint engem is, hiszen, mint olvasható is egy 2003-as anyagban, a Kárpátaljai Nyelvi Kurpusz forrásai között az itteni sajtóorgánumok mellett egyedüli magánszemélyként és íróként én szereplek, a szépirodalmi részt az én szövegeim alapján állították össze. Ez persze nem különösebb dicsőség és leginkább csak praktikus okai vannak: egyfelől a helybéi magyar írók közül csupán nekem van honlapom, ahonnan gyűjteni lehetett, másfelől egyedül én tudtam egymillió karakternyi digitális szépirodalmi szöveget kérésükre átadni (két regény, novellák, versek). Így hát kis nagyzolással és túlzással szólva a Nemzeti Szövegtárban a kárpátaljai szépirodalmat az én életművem képezi.

 

Tegnap kerítettem rá alkalmat, hogy a projektum működését kipróbáljam. A nyitó oldalról indulva bárki regisztrálhatja magát, csak ezután lehet használni a Keresés opciót (jobb hasáb). (A rendszer számos finomítást tesz lehetővé, mód van a régiók, nyelvi tétegek vagy szófajok szerinti szűrésre.) Beléptem és töprengeni kezdtem, vajon melyik lenne az a magyar szó, amely sehonnan máshonnan, csupán és kizárólag az én valamelyik írásomból kerülhetett be a több mint 187 millió szót tartalmazó Nemzeti Szövegtárba. Kis gondolkodás után ezt a szót ütöttem be: hatajkodik. A rendszer mindössze két találatot adott ki. A találat előtti kis sorszámra húzva az egeret lehívható a forrást. Ha a keresett szó szövegkörnyezetéből ("Olyankor óbégat, hatajkodik... Vagy ha nagyon éhes") nem jöttem volna rá, megbizonyosodhattam arról, hogy minkét találat az én Álomszarvas c. novellámból való, épp csak a második esetben nem a novella, hanem a kötet van feltüntetve. No, innen nem volt megállás, még egy órát játszadoztam a rendszerrel. Közben megállapítottam, írói leleményeimet, szóalkotásaimat kiszűrték. Az összmagyar nyelvi korpuszban nincs benne a nálam novellacímben szereplő álomszarvas, mézeskönyv vagy főilluminátor. Több olyan szót is találtam, amelyet a feldolgozott anyagban rajtam kívül alig használtak mások (Tarantella, nirvána, visszaszületés), de elég sokáig keresgéltem, amíg újra olyanra bukkantam, amely kizárólag nálam fordul elő. Ez volt: kanyarításnyit.