Mivel is foglalkozom

Mivel is foglalkozom?

Bíró Tamás

Sokan sokszor kérdezik, hogy mivel is foglalkozom. Amikor azt mondom, hogy számítógépes nyelvészettel, elképednek, hogy mi is az. Hogyan kapcsolódhat össze két, ennyire távoli terület?

Az első válaszom az szokott lenni, hogy gondoljunk a helyesírás-ellenőrző programokra és a szótárprogramokra (a kereskedelmi célú magyarországi számítógépes nyelvészeti kutatás egyik legjelentősebb központja a Morphologic). Vagy arra, hogy rövid időn belül intelligens kommunikációra lesz lehetőség a számítógéppel: kísérleti stádiumban létezik már korlátozott ember-gép kommunikáció (például egy vasúti információs rendszerben), és számítógép által tolmácsolt ember-ember kommunikáció.

A korai számítógépekkel egyidőben felvetődött a számítógépes (automatizált) fordítás ötlete. A kezdeti lelkesedés alábbhagyott 70-es évek elején, a probléma hihetetlenül összetett voltának a felmérését követően, és ekkortól kezdve csupán részletkérdésekre koncentráltak a kutatók. A mesterséges intelligencia-kutatások többi területéhez hasonlóan, ahol az 1950-es és 60-as években a cél szintén ,,általában véve intelligens számítógép" építése volt, a maximalista cél két irányba hullott szét: egyrészt a kisebb, belátható, de mégse triviális feladatokra képes számítógépek tervezésére, másrészt pedig az emberi intelligencia, illetve a nyelv számítógépes modellezés segítségével történő megértésére. De ez utóbbiról később.

Ennek eredményeképpen viszont az elmúlt évtizedben optimizmusra okot adó fejleményeknek, részeredményeknek lehetünk tanúi a számítógépes fordítás területén: kiragadott példaként lásd például a NESPOLE! projektet, amely az e-kereskedelem területén vezet be on-line számítógépes tolmácsolást; valamint a következő két honlapot: ELRA ill. LDC. A cél az, hogy az automatikus fordítás a következő három feltételnek tegyen eleget: legyen teljes körű (és nem csupán adott témájú, mondjuk, turisztikai szövegeket legyen képes fordítani), legyen automatikus (azaz ne igényeljen alkalmanként emberi beavatkozást, visszaigazolást) és legyen nyelvileg magas színvonalú (ne tűnjék fel, hogy nem emberi fordításról van szó). Habár a három kritérium ma még együtt nem megvalósítható, de bármely kettő-kettő igen, amint azt egy sor példa is mutatja. A lefedett nyelvek száma is rohamosan nő, a kínaitól az olaszig, a katalántól a koreaiig, a japántól az arabig.

Amire gyakran rákérdeznek azok, akik a munkámról faggatnak, az a beszédfelismerés és a beszédszintetizálás. De ez a két terület sokkal inkább műszaki feladat, mintsem nyelvészeti, habár a határokat néha nehéz meghúzni. A szigorúan vett nyelvészet ott kezdődik, ahol a mikrofon által felfogott és a számítógép által feldolgozott jelből előállt már egy szimbólum-sorozat (egy-egy szimbólum egy-egy hangnak felel meg), és ott ér véget, ahol a nyelvészeti modell előállított egy olyan szimbólum-sorozatot, amelyet a számítógép, és az általa vezérelt hangszóró hanggá alakíthat.

Viszont én nem beszélő vagy fordító számítógépeket építek, és nem is helyesírás-ellenőrzőt. A számítógépes nyelvészetnek sok további ága van. Ha úgy tetszik, az alapkutatásban veszek részt, amelynek hétköznapi hasznossága nem mérhető közvetlenül. Az alapkutatásnak (legyen szó fizikáról, biológiáról vagy számítógépes nyelvészetről) csupán egyik, sok esetben elenyésző motiváló tényezője az, hogy a gyakorlati felhasználás szempontjából hasznos ismeretekre tegyen szert. Sokkal fontosabb tényező az emberiség legnagyobb ,,hibája" (e nélkül nem öregednénk meg? :-), az általános kíváncsiság, a világ megértésére való törekvés. Ha ez évtizedekkel vagy évszázadokkal később aprópénzre váltható, annál jobb... de nem érdekli a kutatót. (A számelmélet, Püthagorásztól kezdve, 2500 éven keresztül, a matematikusok egyik kedvenc játékterülete volt a kristálytiszta logikája miatt, de mindenki az önmagáért való tudomány iskolapéldájának tekintette,... egészen a huszadik századik, amikor kiderült, hogy számtalan területen lehet hasznosítani a prímszámokon alapuló titkosítási eljárásokat, és így többek közt a katonai és a banki szféra is felhasználja a számelmélet eredményeit.)

A számítógépes nyelvészeti alapkutatásnak egyik fontos ága a korpusz-nyelvészet. Az első feladat minél nagyobb korpuszok, azaz szöveg-gyűjtemények összeállítása (például a teljes XVIII. századi angol irodalom korpusza, a mai holland beszélt nyelvből vett minták által alkotott korpusz, vagy a 1990-es évek német újságnyelvét reprezentáló korpusz,...), és ebben segítségünkre van a számítógép. A következő lépés a nyers szöveg ,,annotálása", azaz bizonyos nyelvi jegyek (például szófajok) megjelölése a szövegben, amely szintén igényel matematikai és számítógépes trükköket, mivel a hatalmas korpuszok kézi annotálása kivihetetlen lenne. Ezt követően, akár a nyers, akár az annotált korpuszokat fel lehet használni például nyelvstatisztikai számításokhoz, amelyek hozzájárulhatnak különféle nyelvi jelenségek vizsgálatához - és ezen számítások során megint csak a számítógép segítségére szorulunk.

De amivel foglalkozom, az nem is korpusznyelvészet (habár nincs kizárva, hogy a kutatásaim egy későbbi fázisában fel fogok használni korpuszokat). Amivel foglalkozom, az nyelvészeti elméletek modellezése, számítógép (illetve számítógépen is megvalósítható matematikai eszközök) segítségével.

A témám egy manapság divatos nyelvészeti elmélet (Optimalitáselmélet) összeházasítása egy matematikai modellel (véges állapotú automaták). Ha a kutatási eredményeim segíteni fogják a ,,nyelvtechnológiai" fejlesztéseket (language engineering, a mérnöki tudományok új ága), annál jobb. De engem inkább az emberi nyelv, mint a kognitív folyamatok egyik különleges területe, az emberi nem eme sajátságos tulajdona, érdekel. A nyelvészet, annak részeként a számítógépes nyelvészet elméleti ága is, ezt igyekszik megérteni. De itt megint értetlenségbe szoktam ütközni, mert azok, akik a munkámról faggatnak, általában nem így képzelik el a nyelvészetet.

Mielőtt tehát az általam kutatott modelleket próbálnám bemutatni, érdemes néhány szót ejteni arról, hogy mi is a nyelvészet, hogyan igyekszik megérteni az emberi nyelvet. E területen ugyanis, számos félreértés van. Az emberek az hiszik, hogy tudják, mivel foglalkozik a nyelvtudomány. Amikor értetlenül hallgatják a magyarázataimat, megkérdezem őket: akkor is ennyire alaposan szeretnéd megérteni a kutatásaim tárgyát, ha fizikával foglalkoznék? A modern nyelvészet semmivel se kevésbé elvont, mint a fizika.

Tehát előbb a nyelvészetről kell, hogy néhány szót ejtsek, általában. Majd bemutatom az Optimalitáselméletet, végül a véges állapotú automatákat is megpróbálom közelebb hozni az olvasóhoz, akiről feltételezem, hogy se nem nyelvész, se nem matematikus.

Tartalomjegyzék:

Nyelvészet, azaz inkább a nyelvészetek.2

Nyelvészeti modellek. 4

Optimalitáselmélet5

Tanulhatóság. 6

Véges állapotú automaták. 6

Nyelvészet, azaz inkább a nyelvészetek

Amikor nyelvészetről beszélünk, valójában legalább két, teljesen különböző tudományról van szó, amelyeknek többé-kevésbé egybeesik a kutatási tárgyuk. Más kapcsolat alig van közöttük, más a kutatók szemléletmódja, módszertana, motivációja. Kuhn-i értelemben véve, teljesen más paradigmában dolgoznak. A világ sok intézményében, így például az ELTE-n is, szervezetileg is elkülönülnek egymástól. Német területen még az elnevezésük is más (Sprachwissenschaft és Linguistik). Az egyik, a hagyományos nyelvészet, a bölcsésztudományok klasszikus ága. Ezzel ellentétben a modern nyelvészet talán már-már a természettudományok közé sorolható, mind a módszertana (adatok gyűjtése és modellek felállítása), mind a tárgyához való viszonya (,,a nyelv, mint biológiai jelenség") miatt.

Ezt a kettősséget talán onnan érdemes megközelítenünk, hogy kit mi érdekel. Habár az alábbi képlet meglehetősen leegyszerűsíti a valóságot, hiszen a legtöbb tanszék vagy kutatóintézet nem skatulyázható bele ebbe a felosztásba, a külső érdeklődő számára talán mégis hasznos első megközelítés gyanánt.

A hagyományos nyelvészet legtöbbször valamely nyelv vagy nyelvcsoport nyelvészete. Nekem is felteszik legtöbbször a kérdést: ,,na, és melyik nyelv nyelvészetével foglalkozol?". A válaszom, amely szerint általános nyelvészettel, nem elégíti ki a kérdezőt, ezért végül hozzáteszem: jelenleg leginkább holland, magyar és héber adatokkal dolgozom. Ekkor a következő kérdés az, hogy ,,de hiszen te nem is beszélsz hollandul?!"

Visszatérve, a hagyományos nyelvészet számára a nyelv kutatása igazából valamely kultúra megértésének az eszköze. Gyakran abból a felismerésből jött létre, hogy a közösség számára fontos (például mert autoritatív) szövegek (a Védák, a homéroszi eposzok, a Biblia, a Korán,...) nyelvezete régiessé vált idővel, és a későbbi korok számára nem volt mindig világos az egyes részletek jelentése. E szövegek alaposabb megértése igényelte a nyelvvel való tudatos foglalkozást. A nyelv iránt való érdeklődést erősítette a ,,helyes, tiszta nyelv", mint társadalmi konvenció, kialakulása: a preskriptív ,,nyelvészet", a nyelvművelés, azaz a ,,helyes nyelv" szabályainak az előírása és propagálása semmiképpen se tudomány, viszont felhasználja a nyelvészet eredményeit, megfigyeléseit és fogalmait. (A tudomány mindig deskriptív, azaz leíró jellegű: a biológus nem értékeli a vizsgált lepkék szépségét, a viselkedést kutató pszichológus nem illemtanár, és a szociológus se foglal állást a tapasztalt társadalmi minták erkölcsi megítéléséről. A ,,helyes nyelv" társadalmi, nem pedig nyelvészeti kategória.)

A saját nyelvünk tudatos megfigyelését kiegészítette a más nyelvek és kultúrák iránti érdeklődés: vagy azért, mert a kultúránk alapját képező művek ezen a nyelven születtek, vagy azért mert mindennapi kapcsolatban állunk a szomszédos népekkel (diplomácia, kereskedelem, háborúk,...), vagy mert egzotikus, távoli, és ezért izgalmas kultúrákról van szó.

A ,,valamely nyelv nyelvészete" típusú kutatások tehát sok esetben más tevékenységek, kutatások segédeszközei. Ha nem a nyelvművelésé vagy a tolmácsolásé, akkor a filológiáé vagy a történelemtudományé. De ha valaki nem ekként műveli a nyelvészetet, akkor is úgy tekint rá, mint valamely speciális népcsoport vizsgálatának egyik lehetséges vetületére. Ugyanezt a népcsoportot lehet az antropológia, a régészet, az irodalom, a néprajz, a történelem, a szellemtörténet, a zene, és egyéb szempontok szerint is vizsgálni, és ezek a vizsgálatok gyakran kölcsönhatnak egymással. Az adatoktól és a kutatási módszertantól függően, vizsgálhatunk egy adott (jelen- vagy múltbeli) állapotot (szinkrón nyelvészet), vagy vizsgálhatunk időbeli változást (diakrón nyelvészet). Rendszerezhetjük különféle szempontok szerint a megfigyelt adatokat, megpróbálhatunk múltbeli feltételezett állapotokat rekonstruálni, és összevethetünk valamilyen okból összevethetőnek ítélt nyelveket (komparatív nyelvészet).

Az ezekből a vizsgálatokból leszűrhető általánosítások, kiegészítve az ókor óta felmerülő nyelvfilozófiai kérdésekkel, vezettek a nyelv kutatásának a másik irányához. Ez a másik irány az emberi nyelv általános (kultúrától, közösségtől független) sajátosságait szeretné megérteni, akárcsak az esztétika az irodalmi alkotások általános sajátosságait, a modern antropológia pedig az emberi kultúrák általános sajátosságait. A konkrét példák valójában többé-kevésbé esetlegesek, és csupán az adott kutató vagy kutatói közösség lehetőségei határolják be a felhasznált adatok körét.

A hagyományos komparatív nyelvészet akkor vet össze két nyelvet, ha az összevetésnek van valamilyen alapja: eredetbeli rokonságot tételez fel e két nyelv között, vagy későbbi történetük során került kölcsönhatásba a két etnikum, és így a két nyelv is. E kutatások általánosítása vezetett a nyelvtipológiához, amely a XX. század első felétől kezdődően, az emberi nyelvek összességét tekintette át, és sorolta őket különböző típusokba, különböző szempontok szerint.

(Egy újabb félreértés szokott itt felmerülni. Egy finnugor, egy sémi vagy egy indoeurópai nyelvésznek jól kell ismernie az általa kutatott nyelvek legjellegzetesebbjeit, a többi nyelvről is sok információval kell rendelkeznie, és illik ismernie legalább valamelyest az érintett népek történelmét és kultúráját. Egy általános nyelvésznek viszont nem kell beszélnie a világ valamennyi múltbeli és jelenlegi nyelvét, nem is lenne rá módja, és még kevésbé van szüksége arra, hogy ismerje a különböző nyelveket beszélő etnikumok történelmét és kultúráját. Csupán arra van szüksége, hogy hozzáférése legyen nyelvtani adatokhoz, minél több nyelven: ha kell, tudjon keresni olyan nyelvet, ahol a főnév így viselkedik, vagy az alany és az állítmány sorrendje amolyan.)

A nyelvtipológia bizonyos jelenségeket univerzálisan igaznak talált a világ minden nyelvében, ezeket nyelvi univerzáléknak nevezzük. Más területeken viszont eltérnek egymástól a nyelvek (és itt nem a szókincsről beszélünk), viszont pontosan ugyanazokat az alaptípusokat figyelhetjük meg a világ különböző tájain.

Hadd mutassam be ezt néhány konkrét, erősen leegyszerűsített példán. Nyelvi univerzálé az, hogy minden emberi nyelvben a kommunikáció egyik alapegysége a mondat, és a mondat alapvető komponensei az alany, az állítmány és a tárgy. (Ez két, egyáltalán nem magától értetődő állítás, ha például másféle kommunikációs rendszerekkel vetjük össze az emberi nyelvet.) Az alany, az állítmány és a tárgy sorrendjét a nyelvek egy része szigorúan rögzíti, másik része nem. Ez két típust jelent a világ nyelveiben. Az előbbi típuson belül hat lehetséges módon lehetne meghatározni az alany, az állítmány és a tárgy sorrendjét, de kiderül, hogy nem mindegyik sorrend fordul elő a világ nyelveiben. Miért nem lehetségesek bizonyos sorrendek?

Egy másik példa az univerzálékra és a nyelvtipológiára: a világ nyelvei megkülönböztetik a magánhangzókat és a mássalhangzókat. Ez egyáltalán nem magától értetődő. Vannak olyan nyelvek, amelyek több magánhangzót tartalmaznak, mások kevesebbet. De kiderül, hogy nem minden magánhangzó-kombináció lehetséges. Például az [á] hang (majdnem) minden nyelvben előfordul, és ha van legalább három magánhangzó, akkor az az [á], az [u] és az [i]. Olyan nyelv nem képzelhető el, amely mondjuk csak az [u], [ö] és [ü] magánhangzókat tartalmazná. Ha van öt magánhangzó, akkor azok szinte mindig az [á], [e], [i], [o] és [u] hangok. Ha ennél több van, akkor a további magánhangzók ezeket egészítik ki. Miért van az, hogy ezek és csak ezek a típusok léteznek? Miért nem kisebb, vagy miért nem nagyobb a változatosság a magánhangzók eloszlása terén a nyelvek között?

Vegyük észre, hogy a nyelvtipológia nem feltétlenül felel meg a hagyományos nyelvcsaládoknak. Bizonyos szempontokból esetleg egy-egy nyelvcsalád egységes, például a sémi és az indoeurópai nyelvek elöljárókkal fejezik ki azokat a viszonyokat, amelyekre a finnugor és a török nyelvek végződéseket használnak. Más szempontok esetén viszont a nyelvcsaládokat kettévágja az osztályozás: ha a jelző és a jelzett szó sorrendjét tekintjük, az egyik csoportba kerül a finnugor magyar nyelv és az indoeurópai angol, míg a másik csoportba kerül a sémi nyelvek közé tartozó héber és a szintén indoeurópai francia. Ha tekintetbe vesszük a különböző afrikai, indián vagy ausztráliai bennszülött nyelveket, akkor azt kapjuk, hogy az angol ebből a szempontból jobban különbözik a franciától, mint mondjuk a Kodava nevű dél-indiai dravida nyelvtől.

Egy másik fontos félreértést is el kell itt oszlatnunk. Amikor a világ összes nyelvét érintő állításokat teszünk, akkor nyelvi rendszer alatt a hangtani, szótani, mondattani, jelentéstani jelenségeket értjük. Az, hogy konkrétan milyen szavak milyen jelentéssel találhatók egy nyelvben, immár esetlegesnek tűnnek, éppúgy, ahogy a szabadesést vizsgáló fizikust sem érdekli a leejtett tárgy neve, pénzbeli értéke vagy színe. Másként megfogalmazva, nem az az érdekes, hogy pontosan mit hogyan fejeznek ki az egyes nyelvek, hanem az, hogy milyen hangtani szabályszerűségek érvényesülnek az éppen adott szókincsen belül, vagy az, hogy milyen mondattani elvek szerint állnak össze ezek a szavak mondatokká. Nem az a kérdés, hogy miért mondják németül ,,Ausgang"-nak a ,,kijárat"-ot, hanem az, hogy mindkét nyelvben vannak igekötők, és hogy mindkét nyelvben létezik igéből történő főnévképzés, viszont megtalálható a német nyelvben egy [au] diftongus (kettőshangzó), amelyet a magyar nyelv nem használ. (Ez a folyamat már a XIX. századi nyelvtörténeti kutatásban elindult, amikor is két nyelv rokonságának a kritériumává nem konkrét szavak egyezését, hanem az etimológiailag egymásnak megfelelő szavak közt felállítható rendszeres hangmegfelelést, azaz egy hangtani törvényszerűséget tettek meg.)

Az 1950-es évektől kezdődően, a Noam Chomsky által fémjelzett modern (ún. ,,generatív") nyelvészet két további lépést tett, amely eltávolította a hagyományos nyelvészettől. Az első lépés a biológiai aspektus hangsúlyozása. Immár a nyelv nem (csupán) egy adott társadalom terméke, hanem egy biológiai funkció, az agyműködés eredménye, az ember kognitív rendszerének egy (különleges) része. Ebben a megközelítésben a nyelvi univerzálék és a nyelvtipológia az emberi agy szerveződésének, működésének az eredménye: a biológia határozza meg, hogy mely jelenségek lehetségesek egyáltalán a nyelvben, azaz az emberi nyelvben, a homo sapiens nevű faj kommunikációs rendszerében, általában. És hogy mely jelenségek nem lehetségesek, illetve milyen változatok megengedettek.

A Chomsky-féle nyelvészet másik újítása a modellezés. A korábbi nyelvészettel ellentétben, nem csupán leírja a nyelvet, hanem modelleket igyekszik felállítani, amelyek bizonyos értelemben ,,megmagyarázzák" a megfigyeléseket. Ezen típusú nyelvészet művelése a természettudományokat idézi: 1. összegyűjtjük az adatokat (például kísérletek révén); 2. rendszerezzük azokat; 3. ennek alapján valamilyen modellt próbálunk meg építeni, amely képes mélyebb, általánosabb elvekből levezetni az adatainkat; 4. a modell segítségével predikciókat (jóslatokat) teszünk, és ezeket ellenőrizzük (újabb kísérletekkel). Amennyiben a modellünk képes ,,leírni", ,,megmagyarázni" az újabb adatokat, nagyon örülünk (de ez csupán ritkán sikerül). Amennyiben viszont találunk olyan adatot, amely nem fér bele a modellbe, még jobban örülünk, mert így újból van munkánk... (a nyelvészek általában nem szeretnek se nem malmozni a kezükkel, se nem havat lapátolni, kiegészítendő a munkanélküli segélyt).

Nyelvészeti modellek

Két kérdés megválaszolása maradt csupán hátra. Egyrészt miből áll egy modell? Másrészt, mit értsünk az alatt, hogy a modell ,,megmagyarázza" a jelenséget?

A nyelvészetben egy modell általában két részből áll, akárcsak más természettudományokban: egyrészt elvekből, fogalmakból, másrészt formalizmusból. Részecskefizika vagy kvantumkémia esetén senki se kérné tőlem, hogy magyarázzam el az elveket, a fogalmakat, és főleg nem a formalizmust. Saját kutatásom esetében, a következő fejezetekben megpróbálom legalább a mögöttük húzódó gondolatokat bemutatni.

A Newton-i mechanikát például a következő módon lehetne felvázolni: bizonyos alapfogalmak (tér, idő, tömeg, erő, gravitációs erő,...), alapelvek (axiómák), valamint egy bizonyos matematikai formalizmus (elemi matematikai analízis) segítségével, bizonyos közelítéssel, igyekszik leírni a testek, például a szabadon eső tömegpont mozgását. Annyival jobb a korábbi elméleteknél, hogy nem csupán kvalitatív módon (,,a test leesik"), hanem kvantitatív szempontból is (,,mennyi idő alatt mekkora utat tesz meg?") megfelel az elmélet által megjósolt tény (a számítások eredménye) a megfigyeléseknek.

Egy nyelvészeti modell esetén a tömegpontnak a hangok, a szavak, a mondatok felelnek meg; a tömegpont mozgásának pedig a hangok változásai vagy a szavak sorrendje a mondatban. Példaként hangváltozásokra, tekintsük a következő szavakat:

-,,asztal+ok", de ,,szék+ek", sőt: ,,sziv+ek", de ,,híd+ak", és ,,ház+ak", de ,,gáz+ok";

-,,ló-val", ,,játék+kal", ,,síp-pal", ,,száj+jal", ,,nád+dal", stb.;

-,,pehely+ben", ,,pehely+re", de: ,,pelyh+es".

Alapelv lehet például az, hogy az agyunk minden morfémát (,,asztal", ,,ló", ,,pehely/pelyh+", többes szám jele, eszközhatározós eset ragja,...) egyetlen alakban tárol, és a különbségek abból adódnak, hogy amikor két morfémát összerakunk, akkor különböző folyamatok zajlanak le. További alapelvek ezekre a folyamatokra is vonatkozhatnak. A formalizmus pedig matematikai eszközökkel írja le ezeket a folyamatokat: például egy szabály kimondja, hogy az eszközhatározós eset ragjának első mássalhangzója hasonuljon az előtte szereplő mássalhangzóhoz. A különböző szabályok megmagyarázzák a különféle jelenségeket.

Hogy mit értsünk itt ,,magyarázat" alatt? Valójában a Newton-i modell egyik kiindulási pontja, a gravitációs erő feltételezése, nem más, mint a leesés tényének a misztikusan hangzó átfogalmazása. Vagyis nem magyaráztunk meg semmit se, csupán odébb toltuk a kérdést: most azt kérdezhetnénk, hogy ,,jó, de honnan származik a gravitáció?". (Hasonlóan, egy olyan magyarázat esetében, amely szerint mondjuk egy transzcendentális lény kívánja meg a feldobott kő leesését, feltehetnénk a kérdést, hogy vajon honnan származik a transzcendentális lény ilyen irányú akarata?) A Newton-i mechanika ,,magyarázó ereje" abban áll, hogy matematikailag kiszámíthatóvá teszi a mozgó test pályáját (mikor hol van?), bizonyos pontossággal. Eme eredmény elérése érdekében egy sor részlettől (például attól az ,,apróságtól", hogy egy egyszerre leejtett lúdtoll és egy ólomgolyó nem szokott földi körülmények közt egyszerre földet érni...) eltekintettünk, viszont ez a modell még így is sok gyakorlati probléma esetén használható, továbbá jó kiindulási pont a további kutatások számára.

Hasonlóképpen, egy nyelvészeti modell is ,,misztikusan átfogalmazza" a megfigyelt tényeket, és képes (bizonyos elhanyagolásokkal) ,,kiszámolni" az alapelvek és a formalizmus segítségével a megfigyelt adatok minél nagyobb részét. Az, hogy nem képes mindent pontosan kiszámolni, nem jelenti azt, hogy a modellt el kell vetni: ha a Newton-i modellt egyből elvetették volna, mondván, hogy abszurd az a jóslata, hogy a leejtett ólomgolyó és lúdtoll egyszerre esik le, akkor nem jutottunk volna el soha a pontosabb, de jóval komplikáltabb fizikai elméletekhez.

Mind a Newton-i, mind a nyelvészeti modell egy apró ponton több mint a korábbi ismeretek misztifikálása. Ez pedig az, hogy korábban egymástól távolinak hitt jelenségeket (mint például a bolygómozgást és az alma leesését) egy közös okra vezetnek vissza. Hogy ez a közös ,,ok" tényleg létezik-e, vagy pedig a tudós kreálja meg, túlságosan filozófiai kérdés, viszont tény, hogy a tudós világképe, amely kezdetbe nagyon sok, különböző jelenséget tartalmazott, ezek után egyszerűbbé válik. A nyelvész például annak örül, ha egy olyan modellt talál, amely képes reprodukálni a világ nyelveiben található különbözőségeket, viszont nem képes azokat a típusokat létrehozni, amelyeknek egyetlen ismert nyelv se felel meg. És még jobban örül, ha a modell eszköztárával nem csupán egy jelenség variánsait, hanem sok, egymástól távoli jelenség variánsait is képes megmagyarázni.

És hogy mire jó egy nyelvészeti modell? Mire jutunk a Newton-i mechanikával? Mindkettő segítheti gyakorlati problémák megoldását. Továbbá, mindkettő hozzájárul ahhoz, hogy az emberiség egy kis hányada (a tudósok közössége) azt higgye, hogy közelebb jutott a világ megértéséhez, és hogy ez az első lépés alapjaivá válhat további lépéseknek ugyanezen az úton (azaz újabb, pontosabb elméletek kifejlesztésének). És itt meg is állhatunk, ha a nyelvészetet önmagában tekintjük (saját kutatásaim esetén legalábbis ez a helyzet).

De ha a nyelvészetet a biológiai, pszichológiai, neurológiai kutatások egyik ágaként fogjuk fel, felmerül a kérdés, hogy vajon az absztrakt nyelvészeti modellek megállják-e a helyüket a biológiai, pszichológiai vagy neurológiai kutatások fényében is? Az elmúlt évtizedben egyre több ilyen jellegű kutatás indult meg. Agysérült betegek nyelvi sajátosságait figyelik meg. Máskor azt az időt mérik, amelyik a kísérleti alany által a fülhallgatóban hallott szó elhangzása vagy a képernyőn megjelent szöveg feltűnése, illetve egy billentyű megnyomása közt telik el. További kísérletekben a képernyőn a szöveget olvasó szem mozgását követik, sőt manapság már az agyban folyó véráramok intenzitásváltozásait is vizsgálják. És mindez hozzájárul ahhoz, hogy bizonyos nyelvészeti modellek állításait teszteljék. Ezek a pszicholingvisztikai, neurolingvisztikai, klinikai lingvisztikai vizsgálatok, továbbá a gyermeknyelvi megfigyelések is, új dimenziókkal bővítik azoknak a megfigyelési adatoknak a körét, amelyekről a nyelvészeti modelleknek számot kell adniuk. Azon elméletek, amelyek ezekkel az adatokkal is összhangban vannak, és nem pusztán a hagyományos nyelvi jelenségekkel, mostantól kezdve a pszichiáter és az agykutató érdeklődésére is számot tarthatnak, e tudományok fejlődéséhez is hozzájárulhatnak. Sőt, az elmúlt években már olyan módszereket is kifejlesztettek, amelyek drága és komplikált agyműtéteket megelőzően, néhány nyelvi teszt segítségével, valamint az agyi véráramok intenzitásának a mérésével határozzák meg az agykárosodás részleteit, ezáltal hozzájárulva a műtéti terv sikeres és olcsó előkészítéséhez.

A modern nyelvészetről sok további érdekes információ található ezen a honlapon.

De térjünk vissza az eredeti kérdéshez: mivel is foglalkozom? Az Optimalitáselmélet és a véges állapotú automaták összeházasításával. Az Optimalitáselmélet a nyelvészeti modell, a szó fentiekben kifejtett értelmében, a véges állapotú automaták pedig egy olyan matematikai fogalomkör, amely segítségével az Optimalitáselmélet formalizmusát szeretném egzaktabb matematikai rendszerbe foglalni. Most már ,,csupán" az marad hátra, hogy e két elmélet alapgondolatait bemutassam.

Optimalitáselmélet

A modern nyelvészeti elméletek legtöbbike úgy modellezi a nyelvet, hogy feltételez egy úgynevezett ,,mélystruktúrát" és egy úgynevezett ,,felszíni struktúrát", és a kettő közötti kapcsolat mibenléte az, amely a nyelvészeti jelenségeket megmagyarázza. Ahogy a fizikai képletek bizonyos mennyiségekből kiszámíthatóvá tesznek más mennyiségeket, úgy a nyelvészeti modell a mélystruktúrából ,,számítja ki" a felszíni struktúrát. Utóbbi az, ahogy a szó vagy a mondat megjelenik a beszédben, előbbi pedig egy absztrakt reprezentáció, és jó esetben van valami köze az agy működéséhez. Például a ,,pehely" szó alakja a felszíni struktúrában többféle lehet ([pehely] vagy [pelyh-]) attól függően, hogy milyen végződések járulnak hozzá (például: ,,pehellyel", ,,pehelyben", ,,pelyhes",...): ugyanabból a mélystruktúrából (/pehely/) különféle felszíni alakok jönnek létre, a különböző környezetek hatására másként és másként működő mechanizmusok (például levezetési szabályok) hatására. A ,,generatív grammatika" elnevezése is innen származik: miként generáljuk a ,,felszíni" struktúrát a ,,mélyben" meglevő elemekből?

A különböző elméletek abban térnek el egymástól, hogy miként képzelik el a ,,mély" és a ,,felszín" közt ható mechanizmusokat. Az általam vizsgált elmélet, az Optimalitáselmélet (Optimality Theory), 1993-as indulása óta nagy népszerűségre tett szert. Alapgondolatát talán a következő hasonlattal lehetne érzékeltetni.

Egy jó boltban egy csomó csokoládéfajtát lehet kapni. Finomabbakat és kevésbé finomakat, olcsóbbakat és drágábbakat, nagyobb és kisebb kiszerelésben kaphatókat. Amikor valaki vásárol, akkor ezeket a szempontokat mérlegeli, mielőtt dönt, hogy melyiket vásárolja meg. (Tegyük fel, hogy csupán egyet akar vásárolni, és nem mindegyiket...) Van, aki elsősorban a finomat fogja választani, más az olcsóbbat, megint másvalaki a nagyobb mennyiséget. Van, aki először az árat nézi meg, majd a legolcsóbbak közül a minőséget veszi figyelembe, végül a mennyiség dönt a még mindig versenyben lévő jelöltek közt. Másvalaki szintén az árral fogja kezdeni, de a mennyiség megelőzi a minőséget. A különböző vásárlói típusokat a szerint modellezhetjük, hogy ki milyen ,,fontossági hierarchiát" állít fel, miközben vásárol.

Hasonló alkalmazható a nyelvekre is. Az Optimalitáselmélet feltételezi, hogy minden nyelv ugyanabból a kínálatból választ, amikor például az alany, az állítmány és a tárgy sorrendjét akarja meghatározni, és ugyanazok a szempontok érvényesülnek a választás során. Ezek ,,biológiailag" adottak. A különböző nyelvek, nyelvtípusok abban térnek el csupán egymástól, hogy ki milyen relatív jelentőséget tulajdonít az egyes ,,értékelési szempontoknak". A különböző sorrendek megfelelnek az egyes nyelvtípusoknak, és a nyelvész feladata megtalálni azokat a ,,szempontokat", amelyek segítségével a lehető legjobban le lehet írni az egyes nyelveket, nyelvtípusokat.

Szóhangsúly esetén például olyan ,,szempontok" merülnek fel, mint például a hangsúly szeretne egyrészt a szó elejére kerülni, másrészt szeretne a szó végére kerülni, továbbá nem szeretne az utolsó szótagra kerülni, vagy szeretne a hosszú magánhangzót tartalmazó szótagra kerülni, stb. Ezek a szempontok gyakran ellentmondanak egymásnak, és ezekből vezethetjük le a különböző nyelvtípusokat. A magyarban például a legerősebb ,,tényező" az, hogy a hangsúly kerüljön az első szótagra, ezért van mindig az első szótagon a hangsúly. A véghangsúlyos nyelvek esetében (például francia, héber) a legerősebb az a megszorítás, amely a szó végére szeretné helyezni a hangsúlyt. Azokban a nyelvekben, amelyek az utolsó előtti szótagra helyezik a hangsúlyt, a legerősebb megszorítás az, hogy ne kerüljön a hangsúly az utolsó szótagra (vagyis ez a jelölt kiesik), de a többi lehetőség közül a második legerősebb ,,szempont", - amely szerint a hangsúly legyen minél közelebb a szó végéhez -, azt a lehetőséget fogja preferálni, amelyik az utolsó előtti szótagra helyezi a hangsúlyt.

(Egy ilyen leírás egyébként mindig valamilyen részkérdésre, például az alany, az állítmány és a tárgy sorrendjére vagy a szóhangsúly helyére vonatkozik, és abban bízunk, hogy sok idő múlva, egyszer majd össze lehet rakni ezt a sok-sok kis részletet egy egységes rendszerbe.)

Ha ügyesek vagyunk, a különböző fontossági sorrendek pontosan azoknak a típusoknak fognak megfelelni, amelyek létező nyelveket fednek. Ha például az alany, az állítmány és a tárgy egy adott sorrendje nem létezik egyik nyelvben sem, és a modell se képes ilyet létrehozni, akkor azt mondjuk, hogy a modell megmagyarázza, miért is nem fordul elő ez a sorrend a világ nyelveiben. Az Optimalitáselméletről további információ és linkek is találhatók ezen a site-on.

Tanulhatóság

A nyelvészeti elméleteknek egy további oldala a tanulhatóságuk. Észre se vesszük, de ha jobban belegondolunk, messze nem magától értetődő tény, hogy minden (egészséges) kisgyermek képes elsajátítani az anyanyelvét. A nyelvészeti modellek szeretnék sok esetben azt is megmagyarázni, hogy hogyan lehetséges ez. Ha feltételezzük, hogy sok minden biológiailag adott (inatizmus), és csupán néhány ,,részletet" kell megtanulni, az látszólag könnyebbé teszi a nyelvelsajátítás folyamatát.

A nyelvelsajátítás két további vetülete is érdekes. Sokan vizsgálják az idegennyelv-tanulás során megfigyelhető jelenségeket, például azt, hogy az elkövetett hibák milyen részben tudhatók be az anyanyelv hatásának, és milyen részben magyarázhatók a nyelvi univerzálékkal. Ezek a megfigyelések is kihatnak a nyelvészeti elméletekre.

A másik vetület a számítógépes tanulás: modellezhető-e számítógéppel a nyelvelsajátítás, illetve képesek leszünk-e a számítógépeket megtanítani valamely emberi nyelvre oly módon, hogy a számítógép a gyermekhez hasonlóan magától sajátítja el a nyelvet az észlelt adatok alapján. (Nem pedig úgy, hogy leírjuk neki a szabályokat, mint a régimódi iskolás idegennyelv-oktatás esetében. Ezeket a szabályokat ugyanis nem biztos, hogy mi magunk képesek vagyunk megfogalmazni, vagy akarjuk venni a fáradságot, hogy megfogalmazzuk minden egyes esetben.)

Ami az én munkámat illeti, az is foglalkoztat, hogy az Optimalitáselmélet mennyire képes modellezni a nyelvelsajátítást. Ezzel kapcsolatban a hasonlatom a következő.

Tegyük fel, hogy új barátnőnket akarjuk tesztelni. Meg akarjuk tudni, hogy a termékválasztási szempontjai hasonlóak-e a mienkéhez. Ezért a következőt tesszük. Elvisszük őt a boltba, és figyeljük, hogy miként választ a csokoládék közül. Eléje teszünk például két, azonos súlyú csokoládét: az egyik drágább, de finomabb, a másik viszont olcsóbb, de rosszabb. Ha az előbbit választja, akkor azt a következtetést vonhatjuk le, hogy fontosabb számára a minőség, mint az ár. (Vagy pedig azt, hogy elvárja, hogy mi fizessünk...) Ha ügyesen teszünk eléje különböző termékeket, akkor idővel megismerhetjük a bevásárlási szokásait irányító érték-hierarchiát.

Ugyanígy lehet konstruálni egy olyan tanuló-algoritmust, amely kellő számú nyelvi adat alapján kikalkulálja, hogy az adott ,,értékelési szempontokat" (hivatalosan: ,,megszorítások") a vizsgált nyelv milyen sorrendben alkalmazza. Mi fontosabb szempont, és mi kevésbé. Ha szerencsénk van, ez elég jól modellezi azt, ahogy a gyermek elsajátítja az anyanyelvét. Ha kevésbé van szerencsénk, legalább olyan számítógépprogramokat tudunk majd építeni, amely helyettünk kispekulálja az adott nyelvet leíró hierarchiát.

(Egy megjegyzés: Amikor azt írom, hogy ,,jól modellezi azt, ahogy a gyermek elsajátítja az anyanyelvét", nem úgy kell érteni, hogy a gyermek tudatosan rendezgeti egymáshoz képest a ,,megszorításokat". Sőt, általában véve, egy helyesnek bizonyuló nyelvészeti modell elemei nem jelennek meg feltétlenül szó szerint az agyban. Arról van csupán szó, hogy a modell helyesen adja vissza a megfigyelt jelenségeket, például a nyelvelsajátítás fázisait, tipikus hibáit. Továbbá, nagyon szerencsés esetben, a távoli jövőben, esetleg bizonyos agyfolyamatokkal azonosítani lehet a modell egyes elemeit.)

Véges állapotú automaták

Tegyük fel, hogy már hosszú ideje együtt vagyunk az előbb említett barátnőnkkel. Ekkor a következő módon szoktuk őt elképzelni (eléggé jellemző a férfiakra...). Adva van véges számú állapota: ,,jó hangulatban van", ,,ideges", ,,szeret bennünket", ,,nagyon ideges", ,,nagyon-nagyon ideges",... Ha mondunk neki valamit, akkor az éppen aktuális állapota, valamint az általunk mondottak függvényében válaszol valamit, és átmegy egy másik (vagy ugyanabba) az állapotba. Ha például tévézés közben odaszólunk neki, hogy ,,add ide a sört" (bemenet), a reakciója a jelenlegi állapotától függ. Ha éppen a ,,szeret bennünket" c. állapotban van a kedves barátnő, akkor ideadja a sört, és ugyanebben az állapotban marad. Ha viszont a ,,nagyon ideges" c. állapotban leledzik, akkor azt mondja, hogy ,,............" (ez az automata kimenete), és átmegy a ,,nagyon-nagyon ideges" c. állapotba.

A modellnek több fontos tulajdonságára hadd hívjam fel a figyelmet. Először is, a modell szerint a nő nem rendelkezik memóriával (ez gyakori tévedése a férfiaknak...), vagyis a régebbi történések nem befolyásolják a reakcióját a bemenetre, egyedül a jelenlegi állapota. Másodjára, csupán véges számú állapot közül választhat a nő. Végezetül, ha bármely mondatunk és bármely jelenlegi állapot mellett egyértelmű, hogy mi lesz a reakciója, és hogy milyen állapotba megy át, akkor ,,determinisztikus automatáról" beszélünk. Ha viszont valamely bemenet és valamely állapot esetén több lehetséges kimenet és következő állapot is lehetséges, akkor a nőt egy ,,nem determinisztikus automatával" kell modelleznünk. (Sok férfitársam tapasztalata az utóbbit támasztja alá...)

A viccet félretéve, a véges állapotú automaták (amelyeket tényleg így kell elképzelni) nagyon sok érdekes tulajdonsággal bírnak. A feladatom részben az, hogy ezekkel próbáljam meg megvalósítani az Optimalitáselméletet. Más szavakkal: a véges állapotú automataként modellezett nőt elviszem csokit vásárolni...: beadom neki a különböző csokimárkákat, ezek alapján különböző állapotokon megy át, végül kiköpi azt, hogy melyiket szereti. Azt kell kitalálni, hogy milyen állapotokat feltételezzek ahhoz, hogy a megfigyelt bemenethez a megfigyelt kimenet társuljon.

Lehetséges ez? Majd válaszolok rá 2005 őszén, amikorra befejezem a disszertációmat. Addig inkább magam vásárolok csokoládét...

Bíró Tamás