|
Erika Rimkutė, Jolanta Kovalevskaitė (šis straipsnis publikuotas žurnale Gimtoji kalba 2008 m. nr. 5)
Mašininio vertimo kūrėjų ir tyrėjų darbas dažnai panėšėja į ilgųjų distancijų bėgiko likimą: jėgų tam reikia daug, o finišo tiesiosios, kuri galėtų įkvėpti, nematyti. Tai lemia daug veiksnių: vartotojų netenkinanti MV kokybė, sudėtingas gauto rezultato vertinimo procesas, klaidingas, nerealiais lūkesčiais pagrįstas MV naudojimas. Paskutiniame ciklo straipsnyje norėtume trumpai aptarti, kaip vertinti MV sistemas, kokią nišą MV mato patys jų kūrėjai ir kokią ateitį jai prognozuoja. MV teikia ne tik praktinę naudą (greitai išverčiami dideli tekstai), bet ir teorinę iš automatiškai išverstų tekstų galima daugiau sužinoti apie kalbą, iš kurios verčiama, ir į kurią verčiama. Tai leidžia geriau suvokti tų kalbų struktūra, ypatybes. Kuo panašesnės kalbos, tuo lengviau kurti MV sistemą. Apie kalbų skirtumų daromą įtaką MV bus rašoma toliau šiame straipsnyje.
Ką mano MV vartotojai? Paskutiniojo Compendium of translation software leidimo duomenimis, šiuo metu siūloma daugiau negu 30 internete laisvai prieinamų nemokamų MV paslaugų (Gaspari et al. 2007: 200). Pasirinkimas didelis, tačiau informacijos apie tų įrankių naudojimą nedaug. Trūksta ir tyrimų apie pačius MV vartotojus: koks jų kalbinis pasirengimas, kodėl jie naudojasi MV, kiek ir kaip vertina MV galimybes. Gaspari et al. (2007) pristatė trijų internetinių MV sistemų vartotojų įvertinimą atsižvelgiant į tokius kriterijus: dažniausiai vartojamos kalbų poros; vertimo dažnumas, verčiamų tekstų forma; verčiamų tekstų ilgis ir pan. Vartotojų požiūrį tirti sunku, nes MV kuriančios kompanijos norėdamos išlaikyti konfidencialumą dažnai neteikia sukauptų duomenų apie savo vartotojus, MV sistemos vertinimą ir pan. Taigi dažnu atveju šaltinis, leidžiantis susidaryti nuomonę apie vartotojų požiūrį į MV, yra pačių vartotojų komentarai, skelbiami viešojoje erdvėje. Pirmąsias nuomones apie anglųlietuvių kalbų MV vertimo sistemą taip pat galima sužinoti iš internete pasirodžiusių komentarų. Komentatoriai dažniausiai pasidalija į dvi grupes: vieni, neturėdami pakankamai žinių apie MV kaip specifinės vertimo rūšies veikimo principus, vertina neigiamai ir neįžvelgia jokių įrankio taikymo galimybių; kiti argumentuoja MV naudą aiškiai suprasdami, kad MV funkcija nėra versti grožinę literatūrą ir pakeisti vertėjus, o vertina svarbiausią MV pranašumą, kurį pabrėžia ir MV tyrėjai: greitai pateikiama informacija lietuvių kalba apie anglų kalba parašyto teksto turinį. Viena pagrindinių MV vertinimo problemų yra ta, kad vartotojai nesuvokia MV galimybių ribų (Gaspari et al. 2007: 201). Tai ypač pasakytina apie MV sistemas, skirtas didelei vartotojų grupei (įvairios tematikos tekstams versti). Kokie tekstai verčiami MV sistema taip pat svarbu, nes iš to galima spręsti, kaip vartotojai vertina MV. Pastebėta, kad dažnai vartotojai naudojasi MV versdami atskirus žodžius arba frazes (taigi kaip elektroninį žodyną) galbūt todėl, kad gana gerai moka anglų kalbą arba tiesiog yra nusivylę automatiškai išverstų tekstų kokybe. Kaip vertinamos MV sistemos? Turbūt ne vienam skaitančiam šį straipsnių ciklą kyla klausimas, kiek tikslus ir patikimas gali būti MV vertimas. Pirmiausia svarbu žinoti, kas vertinima: ar techninės galimybės (pavyzdžiui, vertimo greitis), universalumas (gerai verčiamų temų skaičius) ar pats vertimo rezultatas. Vertinant MV kokybę reikia nustatyti kriterijus. Dažniausiai sudaromas tam tikras kriterijų rinkinys, kuriame išskiriamas taisyklingumas (gramatinis) ir tikslumas (prasmės, turinio) (Daudaravičius 2006: 17). MV atveju svarbiausiu laikytinas teksto turinio, prasmės perteikimas kita kalba. Vienas iš būdų MV kokybės vertinimas penkių balų skale: vienu balu įvertinamas automatiškai išverstas tekstas, kuriame visa ar beveik visa svarbi informacija yra prarasta; o penkiais balais vertinamas toks vertimas, kuriame informacija perteikta teisingai, nėra prasmės iškraipymų (plačiau žr. Darwin 2001: 2, cituota iš Daudaravičius 2006: 17). Vertinimo tikslumą gali įvertinti tik abi kalbas (tą, iš kurios verčiama, ir tą, į kurią verčiama) mokantys ekspertai. Labai dažnai yra apsiribojama techninių MV sistemos galimybių įvertinimu, kuriame taikomi tikslūs kriterijai, pateikti tarptautiniuose MV vertinimo standartuose (ISLE Classification Framework for Evaluation of Machine Translation). MV rezultatą vertinant lingvistiniu požiūriu kyla sunkumų, nes nėra vienodų vertinimo kriterijų, dažnai neaišku, kokius kriterijus pasirinkti, kaip tie kriterijai turi būti klasifikuojami pagal svarbą ir pan. Galima paminėti vieną eksperimentą, kurio tikslas buvo įvertinti demonstracinę anglųlietuvių kalbų MV sistemos versiją (naudota 2007-07-31 versija). Vertinant, kaip išverstas sakinys, buvo atsižvelgta į kelis kalbinius kriterijus: ar perteikta viso sakinio prasmė, ar pasirinkti tinkami atitikmenys, ar tinkamai perteikta sakinio struktūra, ar išversti visi sakinio vienetai, ar yra rašybos ir skyrybos klaidų (plačiau apie eksperimentą žr. Rimkutė et al. 2007). Eksperimento metu nustatyta, kad 62 proc. sakinių išversti tinkamai. Šie duomenys gauti įvertinus testinį tekstyną, kurį sudaro 100 atsititiktinai parinktų sakinių (apie 3680 žodžių) iš naujienų tinklalapio http://www.bbc.com. Vertinama gali būti ne tik galutinė MV sistema, bet, kaip matyti iš eksperimento, vertinimas taip pat yra ir MV sistemos testavimo (taigi MV kūrimo) dalis. Antra vertus, vertinimas ypač aktualus tęstiniuose MV projektuose, kurie yra toliau tobulinami, atsižvelgiant į vartotojų lūkesčius, kritiką, poreikius. Naujuose tyrimuose MV sistema vertinima siejant rodiklius, gautus žmogui įvertinus rišlumą (angl. fluency) ir tikslumą (angl. adequacy), su automatiniais metodais gautais rodikliais (plg. Estrella et al. 2007). Dauguma tyrėjų, lingvistikai vertinančių MV, pripažįsta, kad dažnai sunku numatyti galimas MV klaidas, pavyzdžiui, norint automatizuoti sintaksinių klaidų testavimą, reikia turėti aiškią sintaksinių taisyklių schemą (plg. Marrafa et al. 2001). Kitas klausimas, dėl kurio diskutuoja MV vertintojai, kokia turi būti vertinamos medžiagos apimtis? Kiek dokumentų arba (skirtingų žanrų, tematikos) tekstų reikia įvertinti, kad rezultatus būtų galima laikyti patikimais? Šie klausimai svarbūs galvojant apie laiko ir pinigų sąnaudas, reikalingas MV kurti ir tobulinti. Prieita išvada, kad patikimai įvertinti, kaip testuojama MV sistema verčia, užtenka mažiau tekstų, negu manyta iki šiol. Testuojant, kaip MV verčia kurios nors vienos srities tekstus (sakykim, ES Parlamento tekstus), patikimam kokybės rodikliui pasiekti užtenka apie 250 tos srities tekstų segmentų (apie 6000 žodžių) (Estrella et al. 2007: 167, 174). Nereikia pamiršti, kad vertimo kokybė priklauso nuo verčiamo teksto žanro (plačiau apie tai GK 2007 10), todėl ir teksto žanras, ir teksto tematika laikomi svarbiais veiksniais, lemiančiais MV testavimo (ir įvertinimo) būdą, kriterijus. MV programos retai gerai išverčia elektroninius laiškus, pokalbių svetainių ir internetinių dienoraščių tekstus. Tiesa, kai kurie MV kūrėjai jau siūlo specializuotus įrankius, kurių funkcija versti elektroninius laiškus (Gaspari et al. 2007: 204). Kitas svarbus veiksnys, leidžiantis tikėtis geresnės vertimo kokybės, yra kalbos, iš kurios verčiama, ir kalbos, į kurią verčiama, artimumas. Kitaip sakant, MV kūrimas rusųlietuvių arba lietuviųrusų kalbų poroms būtų ne toks sudėtingas kaip anglųlietuvių kalbų porai, nes rusų ir lietuvių kalbų struktūriškai panašios. Kalbų skirtumai MV klaidų atsiradimo priežastis. Analizuojant MV sistemos trūkumus ir klaidas, vienas iš labiausiai į akis krintančių dalykų yra kalbos, iš kurios verčiama, įtaka kalbai, į kurią yra verčiama. Šiuo atveju anglų kalbos įtaka lietuvių kalbai. Vienas iš pavyzdžių daiktavardinių frazių vartojimas vietoj veiksmažodinių, plg.: after reading a novel po romano perskaitymo (perskaičius romaną ir pan.). Lietuvių kalba yra linkusi tokiais atvejais vartoti veiksmažodžių formas. Daugiau pavyzdžių: Being here was pleasant. Buvimas čia buvo malonus (= Būti čia buvo malonu).
Having friends is important. Draugų turėjimas labai svarbus (= Turėti draugų yra svarbu).
Dar vienas anglų ir lietuvių kalbų skirtumas, išryškėjantis automatiškai išverstuose tekstuose, yra tas, kad sunku atskirti veikiamosios ir neveikiamosios rūšies dalyvius. Akivaizdu, kad lietuvių kalboje aiškiai skiriasi šios dalyvių poros: apsirengęs aprengtas, apsikirpęs apkirptas, pavalgęs pavalgydintas, nusiprausęs nupraustas, nusivylęs nuviltas ir pan. Tačiau kyla daug neaiškumų, kaip išversti šias anglų kalbos veiksmažodžių formas: dressed, persuaded, prepared, washed ir pan. Be klaidų išverčiama tada, kai šalia pavartoti žodžiai ar gramatinės konstrukcijos signalizuoja, kuris dalyvis turi būti vartojamas, pvz.: I am dressed aš esu apsirengęs. I am dressed by my mother aš esu aprengtas mano (= savo) motinos.
Tačiau neaišku, kaip tinkamai išversti šiuos sakinius: I'm not persuaded. Aš nesu įsitikinęs/ įtikintas? (dabar automatiškai verčiama taip: Aš nesu įtikinęs)
Although it is difficult to predict, he noted, increased sea temperatures could eventually lead to a breakdown of the relationship between fish and algae. Nors sudėtinga numatyti, jis pažymėjo, padidinta (= padidėjusi) jūros temperatūra galėjo galų gale privesti prie gedimo santykio tarp žuvies ir jūros augmenijos. Bandant suderinti dviejų tipologiškai skirtingų kalbų neatitikimus, dažnai tenka rinktis mažesnę blogybę iš dviejų arba nuspręsti, kuri anglų kalbos konstrukcijos interpretacija būtų teisingesnė lietuvių kalboje. Ypač tokių dilemų kelia anglų kalbai būdingų konstrukcijų su -ing vertimas. Plg:
Visiting relatives is unpleasant. Giminaičių lankymas/ apsilankymas yra nemalonus (MV vertimas lankymas). Taigi neaišku kas ką lanko? Versdami anglų kalbos -ing konstrukciją į lietuvių kalbą daiktavardine konstrukcija, ne visada laimėsime: gali kilti sunkumų dėl anglų kalbos sakinio daugiareikšmiškumo, pvz.:
Without reading a book he said. (a) Neskaitydamas knygos jis pasakė. (MV variantas) (b) Ne(per)skaitęs knygos jis pasakė. B varianto pasirinkimą šiuo atveju lemia tai, kad anglų kalbos sakinyje pavartotas būtojo laiko veiksmažodis (said), kuris nurodo, kad anglų kalbos -ing konstrukcija lietuviškame sakinyje turi būti perteikiama ne pusdalyviu, o būtojo kartinio laiko dalyviu. Dėl anglų kalbos gramatiškai daugiareikšmių konstrukcijų galimi keli kito sakinio vertimo variantai: I was happy to read a book. Aš buvau laimingas (a) perskaitęs knygą. (b) skaitydamas knygą. (c) galėdamas perskaityti knygą. MV vertimas: Aš buvau laimingas perskaitydamas knygą. Dar vienas anglų kalbai būdingas bruožas, apsunkinantis MV, yra struktūros skirtumai, pvz., žodžių tvarka sakinyje, plg.: If you find a person you wish to communicate with, use our messaging system for instant contact. Jei jūs randate asmenį(žmogų), jūs norite susisiekti su (= su kuriuo jūs norite susisiekti), naudoti mūsų pranešimo sistemą greitam kontaktui.
"I actually like Hillary Clinton very much, but I don't think she's electable," she says. Aš iš tikrųjų mėgstu Hillary Clinton labai (= labai mėgstu Hillary Clinton), bet aš nemanau, kad ji yra electable, sako ji. Kartais lietuvių kalbai neįprasta žodžių tvarka, primenanti anglų kalbos sakinio sandarą, nėra prastos MV analizės rezultatas, o apgalvotas MV kūrėjų sprendimas, kaip antai šiuose sakiniuose: He enjoys doing it. Jis mėgsta daryti tai. Lietuviškai natūraliai: Jis mėgsta tai daryti. Bet tokia žodžių tvarka, kai papildinys paliekamas toje pačioje vietoje kaip ir anglų kalbos sakinyje, leidžia MV sistemai efektyviau versti sudėtinius sakinius, pavyzdžiui: Jis mėgsta daryti tai, kas jam įdomu. Žodžių tvarka gali tapti apskritai labai didele problema, jos neišsprendus galima gauti iškreiptos (arba sunkiai suprantamos) reikšmės lietuvišką sakinį, pvz.: Human Changing Rainfall Patterns, study says (a) Žmogaus/Žmogiška Keitimo/Pasikeitimo Kritulių Struktūra/Šablonas, sako studijavimas (b) Tyrimai rodo, kad žmonės keičia kritulių struktūrą Pirmasis vertimo variantas yra MV sistemos pateiktas vertimas, (b) variantas perteikia informaciją, kurią norėta pasakyti publicistinio straipsnio antrašte. Kadangi anglų kalboje dažniausiai nesiskiria giminių formos, vertime gali pasitaikyti sakinių, kuriuose nesuderintos giminės: She is one of the world's most famous photographers. Ji yra vienas iš pasaulinių garsiausių fotografų (= viena iš garsiausių pasaulio fotografių). Dar viena netikslaus MV rezultato priežastis sangrąžinių ir nesangrąžinių formų vertimas. Pvz.: She ordered a book. Ji užsakė/ užsisakė knygą.
I went out to buy some bread. Aš išėjau, kad nupirkčiau/ nusipirkčiau truputį duonos.
Some governmental activity related to religion has been declared constitutional by the Supreme Court. Kažkokią vyriausybinę veiklą, susietą/ susijusią su religija, paskelbė konstitucinę Aukščiausiasis Teismas. MV rezultatas nesangrąžinės formos. Anglų kalbos veiksmažodis į lietuvių kalbą sangrąžine forma verčiamas tik tada, kai originalo kalbos sakinyje yra aiškus į save nukreipto veiksmo rodiklis, pvz.: She ordered herself a book Ji užsakė sau knygą. Kitais atvejais MV sistema pateikia nesangrąžines formas, nors lietuviškai įprasčiau skambėtų sangrąžinės. Norint gauti kuo tikslesnį ir taisyklingesnį MV rezultatą, reikia atsižvelgti į anglų ir lietuvių kalbų rašybos skirtumus: anglų kalboje įprasta iš tikrinių daiktavardžių padarytus būdvardžius rašyti didžiąja raide, pvz.: Trained in both pediatrics and psychiatry, he was intrigued by Freudian theories. Mokytas ir pediatrijoje, ir psichiatrijoje, jis buvo sudomintas Froidistinių teorijų. MV išlaiko originalo kalbos didžiųjų raidžių rašybą, todėl būdvardis froidistinis lietuviškame vertime parašytas didžiąja raide. Čia reikalinga taisyklė, kad lietuvių kalboje visi būdvardžiai rašomi mažąja raide. Viena iš pagrindinių problemų yra tikrinių daiktavardžių vertimas. Neatpažinti ir neišversti tikriniai daiktavardžiai trukdo suvokti visą sakinį. Kita vertus, visų tikrinių daiktavardžių neįmanoma įtraukti, nes jų be galo daug ir atsiranda vis naujų. Tam tikrais atvejais geresnis MV rezultatas gaunamas tada, kai tikriniai daiktavardžiai, ypač vardai ir pavardės, bendrovių, prekių pavadinimai ir pan., neverčiami. Tačiau didžiuma geografinių pavadinimų turėtų įeiti į bendrąjį MV žodyną. MV netikslumų neišvengiama ir dėl anglų kalbos homonimijos, plg. šį sakinį, kuriame direct išversta kaip būdvardis tiesioginis, nors turėtų būti verčiamas prieveiksmiu tiesiogiai: Speaking to colleges direct can give your son or daughter the best idea about whether the things they want are offered, e.g. specific modules. Kalbėjimas su tiesioginėmis kolegijomis (= kalbėjimas tiesiogiai su kolegijomis) gali duoti jūsų sūnui ar dukteriai geriausią mintį apie tai, ar daiktai, kurių jie nori yra pasiūlyti, pavyzdžiui specifiniai moduliai. Kitame sakinyje vietoj daiktavardžio palaikai pasirinktas kitas homonimiško anglų kalbos žodžio remains atitikmuo veiksmažodis likti: His remains were repatriated on Monday to South Korea. Jo lieka (= palaikai), buvo grąžinti į tėvynę pirmadienį į Pietų Korėją. Dažnai MV sistemos vartotojai gauna netikslų vertimą dėl netinkamai parinktų anglų kalbos prielinksnių atitikmenų, pvz.: "We've got to find somebody else," says David Newman, a retired teacher from York, Maine. "Mes turime surasti dar ką nors," sako David Newman, išėjęs į pensiją mokytojas nuo (= iš) Jorko, Meinas.
She was able to attract voters from all political parties. Ji sugebėjo pritraukti rinkėjus nuo (= iš) visų politinių partijų. MV sistemą dar reikia tobulinti. Viena iš tobulintinų sričių veiksmažodžių formų vertimas:
Both the idea of such an organism and the idea that someone might own the rights to it would have been science fiction even a decade ago. Ir mintis apie tokį organizmą, ir mintis, kad kažkas galėtų valdyti/turėti/pripažinti teises į tai bus (= būtų buvusi) mokslinė fantastika net prieš dešimtmetį.
Ossoff says Clinton's "baggage, the issues she's had with her husband," are part of the reason people say she can't win. Ossoff sako Clinton "bagažą, svarstomos problemos/leidimai, kurias ji yra turėta (= turėjo) su jos vyru," yra priežasties/proto dalis, žmonės sako, kad ji negali nugalėti.
David Walker was given an indeterminate sentence after being convicted of sexual assault while drunk. David Walker davė neapibrėžtą sakinį/bausmę, būdamas kaltintas/nuteistas (= nuteisus) dėl seksualinės prievartos tuo metu, kai išgertas (= kai buvo išgėręs). Skirtingas anglų ir lietuvių kalbos veiksmažodžių junglumas taip pat gali būti netikslaus MV priežastis:
...all of whom must compete against each other to try to stay on the programme. ... iš kurių visi turi konkuruoti prieš vieną kitą (= vienas su kitu), kad pabandytų užtrukti programa. Analizuojant anglų kalbos sakinį nemažai sunkumų kyla dėl to, kad anglų kalboje labai nesistemingai vartojami skyrybos ženklai. Kompiuterinėms analizės programoms labai praverstų tikslios sudėtinio sakinio skyrybos taisyklės, nes pagal kablelio vietą būtų galima nustatyti sakinių ribas, sudėtinio sakinio tipą ir pan. Lietuvių kalbos skyrybos principai labai skiriasi nuo angliškųjų, plg.: The day on which Mr Brown began his break with Blairism in earnest. Kaip pagerinti MV kokybę? Kalbant apie MV ateitį, pirmiausia turima mintyje, kaip bus tobulinamas automatinis vertimas. Tęstinumas ir tobulinimas svarbus kiekvienai MV sistemai, ne išimtis ir anglųlietuvių kalbų MV. Viena iš anglųlietuvių MV sistemos kokybės gerinimo sąlygų papildyti dabartinį anglųlietuvių kalbų žodyną (jį sudaro apie 50 tūkst. žodžių). MV kokybė turėtų gerokai pagerėti, kai verčiant specifinius tekstus (techninius, medicinos, sporto ir pan.) bus galima pasirinkti specialiuosius žodynus. Šiuo metu jie rengiami (ekonomikos, teisės, interneto terminų ir kt.). Siūlant daugiau internetinių MV sistemų paslaugų, greta bendrųjų ir specialiųjų žodynų, leidžiama vartotojams kurti ir pildyti savo žodynus. Gerinant MV skirtų žodynų sudarymą (plačiau apie tai GK 2008 2) gali padėti tam tikri automatizuoti įrankiai (plg. įrankį Waspbench (Koeling et al. 2003)). Jais galima gerokai automatizuoti leksikografų darbą, jiems nebereikia rinkti medžiagos ir analizuoti didelio duomenų kiekio iš tekstynų. Pirmiausia analizuojami automatiškai išgauti tiriamų žodžių junglumo modeliai. Paskui įvertinama, ar programa teisingai parinko verčiamo žodžio atitikmenis. Jeigu atitikmuo netinkamas, leksikografas jį pakeičia, o programa vėliau atsižvelgia į šią informaciją parinkdama atitikmenis tam pačiam žodžiui kituose sakiniuose. MV kokybę, ypač tinkamų atitikmenų pasirinkimą, galima pagerinti prieš tai nustačius, kokios temos tekstas bus verčiamas. Teksto tema nustatoma keliais būdais: pavyzdžiui, pagal raktinius žodžius, pagal teksto prototipiškumą (plačiau žr. Utka 2004). Nustačius temą išsprendžiamas atitikmenų parinkimo klausimas tuo atveju, jei naudojami specialieji žodynai. Pavyzdžiui, jei verčiamas tekstas apie kompiuterius, akronimas GB greičiausia turėtų būti verčiamas gigabaitai, o ne Didžioji Britanija. Vis dėlto nemažai žodžių, esančių specialiuosiuose žodynuose, tam tikros temos tekstuose gali būti vartojami ir savo pagrindine reikšme (pvz., fan aistruolis ir vėdintuvas, bit bitas ir gabaliukas). Remiantis statistiniais duomenimis, gautais iš didelių tekstynų, nustatoma, kuris daugiareikšmio žodžio atitikmuo turėtų būti pasirenkamas (plačiau žr. Vaičiūnas 2006). Šio metodo principas toks: žodžiai suklasifikuojami į tam tikras klases. Jeigu analizuojamas žodis patenka į klasę, kurioje, pavyzdžiui, yra žodžiai sportas, krepšinis, triukšmas, muštynės, rungtynės, televizija, tikriniai pavadinimai ir pan., tokiu atveju sakinyje All of these TV's have fans and fans make noise (dabartinis vertimas: Visi jie, televizija turi aistruolius/vėdintuvus ir aistruolius/vėdintuvus daro triukšmą) žodžiui fan turėtų būti parenkamas atitikmuo aistruolis, o jei gretimi žodžiai patenka į techninius dalykus reiškiančią semantinę klasę, pvz., kompiuteris, televizorius, radiatorius, mašina, variklis ir pan., tada fan turėtų būti verčiama džiovintuvas, aušintuvas ir pan. atitikmenimis. Tie žodžiai, pagal kuriuos sprendžiama, kurį analizuojamo žodžio atitikmenį parinkti, dažniausiai būna nuo jo nutolę, todėl neužtenka analizuoti vieną sakinį, reikalinga platesnio konteksto analizė. MV tyrinėtojai įspėja, kad jeigu tekstas priskiriamas ne tai temai, kuria parašytas, vertimo kokybė gali būti netgi blogesnė nei tuo atveju, jei nenustatoma verčiamo teksto tema (Thurmair 2006). Kad pagerėtų mašininis vertimas, reikalingas nuolatinis testavimas, t. y. būina nuolatos analizuoti vertimo klaidas ir jas taisyti keisti žodyno atitikmenis, įtraukti naujų žodžių, naujų taisyklių ir kitais būdais. Kaip matyti iš šios apžvalgos, galimybės tobulinti MV yra labai didelės, galima sakyti, neribotos. MV apima kelis kalbos kompiuterizavimo lygmenis, todėl patobulinus, pvz., sintaksinę ar semantinę analizę, galima gerokai pagerinti ir MV kokybę. Bet kurios MV sistemos sėkmė ir populiarumas priklauso nuo to, kiek ta sistema yra tobulinama, kokių papildomų funkcijų įdiegiama. Negalima palikti MV sistemos tokios, kokia ji yra, ją reikia nuolat, kad ir nežymiai, tobulinti. Vietoj išvadų. Straipsnių ciklą apie MV pradėjome straipsniu Mašininis vertimas greitoji pagalba globalėjančiam pasauliui. Dabar vėl norėtume grįžti prie šio teiginio. Gyvename globaliame pasaulyje, kuriame vis didėja tarpkultūrinės komunikacijos svarba, todėl neužtenka tik anglųlietuvių kalbų mašininio vertimo; reikia kurti ir kitų kalbų porų MV sistemas. Vienas iš svarbiausių laukiančių darbų sukurti lietuviųanglų kalbų MV sistemą. Kad jos reikia, galima spręsti iš anglųlietuvių kalbų MV sistemos vartotojų komentarų. MV sukūrimas, kaip žinia, yra vienas sudėtingiausių kalbos kompiuterizavimo etapų: norint pasiekti gerų vertimo rezultatų reikia automatiškai apdoroti kalbą keliais lygmenimis morfologiniu, sintaksiniu, semantiniu (apie tai rašyta 1-oje ciklo dalyje, žr. GK 2007, nr. 9). Ypač tai taikoma kalbai, iš kurios verčiama, taigi galimybė kurti lietuviųanglų kalbų MV sistemą yra kartu ir galimybė paspartinti lietuvių kalbos kompiuterizavimą, o tai būtų didelis iššūkis ir didelė galimybė lietuvių kalbai. Kaip jau rašyta, pagrindinė MV paskirtis apdoroti didelius vienodos informacijos kiekius, pavyzdžiui, instrukcijas. Čia MV idealus pagalbininkas. Bet kad ir kiek jis būtų tobulinamas, aišku, kad literatūros tekstai niekada nebus verčiami automatiškai, todėl nereikia turėti nepagrįstų lūkesčių. Diskutuodami dėl MV vietos ir paskirties vertimo rinkoje, MV tyrėjai pabrėžia, kad MV yra pranašesnis už aukštos kokybės vertimą tada, kai teksto vertimą reikia atlikti greitai, perteikiant tik esminius turinio elementus. Visuose ciklo straipsniuose nurodyta daug MV klaidų, netikslumų, bet pabaigti norėtume keletu (nors jų yra ir daugiau!) sėkmingų MV pavyzdžių: The former president is more affable than his wife, says former Iowa attorney general Bonnie Campbell, a longtime Clinton family friend. Ankstesnis prezidentas yra mielesnis negu jo žmona, sako ankstesnis/buvęs Ajovos generalinis atornėjus Bonnie Campbell, senas Clinton šeimos draugas.
The EU can contribute to this development by abolishing the Euratom Treaty and introducing a new treaty on renewable energy resources. Europos Sąjunga gali prisidėti prie šio išsivystymo, panaikindama Euratom Sutartį ir įvesdama naują sutartį dėl atnaujinamų energijos išteklių.
LITERATŪRA
Daudaravičius V. 2006, Pradia į begalybę. Maininis vertimas ir lietuvių kalba: Darbai ir Dienos, Nr. 45, 718. Estrella P., Hamon O, Popescu-Belis A. 2007, How Much Data is Needed for Reliable MT Evaluation? Using Bootstrapping to Study Human and Automatic Metrics: Machine Translation Summit XI. Copenhagen, September 1014, 2007, 167174. Gaspari F. Hutchins J. Online and Free! Ten Years of Online Machine Translation: Origins, Developments, Current Use and Future Prospects, Machine Translation Summit XI. Copenhagen, September 1014, 2007, 199207. Koeling R., Kilgarriff A., Tugwell D., Evans R. 2003, An evalution of a lexicographers workbench: building lexicons for machine translation: 7th EAMT Workshop Improving machine translation through other language technology tools, 13 April 2003, Budapest, Hungary, pp. 9-16 (http://www.mt-archive.info). Korhonen A., 2006, Current trends and future challenges in computational linguistic research on multiword expressions: Conference Collocations and idioms 2006: linguistic, computational, and psycholinguistic perspectives. November 2-4, Berlin (http://kollokationen.bbaw.de/doc/CI06-Korhonen-MWE.pdf). Marrafa P., Ribeiro A. 2001, Quantitative Evaluation of Machine Translation Systems: Sentence Level, MT Summit VIII, Spain, Santiago de Compostela, 1822 September 2001, (http://www.eamt.org/summitVIII/papers/marrafa.pdf) Rimkutė E., Kovalevskaitė J. 2007, Linguistic evaluation of the first English-Lithuanian machine translation system: tarpautinės konferencijos The Third Baltic Conference on Human Language Technologies 2007 praneimų mediaga (atiduota spausdinti). Thurmair G. 2006, Using corpus information to improve MT quality: LREC-2006: Fifth International Conference on Language Resources and Evaluatiojn. Third International Workshop on Language Resources for Translation Work, Research & Training, Genoa, Italy, 28 March 2006, pp. 45-48 (http://www.mt-archive.info/LREC-2006-Thurmair.pdf). Utka A. 2004, Statistinis tekstų funkcijų nustatymas: daktaro disertacija. Vytauto Didiojo universitetas. Vaičiūnas A. 2006, Lietuvių kalbos statistinių modelių ir jų taikymo nekos atpainimui tyrimas, kai naudojami labai dideli odynai: daktaro disertacija. Vytauto Didiojo universitetas.
|