Kuriama anglų – lietuvių automatinio vertimo sistema

Vytauto Didžiojo universitetas vykdo Europos Sąjungos struktūrinių fondų finansuojamą projektą ,,Internetinė informacijos vertimo priemonė”, kuriuo siekiama sukurti interaktyvias mašininio vertimo iš anglų į lietuvių kalbą priemones ir paleisti nemokamą mašininio interneto puslapių vertimo paslaugą. Šia paslauga galės naudotis įvairūs specialistai, kuriems vertimo įrankis padės gauti ir apdoroti daugiau informacijos mažesnėmis laiko ir pastangų sąnaudomis ir kiti Lietuvos ar kitų šalių gyventojai, nemokantys anglų kalbos ar turintys nepakankamus jos įgūdžius, todėl negalintys gauti informacijos iš internetinių puslapių anglų kalba.

Automatinio vertimo sistemai kurti svarbios dvi dalys – lingvistinių resursų ruošimas ir pritaikymas bei mašininio vertimo variklio kūrimas. Vytauto Didžiojo universitetas, įvykdęs atvirą tarptautinį konkursą, 2006 m. balandžio 19 d. pasirašė 1, 888 milijono litų sutartį su UAB ,,Neolitas” dėl Lingvistinių resursų rinkimo ir adaptavimo paslaugų. Šiuo metu UAB ,,Neolitas” jau yra įvykdžiusi 25 % darbų: parengusi didelę dalį specialių lietuvių ir anglų kalbų žodynų, sudariusi 25 % specialaus lietuvių kalbos stabiliųjų junginių žodyno, pradėjusi rengti sintaksinių lietuvių kalbos taisyklių rinkinius.

Mašininis vertimas reikalauja didelių elektroninių kalbinių išteklių, specializuotų duomenų bazių. Tokį projektą vykdyti leido VDU Kompiuterinės lingvistikos centro turėtas įdirbis tekstynų lingvistikos ir kompiuterinės lingvistikos srityse. ,,Internetinės informacijos vertimo projekto” rengimas užtruko beveik dvejus metus. Projektą rengė Lietuvos ir tarptautiniai ekspertai. Tai didžiausias lituanistikos projektas, kada nors vykdytas Lietuvoje. Pasak VDU Kompiuterinės lingvistikos centro vadovės, projekto ,,Internetinė informacijos vertimo priemonė” lingvistinių resursų specialistės, prof. Rūtos Marcinkevičienės ,,Mašininis vertimas yra pati sudėtingiausia iš visų informacinių kalbos technologijų, jos taikymas lietuvių kalbai suteiks daug naujų galimybių ir leis sumažinti technologinę jos atskirtį nuo kitų žymiai toliau šioje srityje pažengusių Europos kalbų”.

IIVP projekto vadovas Vaidas Repečka taip pat teigia, kad kuriama mašininio vertimo priemonė labai svarbi Lietuvos technologinei pažangai. ,,Paskutinį penkmetį, vystantis informacinėms technologijoms, itin pagreitėjo kompiuterių greitis, todėl atsirado galimybė išspręsti anksčiau dėl techninių galimybių ribotumo neišsprendžiamas problemas. Vystantis tekstinės informacijos analizės priemonėms, semantinėms technologijoms (praėjusiais metais W3C konsorciumas, koordinuojantis interneto plėtrą, patvirtino pagrindinius semantinio interneto standartus), tikėtina, kad tobulės ir kalbos technologijos. Tačiau Lietuvos atveju pirmiausiai reikia bent jau įsisavinti esamas technologijas, kurios buvo kuriamos apie 20 metų”, – teigia V. Repečka.

Pasaulyje mašininio vertimo sistemos buvo kuriamos nuo pat kompiuterių atsiradimo, tačiau ši užduotis pasirodė esanti daug sunkesnė ir ilgiau trunkanti negu tikėtasi, kadangi kompiuteriai negali suprasti jokios ekstralingvistinės informacijos, kuri lydi verčiamą tekstą – konteksto, vertėjo kalbos mokėjimo lygio, nuotaikos, specifinės dalykinės vertimo srities. Tačiau per daugiau nei 40 metų buvo atrinkti optimalūs algoritmai, o JAV, Prancūzijoje, Vokietijoje, Rusijoje įsikūrė mašininio vertimo gamintojai.

Šaltojo karo metais mašininis vertimas buvo viena iš specialiųjų tarnybų priemonių, padedančių greitai versti informaciją. Ir dabar mašininis vertimas daugiausiai naudojamas, kai vertimui nebūtina aukšta kokybė, tačiau itin svarbu greitai suprasti informaciją.

Šiuo metu kuriamas arabų, persų, kinų, indų kalbų mašininis vertimas. Lietuvoje dar nėra sukaupta pakaknakama mašininio vertimo sistemų kūrimo patirtis ir šiuo projektu siekiama mažinti šią technologinę atskirtį. Mašininio vertimo iš anglų į lietuvių kalbą paslaugos atsiradimas atvers naują lietuvių kalbos gyvavimo raidos etapą žinių amžiuje.

Nemokama viešoji elektroninė paslauga internete bus įdiegta iki 2007 m. gruodžio 31 d..

Šis įrašas buvo paskelbtas kategorijoje Informacinės technologijos su žyma , , , , , , .

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.