Browsing by Author "Fishel, Mark"

Now showing 1 - 7 of 7

Combining Statistical Machine Translation and Translation Memories with Domain Adaptation
(Oslo, Norway, Linköping University Electronic Press, Sweden, pp. 331--341, 2013) Läubli, Samuel; Fishel, Mark; Volk, Martin; Weibel, Manuela; Oepen, Stephan; Hagen, Kristin; Johannessen, Janne Bondi
Distilling Estonian Text Domains for Production-Oriented Machine Translation
(University of Tartu Library, 2023-05) Korotkova, Elizaveta; Fishel, Mark
Eesti-inglise statistilise masintõlke mudeli ümberpööramine inglise-eesti suunale
(Tartu Ülikool, 2012) Klanberg, Indrek; Fishel, Mark; Koit, Mare; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituut
Käesolevas töös on käsitletud statistilist masintõlget nii teoreetiliselt kui ka praktiliselt. Statistiline masintõlge on valdkond, mis üritab panna arvutit tõlkima, ilma et ta teaks midagi keelte ametliku grammatika kohta, vaid saab sisendiks ainult paralleelkorpuse ehk miljoneid lausepaare, kus üks paariline on teise paarilise tõlge. Praktilises pooles kasutati olemasolevat Mosese statistilise masintõlke raamistikku, et luua uus tõlkemudel inglise-eesti suunal. Lisaks pöörati ümber olemasolev eesti-inglise tõlkemudel, mis oli kaalutult kokku pandud erinevatest korpustest saadud mudelitest. Kogu töö käigus loodi 1 keelemudel, 2 fraasimudelit ja 2 ümberpaiknemismudelit. Teoreetiline osa oli referatiivne ning käsitles just neid fraasi-, keele- ja ümberpaiknemismudeli algoritme, mida me sisuliselt kasutasime töö praktilises osas. Täpsemalt käsitleti kahesuunalist leksikograafiliste kaaludega fraasimudelit, trigramm keelemudelit, mis kasutas silumiseks rekursiivset interpolatsiooni koos Witten-Belli meetodiga ning kahesuunalist msd (monotone, swap, discontinues ehk jääb paigale, vahetab, katkendlik) ümberpaiknemismudelit. Töö lõpus tõlgiti rohkem kui tuhandelauseline testkorpus ja hinnati saadud tulemust automaatse hindamismeetodiga BLEU. Lisaks vaadeldi tulemust lähemalt käsitsi. Kuigi paljud kerged laused tõlgiti peaaegu ideaalselt, siis keerulisemate lausetega hakkasid vähemalt osaliselt tekkima raskused. Suurim probleem oli konteksti mittemõistmine, sellele järgnesid käänamine ja lause ülesehitus. Töö väljundiks on valmiv statistilise masintõlke mudel inglise-eesti suunal ning teadmine, et antud valdkond on perspektiivikas. Töö on lisaks mõeldud inglise-eesti suunal statistilise masintõlke tegemise alustamiseks.
Estonian-English Statistical Machine Translation: the First Results
(2007-05-23T08:28:05Z) Fishel, Mark; Kaalep, Heiki-Jaan; Muischnek, Kadri
Estonian-English Statistical Machine Translation: the First Results
(Tartu, Estonia, University of Tartu, Estonia, pp. 278--283, 2007) Fishel, Mark; Kaalep, Heiki-Jaan; Muischnek, Kadri; Nivre, Joakim; Kaalep, Heiki-Jaan; Muischnek, Kadri; Koit, Mare
Voting and Stacking in Data-Driven Dependency Parsing
(2009-05-13T12:12:40Z) Fishel, Mark; Nivre, Joakim
Voting and Stacking in Data-Driven Dependency Parsing
(Odense, Denmark, Northern European Association for Language Technology (NEALT), pp. 219--222, 2009) Fishel, Mark; Nivre, Joakim; Jokinen, Kristiina; Bick, Eckhard