Browsing by Author "Fishel, Mark"
Now showing 1 - 7 of 7
- Results Per Page
- Sort Options
Item Combining Statistical Machine Translation and Translation Memories with Domain Adaptation(Oslo, Norway, Linköping University Electronic Press, Sweden, pp. 331--341, 2013) Läubli, Samuel; Fishel, Mark; Volk, Martin; Weibel, Manuela; Oepen, Stephan; Hagen, Kristin; Johannessen, Janne BondiItem Distilling Estonian Text Domains for Production-Oriented Machine Translation(University of Tartu Library, 2023-05) Korotkova, Elizaveta; Fishel, MarkItem Eesti-inglise statistilise masintõlke mudeli ümberpööramine inglise-eesti suunale(Tartu Ülikool, 2012) Klanberg, Indrek; Fishel, Mark; Koit, Mare; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutKäesolevas töös on käsitletud statistilist masintõlget nii teoreetiliselt kui ka praktiliselt. Statistiline masintõlge on valdkond, mis üritab panna arvutit tõlkima, ilma et ta teaks midagi keelte ametliku grammatika kohta, vaid saab sisendiks ainult paralleelkorpuse ehk miljoneid lausepaare, kus üks paariline on teise paarilise tõlge. Praktilises pooles kasutati olemasolevat Mosese statistilise masintõlke raamistikku, et luua uus tõlkemudel inglise-eesti suunal. Lisaks pöörati ümber olemasolev eesti-inglise tõlkemudel, mis oli kaalutult kokku pandud erinevatest korpustest saadud mudelitest. Kogu töö käigus loodi 1 keelemudel, 2 fraasimudelit ja 2 ümberpaiknemismudelit. Teoreetiline osa oli referatiivne ning käsitles just neid fraasi-, keele- ja ümberpaiknemismudeli algoritme, mida me sisuliselt kasutasime töö praktilises osas. Täpsemalt käsitleti kahesuunalist leksikograafiliste kaaludega fraasimudelit, trigramm keelemudelit, mis kasutas silumiseks rekursiivset interpolatsiooni koos Witten-Belli meetodiga ning kahesuunalist msd (monotone, swap, discontinues ehk jääb paigale, vahetab, katkendlik) ümberpaiknemismudelit. Töö lõpus tõlgiti rohkem kui tuhandelauseline testkorpus ja hinnati saadud tulemust automaatse hindamismeetodiga BLEU. Lisaks vaadeldi tulemust lähemalt käsitsi. Kuigi paljud kerged laused tõlgiti peaaegu ideaalselt, siis keerulisemate lausetega hakkasid vähemalt osaliselt tekkima raskused. Suurim probleem oli konteksti mittemõistmine, sellele järgnesid käänamine ja lause ülesehitus. Töö väljundiks on valmiv statistilise masintõlke mudel inglise-eesti suunal ning teadmine, et antud valdkond on perspektiivikas. Töö on lisaks mõeldud inglise-eesti suunal statistilise masintõlke tegemise alustamiseks.Item Estonian-English Statistical Machine Translation: the First Results(2007-05-23T08:28:05Z) Fishel, Mark; Kaalep, Heiki-Jaan; Muischnek, KadriItem Estonian-English Statistical Machine Translation: the First Results(Tartu, Estonia, University of Tartu, Estonia, pp. 278--283, 2007) Fishel, Mark; Kaalep, Heiki-Jaan; Muischnek, Kadri; Nivre, Joakim; Kaalep, Heiki-Jaan; Muischnek, Kadri; Koit, MareItem Voting and Stacking in Data-Driven Dependency Parsing(2009-05-13T12:12:40Z) Fishel, Mark; Nivre, JoakimItem Voting and Stacking in Data-Driven Dependency Parsing(Odense, Denmark, Northern European Association for Language Technology (NEALT), pp. 219--222, 2009) Fishel, Mark; Nivre, Joakim; Jokinen, Kristiina; Bick, Eckhard