Mitme-domeenne tehisnärvivõrkudel põhinev masintõlge

dc.contributor.advisorMark Fišel
dc.contributor.advisorPhD
dc.contributor.authorTars, Sander
dc.date.accessioned2019-10-15T09:26:38Z
dc.date.available2019-10-15T09:26:38Z
dc.date.issued2018
dc.description.abstractKäesolev magistritöö kätkeb endas neurotõlke lähenemist, mis toetabmitme-domeenseid tekste ja võimaldab tõlkimisel arvestada domeenide eripära. Antud lähenemine lähtub põhimõttest, et me käsitleme domeene kui eraldiseisvaid keeli, ning kasutame nende tõlkimiseks mitmekeelse neurotõlke meetodeid. Samuti näitame et mainitud lähenemise tulemusena tõlkekvaliteedi hinnang paraneb märgatavalt. Käesolevas töös pakume välja ka lähenemise domeenide automaatseks määramiseks ja uurime, kas eelnev domeenijaotuse info on üldse vajalik. Tuleb välja, et on, kuid kui sellist infot ei ole, on automaatset määramist kasutades võimalik samuti kõrge tõlkekvaliteedini jõuda, kohati isegi kõrgemani, kui eelnevat domeenijaotuse infot kasutades. Lisaks uurime selles töös, kas keelesisene stiilile kohandamine tühipauk (zero-shot) tõlke kaudu on võimalik. Näitame, et see lähenemine on võimeline stiilile kohanduma, kuid koos siiani lahenduseta kvaliteedilangusega.
dc.description.abstractIn this thesis we present an approach to neural machine translation (NMT) thatsupports multiple domains in a single model and allows switching between the domains when translating. The core idea is to treat text domains as distinct languages and use multilingual NMT methods to create multi-domain translation systems; we show that this approach results in significant translation quality gains over fine-tuning. We also propose approach of unsupervised domain assignment and explore whether the knowledge of pre-specified text domains is necessary; turns out that it is after all, but also that when it is not known quite high translation quality can be reached, and even higher than with known domains in some cases. Additionally, we explore the possibility of intra-language style adaptation through zero shot translation. We show that this approach is able to styleadapt, however, with unresolved text deterioration issues.
dc.identifier.urihttp://hdl.handle.net/10062/66159
dc.language.isoen
dc.titleMitme-domeenne tehisnärvivõrkudel põhinev masintõlge
dc.title.alternativeMulti-Domain Neural Machine Translation
dc.typeThesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
thesis.pdf
Size:
2.35 MB
Format:
Adobe Portable Document Format