Ajaväljendite tuvastamine eestikeelses tekstis
dc.contributor.advisor | Treumuth, Margus | et |
dc.contributor.author | Orasmaa, Siim | et |
dc.contributor.other | Tartu Ülikool. Matemaatika-informaatikateaduskond | et |
dc.contributor.other | Tartu Ülikool. Arvutiteaduse instituut | et |
dc.date.accessioned | 2013-09-09T09:44:16Z | |
dc.date.available | 2013-09-09T09:44:16Z | |
dc.date.issued | 2010 | et |
dc.description.abstract | Käesoleva töö eesmärgiks oli luua eesti keele ajaväljendite tuvastaja: programm, mis leiab loomuliku keele tekstist üles ajaväljendid ning esitab leitud väljendite semantika formaliseeritud kujul. Süsteem on ülesehituselt reeglipõhine ning toetub automaatse morfoloogilise analüüsi ja ühestamise tulemustele. Reeglite koostamisel lähtuti eeskätt ajaväljendite kasutusest ajakirjandustekstides. Antud töö teoreetilises osas kirjeldati erinevaid ajaväljendite liigitusaluseid ning tutvustati ajaväljendite märgendamiseks kasutatavaid keeli. Samuti käsitleti erinevaid lähenemisi, mida on kasutatud teistes keeltes ajaväljendite tuvastajate loomisel. Töö tuuma moodustab praktiline osa, milles arendati edasi autori bakalaureusetöös alustatud ajaväljendite tuvastajat. Testimisel leiti, et loodud süsteemi juures oli kõige problemaatilisem ajaväljendite eraldamise suhteliselt madal saagis (arenduskorpusel 84%, tundmatul tekstil 75,3%), ajaväljendite eraldamise täpsus oli aga suhteliselt kõrge (mõlemal korpusel ~98%). Ajaväljendite semantika normaliseerimise tulemused olid võrreldavad teiste keelte jaoks loodud süsteemide tulemustega: arenduskorpusel mõõdeti saagiseks ja täpsuseks ~86%, testkorpusel olid saagis ja täpsus ~91%. | et |
dc.description.abstract | et | |
dc.identifier.uri | http://hdl.handle.net/10062/33015 | |
dc.language.iso | et | et |
dc.publisher | Tartu Ülikool | et |
dc.subject.other | magistritööd | et |
dc.subject.other | informaatika | et |
dc.subject.other | infotehnoloogia | et |
dc.subject.other | informatics | en |
dc.subject.other | infotechnology | en |
dc.title | Ajaväljendite tuvastamine eestikeelses tekstis | et |
dc.title.alternative | Resolution of Estonian Temporal Expressions | et |
dc.type | Thesis | et |