Sirvi Autor "Sirts, Kairit" järgi
Nüüd näidatakse 1 - 10 10
- Tulemused lehekülje kohta
- Sorteerimisvalikud
Kirje Comparison of Current Approaches to Lemmatization: A Case Study in Estonian(University of Tartu Library, 2023-05) Dorkin, Aleksei; Sirts, KairitKirje Depressiooni ja ärevuse automaatne tuvastamine spontaansest kirjalikust keelest: andmete kogumise pilootuuring(Tartu Ülikool, 2019) Sirts, Kairit; Akkermann, Kirsti, juhendaja; Tartu Ülikool. Sotsiaalteaduste valdkond; Tartu Ülikool. Psühholoogia instituutUurimistöö eesmärgiks oli välja töötada meetod tekstilise andmestiku kogumiseks, mille alusel saaks hiljem arendada masinõppel põhinevaid meetodeid depressiooni ja ärevuse riski automaatseks hindamiseks. Töö käigus koostati ankeet, mille abil koguti tekstilist materjali ligi 300-st vabatahtlikust koosnevalt mugavusvalimilt. Kogutud tekstid sisaldasid nii etteantud pildi kirjeldust kui ka vabalt valitud sündmuse või mälestuse kirjeldust. Valimis osalenute emotsionaalset seisundit mõõdeti EEK-2 skriiningtesti abil. Ligi 42% isikutest ületas depressiooni ning ligi 30% isikutest ärevuse alaskaala riskilävendi. Esialgsed eksperimendid masinõppe mudelitega, mis püüdsid ennustada, kas inimese EEK-2 skoor ületab depressiooni ja/või ärevuse riskilävendi, edukaid tulemusi ei andnud. Kokkuvõttes tundub, et etteantud pildi kirjeldamine ei ole sobivaim viis soovitud andmestiku kogumiseks ja pigem peaks kasutama selliseid kirjutamise ülesandeid, mis oleks inimese endaga rohkem seotud.Kirje EstBERT: A Pretrained Language-Specific BERT for Estonian(Reykjavik, Iceland (Online), Linköping University Electronic Press, Sweden, pp. 11--19, 2021) Tanvir, Hasan; Kittask, Claudia; Eiche, Sandra; Sirts, Kairit; Dobnik, Simon; Øvrelid, LiljaKirje Estonian Named Entity Recognition: New Datasets and Models(Tartu Ülikool, 2023-05-23) Sirts, KairitKirje Estonian Named Entity Recognition: New Datasets and Models(University of Tartu Library, 2023-05) Sirts, KairitKirje GliLem: Leveraging GliNER for Contextualized Lemmatization in Estonian(University of Tartu Library, 2025-03) Dorkin, Aleksei; Sirts, Kairit; Johansson, Richard; Stymne, SaraWe present GliLem—a novel hybrid lemmatization system for Estonian that enhances the highly accurate rule-based morphological analyzer Vabamorf with an external disambiguation module based on GliNER—an open vocabulary NER model that is able to match text spans with text labels in natural language. We leverage the flexibility of a pre-trained GliNER model to improve the lemmatization accuracy of Vabamorf by 10% compared to its original disambiguation module and achieve an improvement over the token classification-based baseline. To measure the impact of improvements in lemmatization accuracy on the information retrieval downstream task, we first created an information retrieval dataset for Estonian by automatically translating the DBpedia-Entity dataset from English. We benchmark several token normalization approaches, including lemmatization, on the created dataset using the BM25 algorithm. We observe a substantial improvement in IR metrics when using lemmatization over simplistic stemming. The benefits of improving lemma disambiguation accuracy manifest in small but consistent improvement in the IR recall measure, especially in the setting of high k.Kirje Keeletehnoloogia areng ja eestikeelne tehisintellekt: Kust tuleme ja kuhu liigume?(Tartu Ülikooli raamatukogu, 2025) Sirts, KairitKirje Linear Ensembles of Word Embedding Models(Gothenburg, Sweden, Association for Computational Linguistics, pp. 96--104, 2017) Muromägi, Avo; Sirts, Kairit; Laur, Sven; Tiedemann, Jörg; Tahmasebi, NinaKirje Psühhoosiriski varajase tuvastamise instrumendi ERIraos valideerimine Eesti valimis(2022) Sirts, Kairit; Haring, Liina; Anni, Kätlin; Tartu Ülikool. Psühholoogia instituut; Tartu Ülikool. Sotsiaalteaduste valdkondKirje Using Machine Learning to Measure Digital Audiences(Tartu Ülikool, 2024) Mison, Nathan; Badia, Josep; Sirts, Kairit; Tartu Ülikool. Loodus- ja täppisteaduste valdkond; Tartu Ülikool. TehnoloogiainstituutIn recent years, the field of machine learning has witnessed an unprecedented surge in interest and application across diverse domains. Kantar Media, a leader in audience measurement, aims to apply machine learning to refine and revolutionize audience measurement techniques. This thesis demonstrates the application of recurrent neural networks and attention mechanisms. Despite existing solutions in audience measurement, they exhibit limitations in comprehensively addressing outlier data. The approach demonstrates that leveraging deep learning yields a remarkable test accuracy of 97 percent. However, it is also noted that certain outliers present persistent predictive challenges.