Browsing by Author "Vilo, Jaak"
Now showing 1 - 11 of 11
- Results Per Page
- Sort Options
Item Design of a framework to detect temporal clinical event trajectories from health data standardized to the OMOP CDM(2021-09-15) Künnapuu, Kadri; Ioannou, Solomon; Ligi, Kadri; Kolde, Raivo; Laur, Sven; Vilo, Jaak; Rijnbeek, Peter; Reisberg, SulevItem Estonian language technology Anno 2009(2009-05-12T12:46:09Z) Meister, Einar; Roosmaa, Tiit; Vilo, JaakItem Haiguste komorbiidsusanalüüs(2015) Mäesalu, Ants-Oskar; Vilo, JaakLühikokkuvõte: Personaalmeditsiin on uus lähenemine tervisekaitsele, milles tuuakse esile patsientide individuaalsus ja asetatakse rõhku haiguste ennetamisele nendest tekkinud tagajärgedele reageerimise asemel. Sealjuures võetakse arvesse võimalikult palju nii patsientide kui haiguste kohta teadaolevast ja ka muust meditsiinilisest teabest ning üritatakse nende vahel seoseid leida. Personaalmeditsiini üldeesmärgid on pakkuda tulevikus kõigile senisest lühema aja jooksul efektiivsemat ravi madalate kuludega. Käesoleva töö eesmärgiks on uurida haiguste komorbiidsust Eesti populatsioonis. Töös koostatakse Eesti E-tervise Sihtasutuse 2012.-2013. aasta epikriiside andmete põhjal kõigi sama patsiendi puhul koosesinevate RHK-10 registri haiguste paaride kohta 2x2 sõltuvustabelid. Haigustevahelist võimalikku seost hinnatakse Fisheri täpse testiga, filtreeritakse välja tugevamini assotsieeritud paarid ja visualiseeritakse tulemusi nn kuumuskaartide abil. Haiguste koosesinemise uurimine on eelduseks tulevases teadustöös haigusepisoodide kaevandamisele. Võtmesõnad: bioinformaatika, personaalmeditsiin, epidemioloogia, haiguste komorbiidsus, RHK 10, 2x2 sõltuvustabelid, Fisheri täpne testItem Hinnaelastsusel tuginev soovitussüsteem(2016) Pajula, Gea; Teinemaa, Irene; Vilo, JaakSoovitussüsteeme on palju uuritud ja edukalt rakendatud paljudes valdkondades, et suurendada läbimüüki tehes klienditele asjakohaseid soovitusi. Käesoleva magistritöö eesmärgiks on välja töötada uudne soovitussüsteem, mis teeb klientidele personaalseid pakkumisi toote soodushinna huvipakkuvuse põhjal. Seda saab rakendada olukordades, kus soovitusi tehakse allahinnatud toodete seast. Näiteks valides kampaaniatooteid kliendile saadetavasse personaalsesse uudiskirja. Me kaasame tootepõhise kaasfiltreerimise algoritmi täiendusena majanduse valdkonnas kasutatavat nõudluse hinnaelastsust, et võtta arvesse, et tootel on kampaaniaperioodil tavapärasest madalam hind. Hinnates mudeli abil omaelastsuse väärtuse, saame kliendi tootereitingu, mis näitab, kuidas hinna muutumine mõjutab ostetavat kogust. Toodete sarnasuste leidmiseks kasutame ristelastsust, mis liigitab tooted asendus- ja täiendkaupadeks. Selle suuruse leidmine ei nõua tihti esinevat kaugusmõõtude tingimust, et kaks toodet peavad olema ostetud samade klientide poolt. Kirjeldatud soovitussüsteem on rakendatud reaalelulistele supermarketi tehingute andmetele. Süsteemi headuse testimiseks kasutame kahte kampaaniaperioodi, mille allahinnatuid tooteid kasutame võimalike soovitustena. Me saavutame märgatavalt paremad tulemused kasutades ainult kampaaniatoote elastsusi ja mitte asendustoodete vastavaid väärtusi. Kaasates ainult kliendid, kellele leidsime vähemalt 5 pakkumist, saavutame tunduvalt paremad tulemused. Täpsemalt, tehes neile klientidele 12 soovitust (vähem kui 1% kampaaniatoodete arvust), tabame kõik klientide kampaaniatoodete ostud. Parima meetodi korral saavutame kordustäpsuse 0,24, mis on üle 10 korra parem võrreldes meetodiga, mida ettevõte hetkel kasutab, kus soovitused on manuaalselt valitud kliendi segmentide omaduste põhjal. Supermarketi kett on kinnitanud oma soovi, et esitletud meetodit testida, seega antud soovitussüsteemi rakendatakse reaalselt klientidele huvipakkuvate soovituste tegemiseks.Item Klasteranalüüsi meetodite uurimine visuaalsete andmete abil(2015) Danelson, Priit; Vilo, JaakKlasteranalüüs on laia kasutusvaldkonnaga andmeanalüüsi tehnika, mille rakendamiseks on olemas mitu erinevat algoritmi. Käesoleva töö eesmärk on anda ülevaade kolme levinuma klasteranalüüsi meetodi tööpõhimõtetest ja eripäradest, rakendades hierarhilise klasterda-mise, k-keskmiste klasterdamise ja Kohoneni võrgu algoritme näidisandmestiku peal. Li-saks algoritmide tööpõhimõtetele on kirjeldatud ka põhjus, miks näidisandmestikuks on valitud visuaalsed andmed ehk pildid ning kuidas on implementeeritud klasteranalüüsi meetodite rakendamiseks kasutatav skript. Töö sisaldab ka skripti rakendamisel saadud klasterduste analüüsi.Item Klasterduspõhine motiiviotsing lühikestel peptiididel(2015) Kruup, Mari-Liis; Kull, Meelis; Vilo, JaakUute sekveneerimistehnoloogiate abil genereeritakse palju erineva taustaga bioloogilisi andmeid. Olulise info leidmiseks tuleb neid andmeid analüüsida. Antud töös koostame meetodi, mis suudab tuvastada motiive suurest hulgast lühikestest aminohapete järjestustest ehk peptiididest, mis sisaldavad infot konkreetse inimese organismis olevate antikehade kohta. On alust arvata, et leitud motiivide abil võib olla võimalik tuvastada, milliseid haiguseid inimene on põdenud. Kuna ükski uuritud olemasolevatest tööriistadest selle probleemi lahendamiseks ei sobinud, koostasime motiivide tuvastamiseks uue meetodi. Meetodi esimene osa, sarnaste peptiidigruppide tuvastamine, põhineb hierarhilisel klasterdamisel ning sisaldab kahte erinevat võimalust hierarhilise klasterduse puust automaatselt klastrite eraldamiseks. Meetodi teine osa on sarnaste peptiidide klastritest motiivide tuvastamine. Kuna pärisandmetes olevad motiivid ei ole teada, genereerisime sünteetilised andmed, mille peal koostatud meetodit valideerida. Koostatud meetod suutis vastavalt sünteetiliste andmete omadustele tuvastada 50% kuni 100% sinna sisestatud motiividest, pärisandmetele eeldatavalt kõige sarnasema andmestiku peal 86%. Motiivide lugemise meetod töötas samamoodi hästi, etteantud mürata klastrite pealt suudetakse tuvastada 100% motiividest ning müraga klastrite pealt 90% motiividest. Koostatud meetodit on võimalik rakendada ka teistest bioloogilistest andmetest motiivide otsimiseks. Sel juhul peaks muutma teatud parameetreid, mis selles töös kasutatava andmestiku jaoks on seatud. Edaspidiseks tööks võiks olla meetodi töötamise valideerimine teiste omadustega andmete peal.Item Lineaarne mudel geeni ekspressiooni andmete analüüsi jaoks(Tartu Ülikool, 2005) Tretjakov, Konstantin; Vilo, Jaak; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutThe thesis proposes a novel method for the analysis of microarray data based on fitting a specific linear model that combines microarray data with DNA sequence information. The model is both descriptive and predictive: its coefficients provide insight into the structure of the genetic regulatory networks, and its predictive performance may be used to find a set of genes that play important role in transcription regulation (transcription factors). An efficient algorithm is proposed for calculating the least-squares fit for the parameters of the model. The proposed method is tested on a synthetic dataset and the results indicate that the approach is capable of detecting interesting relations in the data.Item Masinõpe k-ritta mängude õppimiseks(Tartu Ülikool, 2012) Loos, Aleksei; Vilo, Jaak; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutAntud töö põhieesmärgiks oli uurida kui efektiivne ja mõistlik on kombineerida mitu erinevat masinõppe meetodit, et treenida tehisintellekti k-ritta tüüpi mängudele. Need meetodid on järgnevad: geneetiline algoritm, juhumetsad (koos otsustuspuudega) ning Minimax algoritm. Eriliseks teeb sellise meetodi asjaolu, et kogu intelligents treenitakse ilma inimese ekspert teadmisteta ning kõik vajaliku informatsiooni peab arvuti ise endale omandama.Item Paralleelne Mustriotsing(Tartu Ülikool, 2013) Elbre, Egon; Vilo, Jaak; Tartu Ülikool. Matemaatika-informaatikateaduskond; Tartu Ülikool. Arvutiteaduse instituutÜks huvitav uurimisprobleem andmete analüüsimisel on mustriotsing. Mustrid võivad näidata kuidas andmed on tekkinud ja kuidas ta ennast kordab. Andmete mahu kiire kasvamise tõttu on vajadus algoritmidele, mis skaleeruvad mitmele protsessile. Selles töös me uurime kuidas paralleliseerida olemasolevat algoritmi kasutades kolme ideed: üldistamine, liigendamine ja reifitseerimine. Me rakendame neid ideid SPEXS-il, mustriotsingu algoritm, ning tuletame paralleelse algoritmi SPEXS2, mille me ka implementeerime. Lisaks me uurime probleeme, mis tekkisid selle algoritmi implementeerimisel. Selles töös tutvustatud ideid saab kasutada teiste algoritmide üldistamisel ning paralleliseerimisel.Item Tarkvara loomine erinevate k-keskmiste algoritmide rakendamiseks(2016) Puura, Joonas; Vilo, JaakKlasteranalüüsis on laialt levinud k-keskmiste meetod, mis võimaldab andmeid grupeerida nende tunnuste järgi, seejuures minimeerides ruutvigade summat klastrites olevate andmeobjektide ja vastava klastri keskpunktide vahel. Kuna k-keskmiste meetodi kui optimeerimisülesandele täpse lahenduse leidmine on NP-raske, siis on probleemi lahendamiseks võetud kasutusele mitmeid lähendeid otsivaid algoritme. Bakalaureusetöö eesmärgina valmis rakendus, mis lubab kasutada viit k-keskmiste klasterdusalgoritmi ja nelja algsete keskpunktide valimise meetodit. Kasutades nii reaalelulisi kui ka sünteetilisi andmestikke antakse ülevaade rakenduses implementeeritud algoritmide jõudlusest, mälukasutusest ja edukusest leida hea lähend k-keskmiste optimeerimisülesandele.Item Veebipõhine lahendus imputeeritud andmete põhjal geneetiliste riskiskooride arvutamiseks(2016) Metsalu, Kristjan; Vilo, Jaak; Mägi, Reedik; Iljashenko, TatjanaViimastel aastatel on genotüpiseerimise hinna langus teinud võimalikuks geneetilise informatsiooni lisamise tervishoiusüsteemi. Eesti on üks vähestest riikidest, kellel on võimekus muuta see informatsioon arstide jaoks igapäevaseks tööriistaks, kes saaksid seeläbi teha paremini informeeritud otsuseid oma patsientide kohta. Tartu Ülikooli Eesti Geenivaramu (EGV) on üks asutustest, kes töötavad geneetilise info põhjal uute haigusriskide ennustamise mudelite kallal. Teadustöö EGV-s on loonud erinevaid mudeleid polügeensete haiguste riskide hindamiseks. Selle magistritöö käigus esitame tarkvara, mis võimaldab ennustusmudelite kiiremat väljatöötamist ja arenduse käigus tehtud katsetusi.