Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmine

dc.contributor.advisorAasmets, Oliver, juhendaja
dc.contributor.advisorFischer, Krista, juhendaja
dc.contributor.authorSõnajalg, Hanna
dc.contributor.otherTartu Ülikool. Loodus- ja täppisteaduste valdkondet
dc.contributor.otherTartu Ülikool. Matemaatika ja statistika instituutet
dc.date.accessioned2024-06-28T13:30:25Z
dc.date.available2024-06-28T13:30:25Z
dc.date.issued2024
dc.description.abstractArgumenttunnuste valik on mudeli konstrueerimisel üks olulisemaid ülesandeid. Meetodid nagu samm- ja lassoregressioon tagastavad ühe komplekti tunnustest, millega saavutatakse kõige paremini prognoosiv mudel. Kui andmetes esineb palju tugevalt korreleeritud tunnuseid, võib mitu tunnuste komplekti anda sarnase prognoosimisvõimega mudeleid. Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmise (inglise keeles statistically equivalent signatures ehk SES) algoritm rakendab tunnuste valikuks korduvalt tingliku sõltumatuse teste. Lõpuks tagastatakse omavahel ekvivalentsete tunnuste kogumid. Valides igast kogumist täpselt ühe tunnuse, jõutakse erinevate mudeliteni, mis võiksid anda sarnase täpsusega hinnanguid. Magistritöö eesmärk on testida algoritmi Eesti geenivaramu andmetel, kuhu kuuluvad geenidoonorite vere metaboliidi kontsentratsioonid ning metaboliitide kontsentratsioonide suhete väärtused. Lineaarse regressioonimudeli abil prognoositakse kehamassiindeksit ja logistilise regressioonimudeli abil suremust 5 aasta jooksul.et
dc.identifier.urihttps://hdl.handle.net/10062/100428
dc.language.isoet
dc.publisherTartu Ülikoolet
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Estoniaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/ee/
dc.subjectmasinõpeet
dc.subjectstatistiliselt ekvivalentsed mudelidet
dc.subjectargumenttunnuste valiket
dc.subjectmachine learningen
dc.subjectstatistically equivalent signaturesen
dc.subjectfeature selectionen
dc.subject.othermagistritöödet
dc.subject.othervõrguväljaandedet
dc.titleStatistiliselt ekvivalentsete argumenttunnuste kogumite leidmineet
dc.typeThesis

Failid

Originaal pakett

Nüüd näidatakse 1 - 1 1
Laen...
Pisipilt
Nimi:
hanna_sonajalg_msc_2024.pdf
Suurus:
1.28 MB
Formaat:
Adobe Portable Document Format