Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmine
dc.contributor.advisor | Aasmets, Oliver, juhendaja | |
dc.contributor.advisor | Fischer, Krista, juhendaja | |
dc.contributor.author | Sõnajalg, Hanna | |
dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
dc.contributor.other | Tartu Ülikool. Matemaatika ja statistika instituut | et |
dc.date.accessioned | 2024-06-28T13:30:25Z | |
dc.date.available | 2024-06-28T13:30:25Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Argumenttunnuste valik on mudeli konstrueerimisel üks olulisemaid ülesandeid. Meetodid nagu samm- ja lassoregressioon tagastavad ühe komplekti tunnustest, millega saavutatakse kõige paremini prognoosiv mudel. Kui andmetes esineb palju tugevalt korreleeritud tunnuseid, võib mitu tunnuste komplekti anda sarnase prognoosimisvõimega mudeleid. Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmise (inglise keeles statistically equivalent signatures ehk SES) algoritm rakendab tunnuste valikuks korduvalt tingliku sõltumatuse teste. Lõpuks tagastatakse omavahel ekvivalentsete tunnuste kogumid. Valides igast kogumist täpselt ühe tunnuse, jõutakse erinevate mudeliteni, mis võiksid anda sarnase täpsusega hinnanguid. Magistritöö eesmärk on testida algoritmi Eesti geenivaramu andmetel, kuhu kuuluvad geenidoonorite vere metaboliidi kontsentratsioonid ning metaboliitide kontsentratsioonide suhete väärtused. Lineaarse regressioonimudeli abil prognoositakse kehamassiindeksit ja logistilise regressioonimudeli abil suremust 5 aasta jooksul. | et |
dc.identifier.uri | https://hdl.handle.net/10062/100428 | |
dc.language.iso | et | |
dc.publisher | Tartu Ülikool | et |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Estonia | en |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/ee/ | |
dc.subject | masinõpe | et |
dc.subject | statistiliselt ekvivalentsed mudelid | et |
dc.subject | argumenttunnuste valik | et |
dc.subject | machine learning | en |
dc.subject | statistically equivalent signatures | en |
dc.subject | feature selection | en |
dc.subject.other | magistritööd | et |
dc.subject.other | võrguväljaanded | et |
dc.title | Statistiliselt ekvivalentsete argumenttunnuste kogumite leidmine | et |
dc.type | Thesis |
Failid
Originaal pakett
1 - 1 1
Laen...
- Nimi:
- hanna_sonajalg_msc_2024.pdf
- Suurus:
- 1.28 MB
- Formaat:
- Adobe Portable Document Format