A Recommender System for Improved Data Findability in Open Government Data Portals
dc.contributor.advisor | Nikiforova, Anastasija, juhendaja | |
dc.contributor.advisor | Symeonidis, Dimitrios, juhendaja | |
dc.contributor.author | Huseynov, Ramil | |
dc.contributor.other | Tartu Ülikool. Loodus- ja täppisteaduste valdkond | et |
dc.contributor.other | Tartu Ülikool. Arvutiteaduse instituut | et |
dc.date.accessioned | 2025-02-13T12:35:26Z | |
dc.date.available | 2025-02-13T12:35:26Z | |
dc.date.issued | 2025 | |
dc.description.abstract | Despite the large amount of data available through OGD (Open Government Data) portals, most of it remains “dark data” which means it is not being used. A significant factor contributing to it can be the usability challenges such poor data findability and discoverability associated with these portals. One of the ways to contribute to the solution of these challenges is a recommendation system that can suggest related datasets. Unlike other domains, the recommendation system in the OGD portals is special as it can’t rely on user profile as most OGD portals don’t require authentication. Moreover, this recommendation method should be adaptable to the diverse structures of these portals. Finally, existing recommendation systems for OGD portals mostly focus on tags/category recommendations not datasets recommendations or fail to capture the semantic meaning of dataset’s metadata when making recommendations. This study focuses on these challenges by proposing a new datasets recommendation method based on dataset’s metadata that can capture its semantic meaning without relying on user’s profile and compatible with wider range of OGD portals. To capture the semantic relations between dataset’s metadata the proposed recommendation system relies on pretrained Word2Vec model. Additionally, the prototype of the proposed recommendation system was implemented for the usability testing and feedback was collected and analyzed. | |
dc.description.abstract | Vaatamata OGD (Open Government Data) portaalide kaudu saadaolevale suurele hulgale andmetele jääb suurem osa neist "tumedateks andmeteks", mis tähendab, et neid ei kasutata. Selle oluliseks teguriks võivad olla nende portaalidega seotud kasutatavuse probleemid, näiteks halb andmete leitavus ja leitavus. Üks võimalus nende väljakutsete lahendamisele kaasa aidata on soovitussüsteem, mis võib soovitada seotud andmekogumeid. Erinevalt teistest domeenidest on OGD-portaalide soovitussüsteem eriline, kuna see ei saa tugineda kasutajaprofiilile, kuna enamik OGD-portaale ei vaja autentimist. Lisaks peaks see soovitusmeetod olema kohandatav nende portaalide erinevatele struktuuridele. Lõpuks keskenduvad OGD-portaalide olemasolevad soovitussüsteemid enamasti siltidele/kategooriasoovitustele, mitte andmekogumisoovitustele või ei suuda soovituste tegemisel tabada andmestiku metaandmete semantilist tähendust. See uuring keskendub nendele väljakutsetele, pakkudes välja uue andmekogumite soovitusmeetodi, mis põhineb andmekogumi metaandmetel, mis suudab tabada selle semantilist tähendust ilma kasutaja profiilile tuginemata ja ühildub laiema hulga OGD-portaalidega. Andmestiku metaandmete vaheliste semantiliste seoste tabamiseks tugineb pakutud soovitussüsteem eelnevalt väljaõpetatud Word2Vec mudelile. Lisaks rakendati kasutatavuse testimiseks pakutud soovitussüsteemi prototüüpi ning koguti ja analüüsiti tagasisidet. | |
dc.identifier.other | P170 | |
dc.identifier.uri | https://hdl.handle.net/10062/107095 | |
dc.language.iso | en | |
dc.publisher | Tartu Ülikool | et |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | open data | |
dc.subject | open government data | |
dc.subject | recommendation system | |
dc.subject.other | magistritööd | et |
dc.subject.other | informaatika | et |
dc.subject.other | infotehnoloogia | et |
dc.subject.other | informatics | en |
dc.subject.other | infotechnology | en |
dc.title | A Recommender System for Improved Data Findability in Open Government Data Portals | |
dc.title.alternative | Soovitussüsteem andmete parema leitavuse parandamiseks avatud valitsuse andmeportaalides | |
dc.type | Thesis | en |
Failid
Originaal pakett
1 - 1 1
Laen...
- Nimi:
- Huseynov_SoftwareEngineering_2025.pdf
- Suurus:
- 1.42 MB
- Formaat:
- Adobe Portable Document Format