Lidhja e entiteteve në tekste shqip me baza njohurishë

Temë masteri në programin e studimit Master i Shkencave në Informatikë, F.SH.N., U.T.

Studenti: Sonila Mato

Abstrakt

Lidhja e entiteteve (entity linking) ka të bëjë me lidhjen e entiteve të emëruara (njerëz, vende, etj.) në një dokument tekstual me zëra në një bazë njohurishë. P.sh. në fjalinë “Dortmund ka deklaruar që Bartra do të nënshkruajë një kontratë 4 vjeçare kur të mbërrijë.”, fjala Dortmund i referohet skuadrës së futbollit Borussia Dortmund dhe duhet të lidhet me faqen përkatëse në Wikipedia (ose zërin në DBPedia). Lidhja e kësaj fjale me qytetin gjerman Dortmund do të krijonte gabime në aktivitete nxjerrje informacioni. Në këtë tezë duhet të shqyrtohen baza njohurishë ekzistuese (p.sh. DBPedia, Yago) për sa i përket lehtësisë së aksesit në informacion, kërkesave për informacion, aftësitë lidhëse si dhe disponueshmërinë e entiteteve shqip në to. Studenti duhet të hulumtojë mbi qasje të lidhjes së entiteve të raportuara në literaturë dhe të ndërtojë një prototip softuerik që lidh entitetet në tekste shqip me zëra në një bazë njohurishë. Ndërfaqja e përdoruesit e këtij prototipi duhet të vizualizojë informacionin e gjetur në bazën/at e njohurive në lidhje me entitetet e identifikuara.