Sigurimi i cilësisë në krijimin e dataseteve trajnuese të algoritmeve machine learning.

Temë masteri në programin e studimit Master i Shkencave në Teknologji Informacioni, F.SH.N., U.T.

Studenti: Ardit Memia

Abstrakt

Algoritmet machine learning në shumë raste varen nga trajnimi i tyre me të dhëna të etiketuara nga njerëzit. P.sh. dallimi i objekteve të ndryshme në imazhe, identifikimi i lajmeve të rreme, identifikimi i emrave të përveçëm në tekste, etj. Duke qenë se etiketimet shpesh kryhen nga “jo ekspertë”, ose thjesht prej faktit të vështirësisë së procesit, nuk është e pazakontë prezenca e gabimeve në to.

Në këtë punim do ndërtohet një prototip softuerik që lejon krijimin e një dataseti trajnues për algoritme të tillë që mban nën kontroll cilësinë e etiketimit. Duhet të shqyrtohet literatura në lidhje me teknika të ndryshme për të arritur këtë si dhe të eksperimentohet konkretisht me to. Prototipi duhet të testohet me disa sesione konkrete etiketimi dhe në punim duhet përfshirë analizimi i rezultateve.