Hrpwr - 350 ezer magyar szöveg alapján készített AI-felismerő rendszert egy szegedi egyetemista

Kiss Mihály, a Szegedi Tudományegyetem programtervező informatikus mesterszakos hallgatója olyan magyar nyelvű AI-szövegfelismerőt hozott létre, amely a tesztek alapján kiemelkedően pontosan képes megkülönböztetni az ember által írt és a nagy nyelvi modellek által generált szövegeket. A projekt elnyerte az SZTE Hallgatói Innovációs Díját.

„Egyre többen használják ezeket az eszközöket, és hosszú távon ez biztosan problémát jelent majd az oktatásban és azon túl is” – mondja a fejlesztő. Innen indult az a kutatás, amely mára egy önálló, magyar nyelvre optimalizált AI-detektorhoz vezetett. „Manapság még működni tudnak ezek a felismerő modellek, mert a nagy nyelvi modellek hagynak lábnyomokat maguk után, nem adaptálódtak teljesen az emberi íráshoz. Angolul sem igazán, de magyar nyelven meg végképp nem ” – teszi hozzá.

Nem azért nem létezett korábban minőségi AI-detektor magyar nyelvre, mert az „bonyolultabb”, mint az angol, hanem mert nincs hozzá megfelelő adat. Míg angol nyelven hatalmas, jól tisztított tanítóadatbázisok állnak rendelkezésre, magyar szövegekből ilyen korábban nem létezett.

Kiss Mihály ezért több mint 350 ezer szövegből álló adathalmazt hozott létre: irodalmi művekből, szakdolgozatokból, cikkekből, fórumokról, közösségi médiából és általános internetes forrásokból. A cél az volt, hogy a rendszer valódi, sokféle nyelvhasználattal találkozzon, ne csak „tankönyvi” példákkal.

A teljes cikket a Helló Sajtó oldalán tudjátok elolvasni.

(Borítókép: Unsplash/Christopher Gower)

Rovatok

AI-optimalizált HR folyamatok - Online workshop