Sistem koristi kombinaciju statističkog modela i tehnika mašinskog učenja, koji skoro nepogrešivo prepoznaje da li je neka vest istinita ili lažna. Jedino ograničenje je što, za sada, ovaj sistem radi samo za brazilski portugalski jezik.
Statističke metode se upotrebljavaju za analizu karakteristika napisanog teksta, kao što su prepoznavanje reči koje se često koriste, ili gramatička pravila… Ti podaci se prosleđuju klasifikatoru zasnovanom na mašinskom učenju, koji je u stanju da prepozna šablone u jeziku, kao i semantiku koja se često koristi u pravim i lažnim vestima i na osnovu toga odlučuje da li je tekst zasnovan na istinitim ili izmišljenim informacijama.
Modeli su trenirani sa ogromnim bazama pravih i lažnih vesti, dok je za učenje vokabulara iskorišćeno više od 100.000 tekstova koji su objavljeni u poslednjih pet godina.
Cilj projekta bio je da se društvu ponudi dodatni alat za identifikaciju vesti, koji neće biti subjektivan. Naučnici planiraju da koriste ovaj sistem pred predstojeće predsedničke izbore, ali i za sadržaje koji su vezani za pandemiju COVID-19 virusa, što će im omogućiti da ga dodatno kalibrišu i učine još preciznijim.
Komentari (0)
Trenutno nema komentara. Budite prvi i ostavite komentar.