Lietuviškų socialinių medijų tekstų Fasttext įterptinių vektorių modelis

Modelio parengimui buvo panaudoti per 2 mln. atviros prieigos lietuviškų socialinių medijų komentarai. Modelis buvo panaudotas projekte sukurtame neapykantos/įžeidžios kalbos socialinių medijų tekstuose atpažintuve. Čia modelis pateikiamas kaip priemonė, leidžianti įvertinti Facebook Fasttext įterptinių vektorių algoritmo tinkamumą analogijų nustatymui nenorminės lietuvių kalbos tekstuose (įskaitant tekstus su klaidinga rašybą, nenormine leksika ir t.t.).

Modelį ir svetainę parengė: Mindaugas Petkevičius