Clasificarea automată a textelor folosind tehnici de procesare a limbajului natural

În strânsă legătură cu tehnologiile Big Data este domeniul inteligenței artificiale. Una dintre ramurile acestei discipline se ocupă cu studiul limbajului natural. Calculatoarele pot fi învățate să recunoască anumite șabloane din textele prelucrate și, pe baza acestora, pot clasifica automat propoziții, fraze sau chiar documente complete în grupuri predefinite. Folosind instrumente open source, putem configura cu ușurința un astfel de proiect, capabil să clasifice texte, bazându-se pe o învățare prealabilă, realizată în mod automat, folosind un set de date prestabilit.