PROGRAMARE
Kafka în ecosistemul BigData
Articolul își propune să prezinte o serie de noțiuni generale referitoare la Kafka și la rolul pe care acest sistem îl joacă în ecosistemul BigData.
Domeniul BigData este tot mai popular, iar interesul pentru tehnologiile din acest ecosistem este unul în creștere. Una dintre cele mai mari provocări ale BigData este partea de analiză a datelor. Dar pentru a face față acestei provocări este important să ne centrăm atenția asupra modului cum reușim să colectăm aceste date? În ajutorul nostru intervine sistemul Apache Kafka.
PROGRAMARE
Descoperirea entităților similare în modele BigData
Cum găsim propoziţii similare într-un set foarte mare de date (Peta-bytes de
date). O problemă foarte importantă care apare atunci când încercăm să găsim
elemente similare de orice fel este ca probabilitatea prezenței unui număr prea
mare de perechi să îngreuneze procesul de analiză și identificare a relației de
similaritate dintre ele. Chiar dacă timpul în care se determină dacă o pereche
este similară sau nu este foarte scurt, este nerealist să credem că putem să le
comparăm pe toate.
Conferință TSM
Design contribution