DIVERSE
Apache Spark - Să facem din Big Data un lucru simplu
În ultimul an, Apache Spark a beneficiat de atenţie sporită din parte domeniilor Big Data şi Data Science, în principiu pentru că are un API mai accesibil şi o gestionare mai bună a memoriei decât MapReduce, ceea ce permite ca programatorii să se concentreze asupra operaţiilor logice care stau la baza computării sau a calculului, deci nu asupra detaliilor care se referă la modul cum aceasta este executată în spate.
PROGRAMARE
Introducerea și tuning-ul Hadoop MapReduce
MapReduce este principala tehnologie de procesare de date de volum mare a
proiectului Apache Hadoop. A fost dezvoltată de către Google. În 2004, ei au
publicat un *articol* care descria conceptul MapReduce.
În 2006, Dug Cutting a reușit să implementeze acest concept și să îl includă
într-un proiect Apache, mai exact în Apache Hadoop. Prima lansare a avut
loc în 14 Septembrie 2007.
Conferință TSM
Design contribution