PROGRAMARE
Big Data Apache Hadoop
Continuând seria de articole despre “big data”, începută cu introducerea în lumea “big data” în numărul 2 al revistei și urmată de articolul despre bazele de date de tip “nosql” din numărul 3, a venit rîndul unui articol care să prezinte mai pe larg una din tehnologiile semnificative din lumea “big data” și anume Apache Hadoop. Apache Hadoop este un framework care facilitează procesarea unor seturi de date mari și foarte mari, pe mai multe calculatoare folosind un model de programare simplu: paradigma map/reduce. Este proiectat în așa fel, încît să scaleze de o mașiniă la mii de mașini, fiecare din ele punînd la dispoziție putere de procesare și spațiu de stocare. În loc să se bazeze efectiv pe hardware pentru “high-availability”, framework-ul în sine este proiectat în așa fel încît să detecteze erorile la nivel de aplicație.
PROGRAMARE
Big Data
De ce “big data”? Pentru că e un subiect la modă, pentru că piața pentru “big data” este un business de 70 de miliarde de dolari pe an cu o creștere de 15% de la an la an.
Pentru că mai toate companiile mari de soft investesc în soluții orientate către “big data”, pentru că pe internet, zilnic, se generează o cantitate imensă de date (de ordinul sutelor de petabytes) și pentru ca toate aceste date sunt stocate și marea majoritate sunt supuse unor procese de analiză a datelor. Analiză care sa extragă informații utile pentru cei care le dețin, informații care de regulă duc la creșterea business-ului, amintim doar cîteva: detectarea patternului de cumpărare a utilizatorilor, o mai bună targetare a reclamelor, detectarea fraudelor, etc.
Alţi autori de la Betfair
Conferință TSM
NUMĂRUL 150 - Technologiile SAP ABAP
Design contribution