ABONAMENTE VIDEO REDACȚIA
RO
EN
NOU
Numărul 150
Numărul 149 Numărul 148 Numărul 147 Numărul 146 Numărul 145 Numărul 144 Numărul 143 Numărul 142 Numărul 141 Numărul 140 Numărul 139 Numărul 138 Numărul 137 Numărul 136 Numărul 135 Numărul 134 Numărul 133 Numărul 132 Numărul 131 Numărul 130 Numărul 129 Numărul 128 Numărul 127 Numărul 126 Numărul 125 Numărul 124 Numărul 123 Numărul 122 Numărul 121 Numărul 120 Numărul 119 Numărul 118 Numărul 117 Numărul 116 Numărul 115 Numărul 114 Numărul 113 Numărul 112 Numărul 111 Numărul 110 Numărul 109 Numărul 108 Numărul 107 Numărul 106 Numărul 105 Numărul 104 Numărul 103 Numărul 102 Numărul 101 Numărul 100 Numărul 99 Numărul 98 Numărul 97 Numărul 96 Numărul 95 Numărul 94 Numărul 93 Numărul 92 Numărul 91 Numărul 90 Numărul 89 Numărul 88 Numărul 87 Numărul 86 Numărul 85 Numărul 84 Numărul 83 Numărul 82 Numărul 81 Numărul 80 Numărul 79 Numărul 78 Numărul 77 Numărul 76 Numărul 75 Numărul 74 Numărul 73 Numărul 72 Numărul 71 Numărul 70 Numărul 69 Numărul 68 Numărul 67 Numărul 66 Numărul 65 Numărul 64 Numărul 63 Numărul 62 Numărul 61 Numărul 60 Numărul 59 Numărul 58 Numărul 57 Numărul 56 Numărul 55 Numărul 54 Numărul 53 Numărul 52 Numărul 51 Numărul 50 Numărul 49 Numărul 48 Numărul 47 Numărul 46 Numărul 45 Numărul 44 Numărul 43 Numărul 42 Numărul 41 Numărul 40 Numărul 39 Numărul 38 Numărul 37 Numărul 36 Numărul 35 Numărul 34 Numărul 33 Numărul 32 Numărul 31 Numărul 30 Numărul 29 Numărul 28 Numărul 27 Numărul 26 Numărul 25 Numărul 24 Numărul 23 Numărul 22 Numărul 21 Numărul 20 Numărul 19 Numărul 18 Numărul 17 Numărul 16 Numărul 15 Numărul 14 Numărul 13 Numărul 12 Numărul 11 Numărul 10 Numărul 9 Numărul 8 Numărul 7 Numărul 6 Numărul 5 Numărul 4 Numărul 3 Numărul 2 Numărul 1
×
▼ LISTĂ EDIȚII ▼
Numărul 16
Abonament PDF

NoSQL de Pramad J. Sadalage şi Martin Fowler

Silviu Dumitrescu
Line manager@Telenav



DIVERSE

Voi începe această recenzie printr-o scurtă trecere în revistă a conceptelor legate de bazele de date nerelaţionale, concepte care au dus la apariţia limbajelor NoSQL (Not Only SQL).

Bazele de date relaţionale reprezintă încă, cel mai răspândit model de baza de date, raportat la numărul de aplicaţii ce îl folosesc. Acest model aduce o serie întreagă de constrângeri, cunoscute în special drept constrângeri de integritate, dar aduce anumite reguli pentru eliminarea redundanţei sau creşterea încrederii, acestea fiind cunoscute ca forme normale. Ceea ce am amintit până aici reprezintă punctul forte, pe care majoritatea dezvoltatorilor de aplicaţii îl şi urmăresc. Cum, din păcate, pentru orice trebuie să plătim ceva, şi pentru acest punct forte plătim prin greutatea regăsirii datelor în baza de date, prin complexitatea interogărilor şi, în general, prin faptul că acest model nu este propice gestionării unui volum de date mare. Ca alternativă a apărut modelul nerelaţional, care începe să prindă din ce în ce mai mulţi adepţi.

Vom continua introducerea în modelul nerelaţional al bazelor de date prin câteva descrieri a ceea ce numim "big data". Big data reprezintă mulţimi mari de date. Caracteristicile generale ale acestora sunt (the four Vs): volumul, viteza, varietatea şi valoarea. Ultimele două caracteristici sunt mai interesante şi vom zăbovi un pic asupra lor. Varietatea înseamnă că mulţimile de date pot proveni din diferite surse. Aceasta le face greu de integrat într-o bază de date relaţională, din cauza structurii diferite a lor. Valoarea înseamnă că o porţiune de date din mulţimea de big data nu este valoroasă ca entitate, ci devine valoroasă în ansamblul mulţimii.

Cum din ce în ce mai mulţi oameni accesează volume mari de date, precum cele produse de senzori, GPRS, date aflate în diverse formate, manipularea lor este diferită, iar aşteptările de viteză ale procesărilor sunt la nivelul instant. Bazele de date tradiţionale nu pot răspunde acestor provocări. Câteva exemple de baze de date NoSQL sunt: Oracle NoSQL, Cassandra, Voldemort, Neo4J, Riak sau MongoDB.

Într-o bază de date NoSQL nu există o schemă propriu-zisă a datelor, ele fiind stocate ca perechi cheie-valoare (foarte eficient şi flexibil, dar datele nu sunt self-describing), sau de coloane (folosit pentru date împrăştiate), sau document (folosit pentru depozite XML, dar ineficient ca performanţă), sau graf (folosit pentru traversări relaţionate, dar ineficient la căutări).

Aşadar, două motive importante conduc la alegerea unui model nerelaţional: volumul mare de date şi dinamicitatea modelului.

Cartea pe care v-o supun atenţiei astăzi, NoSQL, A Brief Guide to the Emerging World of Polyglot Persistence, avându-i ca autori pe Pramad J. Sadalage şi Martin Fowler este o scurtă introducere în utilizarea şi întelegerea conceptelor mai sus enumerate ale bazelor de date nerelaţionale. Nivelul cărţii este accesibil, deci avem un excelent ghid pentru a putea face o comparaţie cu modelul bazelor de date relaţionale, cunoscut deja de majoritatea cititorilor revistei.

Cartea cuprinde 15 capitole pe care le voi descrie pe scurt.

Capitolul întâi este introductiv, aducând în discuţie noţiunile de bază ce descriu o bază de date NoSQL. Capitolul al doilea este o introspecţie a modelelor folosite pentru descrierea acestor baze de date, modele amintite şi în introducerea recenziei (cheie-valoare, graf, coloană, document). Capitolul al treilea descrie neajunsurile pe care le constatăm la folosirea bazelor de date NoSQL. Capitolul al patrulea îndreaptă discuţia spre bazele de date distribuite, temele importante fiind acelea ale replicării: master-slave sau peer-to-peer. Distribuţia este strâns legată de consistenţă, de aceea în capitolul al cincilea se discută despre consistenţă la update sau read. În capitolul al şaselea se discută mult mai amănunţit problema tranzacţiilor, pentru sistemele distribuite. Capitolul al şaptelea aduce în discuţie un al concept menit sa crească eficienţa utilizării bazelor de date distribuite: map-reduce. Conceptul de map-reduce constă într-o modalitate de organizare a procesării, astfel încât o parte cât mai însemnată a procesului şi a datelor necesare acestuia să se afle pe o singură maşină. Începând cu capitolul al optulea se pune accentul pe implementare. Prima implementare este Riak, ca exemplu de bază de date cheie-valoare. Capitolul al nouălea aduce în atenţie MongoDB, ca exemplu al bazelor de date orientate pe document. Capitolul al zecelea explorează Cassandra, ca exemplu de baze de date colonare, iar capitolul al unsprezecelea prezintă Neo4J pentru bazele de date orientate pe grafuri. Ultimele patru capitole se concentrează pe diverse particularităţi ale bazelor de date NoSQL. Capitolul al doisprezecelea aduce în discuţie migrarea schemelor de baze de date. Cum NoSQL nu are neapărat o schemă de date care să descrie structura lor, problema este a măsurii în care putem utiliza date dintr-o bază de date relaţională într-una nerelaţională şi invers. Capitolul ale treisprezecelea supune atenţiei o combinaţie de mai multe tipuri de depozite de date care pot să coexiste într-o aceeaşi aplicaţie. În capitolul al patrusprezecelea se prezintă elemente avansate în ceea ce înseamnă extinderea tipurilor de date la fişiere sistem, imagini, baze de date XML, etc. În sfârșit, ultimul capitol oferă câteva sfaturi în ceea ce priveşte alegerea tipului de tehnologie folosită în gestionarea bazei de date.

 

Lectură plăcută!

NUMĂRUL 149 - Development with AI

Sponsori

  • Accenture
  • BT Code Crafters
  • Accesa
  • Bosch
  • Betfair
  • MHP
  • BoatyardX
  • .msg systems
  • P3 group
  • Ing Hubs
  • Cognizant Softvision
  • Colors in projects