Experienţa mea în domeniul VM backup a început acum șapte ani. În tot acest timp, mi-am pus multe întrebări, am avut de rezolvat probleme şi situaţii de VM backup. De asemenea, am lucrat cu destul de multe tehnologii şi sisteme de operare (c#, WCF, HTML, Typescript, C++, Javascript, Cloud APIs, SDS APIs, Windows, Linux). În acest articol, doresc să împărtăşesc ceea ce am învăţat în privinţa unor practici sănătoase de backup pentru SMB (Small and Medium Businesses/Afaceri Mici şi Mijlocii).
În experienţa mea, un produs ar trebui să ţintească o piaţă specifică. Dacă încercaţi să acoperiţi totul, veţi obţine o complexitate care va avea impact asupra funcționalității - organizaţiile SMB au, în mod tipic, mai puţin de 300 VM (maşini virtuale) şi mai puţin de 25TB spaţiu de stocare. Acest lucru ne indică un prim aspect de reţinut în privinţa backupului. Trebuie să aveţi în vedere infrastructura - dimensiunea şi topologia. În funcţie de furnizorii hypervisor şi de dimensiune (VMs şi date) trebuie să alegeţi toolul potrivit de backup şi mediul potrivit.
Una dintre cele mai importante întrebări se referă la cât de des se realizează backupul şi când se depozitează şi arhivează datele. Clienţii se referă la aceste aspecte sub numele RPO (Recovery Point Objective). Dacă nu aveţi restricţii legale în privinţa păstrării şi a arhivării datelor, trebuie să aplicaţi regula 3-2-1 drept standard minim. Regula spune că ar trebui să aveţi cel puţin 3 copii ale datelor, stocate pe 2 tipuri de dispozitive media diferite. În plus, una dintre aceste copii ar trebui să se afle mereu în afara sediului sau a locaţiei dumneavoastră. De exemplu, o abordare bună ar fi să folosiţi protocolul D2D2T (disk to disk to tape) unde backupul se face pe disc şi bandă sau, şi mai bine, protocolul D2C2T (disk to cloud to tape) unde datele sunt stocate pe disc şi replicate atât pe cloud, cât şi pe bandă. Arhivarea este foarte importantă, iar păstrarea arhivelor pe termen lung poate fi un aspect critic pentru o afacere din punctul de vedere al recuperării şi al conformităţii datelor. În mod special, dacă aveţi date care s-au deteriorat treptat în timp şi aveţi nevoie de o copie mai veche pentru a reconstrui datele, veţi fi fericiţi dacă veţi putea să apelaţi la o copie arhivată. Dacă aveţi în vedere arhivarea pe termen lung, trataţi cu grijă deteriorarea media pentru a evita o surpriză neplăcută. Testarea backupului este o sarcină de lucru esenţială.
O opţiune de luat în calcul este backupul incremental - vă permite să salvaţi doar datele care s-au modificat de la un backup la altul, economisind timp şi spaţiu de stocare, dar vă va creşte dependenţa de backupurile anterioare şi va micşora performanţa procedurii de recuperare a datelor. Reţineţi că, dacă salvaţi datele pe VM cu o iteraţie I/O de disc mărită, elementele incrementale ar putea să consume mult spaţiu şi ar putea să vă umple capacitatea de stocare foarte repede, dacă nu aveţi o strategie corectă de retenţie a datelor.
În ceea ce priveşte diferitele tipuri de dispozitive media, elementele clasice de stocare sunt discul şi banda. Dar, în zilele noastre, stocarea în cloud este disponibilă la cerere, oferind organizaţiilor SMB posibilitatea de a economisi din serviciile CAPEX (Capital Expenditure). Indiferent de scenariu, caracterul privat al datelor este un factor important. Prin urmare, recomand criptarea drept o măsură minimă de luat în calcul pentru toate backupurile realizate în afara sediului sau a locaţiei. Ne referim aici nu doar la cloud, ci şi la materialele stocate pe bandă care, în mod tipic, sunt trimise în afara sediului. Criptarea consumă mult din capacitatea CPU-lui, dar securitatea pe care o asigură merită toţi banii.
Unul dintre cele mai importante lucruri care se uită este testarea backupului. Nu este suficient să aveţi încredere în software-ul care face backupul. Backupurile trebuie să fie testate, iar, în mod clasic, se fac fie manual, fie cu teste automate de backup. Cei mai mulţi furnizori oferă soluţii automate pentru a-şi testa backupul după ce sesiunea de backup s-a terminat. Este, de asemenea, important să verificaţi că datele salvate sunt actualizate şi că nu conţin stări mai vechi ale VM.
O temă pe care oamenii uită să o abordeze în discuţii este procesul de recuperare şi planificarea acestuia. Este important să aveţi o idee clară a ceea ce presupune acest proces şi a cât de mult poate să dureze în funcţie de suporturile media. Clienţii se referă la acest aspect prin termenul RTO (Recovery Time Objective). Pentru a putea alege procedura corectă, luaţi în calcul toate scenariile posibile pe care doriţi să le evitaţi. Pentru a realiza acest lucru, răspundeţi la următoarele întrebări (pentru fiecare VM, puteţi obţine un răspuns diferit). Dacă pierdeţi VM:
Trebuie să restauraţi tot VM sau doar datele/subsetul de date din aceasta?
Dacă aveţi nevoie doar de date, puteţi avea în vedere recuperarea la nivel de fişier sau recuperarea la nivel de item (e.g.: fişier unic sau item MS Exchange), ceea ce vă dă posibilitatea de a extrage doar datele de care aveţi nevoie fără a restaura VM în întregime.
Dacă trebuie să restauraţi VM, cât timp acordaţi procesului de recuperare (secunde, minute, ore) înainte de a-ţi pierde clienţii şi banii?
Unele soluţii vă dau posibilitatea de a recupera VM instant. Ar putea avea performanţă redusă pentru o perioadă scurtă de timp, dar vă poate salva de o perioadă lungă de inactivitate. Dacă abordaţi problema corect, veţi fi respectat şi considerat, cu uşurinţă, un specialist IT.
Notă: Amintiţi-vă să nu sub/supraevaluaţi importanţa lucrurilor pe care doriţi să le recuperaţi. Nu trebuie să cheltuiţi bani dacă nu doriţi, dar nu doriţi nici să vă aflaţi într-o situaţie fără soluţii. Problema e un echilibru fragil.
Reţineţi că backupul este un pas necesar, dar scopul este ca datele să fie arhivate şi, în cazurile defavorabile, să aveţi o pană de scurtă durată. Cel mai bine este să găsiţi furnizori care vă oferă opţiunea de a restarta VM din locaţia de backup. Astfel, evitaţi lunga aşteptare ca procesul de recuperare să se termine.
Acum, să ne familiarizăm cu nişte ponturi (tips and tricks) pe care le-am învăţat în cadrul dezvoltării de backup software şi prin prisma feedbackului de la clienţi:
Dacă rulaţi multe VM identice (e.g. multe servere Windows/Linux) folosiţi deduplicarea pentru depozitarea dumneavoastră. Se va economisi mult spaţiu pe disc!
Dacă intenţionaţi să folosiţi criptarea sau compresia de date, evitaţi deduplicarea, pentru că va fi mai puţin eficientă.
Dacă folosiţi depozitare cloud pentru a arhiva backupurile, asiguraţi-vă că aveţi suficientă lungime de bandă pentru încărcare şi revizuiţi procesele care au recuperare de lungă durată.
Evitaţi lanţurile incrementale prea lungi, făcând restaurări complete cât de des posibil (e.g. în weekend), pentru a reduce dependenţa şi pentru a îmbunătăţi performanţa.
Cei mai mulţi furnizori de VM software fac un default snapshot la nivel de Hypervisor OS. Pe VM cu activităţi de I/O disc mărite, acest lucru poate afecta VM pentru că pot să nu mai răspundă la comenzi pentru scurt timp, din cauza consolidării snapshot-ului. În timpul procesului de backup, datele snapshot se vor acumula, ocupând din ce în ce mai mult spaţiu. Dacă sistemul dumneavoastră de depozitare permite snapshots, utilizaţi-le, deoarece acestea nu au niciun efect asupra procesului de manipulare a datelor.
Reţineţi că nivelul de consistenţă oferit de backup poate varia. Încercaţi să obţineţi backup-uri consistente cu aplicaţia.
În concluzie, mediul virtual evoluează zilnic. Fiţi la curent cu cele mai variate tehnologii, dar asiguraţi-vă că mediul dumneavoastră este în permanenţă stabil. Cea mai bună variantă este să petreceţi timp testându-vă opţiunile şi rezultatele. Aceasta va consuma o parte din timpul dumneavoastră la început sau în timpul update-urilor, dar veţi evita surprizele neplăcute viitoare.
D2D2T : Disc-la-disc-la-bandă (Disk-to-disk-to-tape) este o procedură de stocare de date şi backup prin care datele sunt salvate pe un disc înainte de a fi copiate pe un dispozitiv cu bandă. Procesul de backup de date stochează iniţial conţinutul discului primar pe un alt disc, iar apoi pe dispozitivul de backup cu bandă.
D2C2T : Disc-la-cloud-la-bandă (Disk-to-cloud-to-tape) este similar lui D2D2T, dar acest proces de backup de date proces stochează iniţial conţinutul discului primar în cloud, iar apoi pe dispozitivul de backup cu bandă.
Backup complet (Full backup): un backup al tuturor datelor de pe VM. Acesta are avantajul de a nu depinde de backupuri anterioare, procesul de recuperare a datelor este mai rapid, dar va ocupa mult spaţiu de stocare.
Backup incremental (Incremental backup): un backup pentru toate datele modificate de la ultimul backup. Acesta optimizează spaţiul de stocare disponibil, dar procesul de recuperare a datelor va fi mai lent comparativ cu full backup.
Deduplicarea (Deduplication): o tehnică specializată de compresie pentru a elimina copiile duplicate şi redundanţa datelor. Termenii înrudiţi sau sinonimi sunt "compresie inteligentă de date" (intelligent data compression) şi "stocare de date pe o singură instanţă" (single-instance data storage).