În toată istoria sa intensă şi plină de provocări, tehnologia ce tratează procesarea, comunicarea şi stocarea datelor a oferit şi oferă imaginea unei continue diversificări, eterogenităţi şi distribuiri în toate sferele vieţii. Interacţiunea dintre tehnologie şi modul în care ea este folosită generează inovaţie şi pune o presiune extrem de utilă asupra capacităţii noastre de inovaţie şi adaptare.
Precum se poate observa în cazul indivizilor a diferite specii cât şi a grupurilor formate din oameni ori animale, sistemele tehnice eterogene presupun o complexitate sporită a controlului şi o capacitate continuă de a reacţiona ori de a învăţa, infera şi a prezice, de a se adapta în faţa mediului în schimbare. De asemenea, devine critică tratarea performanţelor variabile ale sistemelor participante de ordin inferior ori de a reacţiona în faţa accidentelor prevăzute şi mai ales neprevăzute. Din acest motiv, înţelegerea şi adoptarea unor soluţii potrivite optimizărilor funcţionale şi de costuri devine esenţială pentru funcţionarea optimă a acestor artefacte complexe. Energia este parte integrantă din istoria umanităţii, fiecare pas în ceea înseamnă capacitatea grupurilor omeneşti de a găsi, transporta, stoca ori utiliza energie având un impact decisiv în modelarea lumii în care trăim. Menţionăm două momente fundamentale în istoria civilizației : inventarea motorului cu abur care a dus la revoluţia industrială şi schimbarea fenomenală a capacităţii de producţie şi mişcare, şi la capacitatea de a produce şi transporta energie electrică, având un impact extraordinar asupra calităţii vieţii şi a urbanizării rapide a lumii. Revoluția tehnologiei în ceea ce priveşte producţia, transportul, distribuţia şi consumul energiei, fie ea electrică, termică ori mecanică a dat şi dă umanităţii acces la siguranţă, confort şi oportunităţi greu de imaginat. Se poate observa însă şi felul în care inovaţia este susţinută şi alimentată în ultima jumătate de secol de evoluţia capacităţilor de calcul, stocare de date precum şi de accesibilitatea serviciilor de telecomunicaţii în cele mai diverse locuri.
Descrierea relaţiei dintre energie - de la producţie la consum - şi IT a evoluat de-a lungul timpului şi reprezintă o poveste extrem de interesantă. În cele ce urmează ne vom limita şi referi la un domeniu mai puțin vizibil şi la modul în care el beneficiază de Big Data Analytics şi de Machine Learning. Acest domeniu se numeste Mentenanţă (Maintenance), iar subiectul aflat la intersecţia dintre Predictive Analytics şi Mententanţă se numeşte Mententanţă Predictivă (Predictive Maintenance) şi are ca obiectiv detectarea semnalelor, a trendurilor ce ne pot indica tendinţa unui sistem ori a unui sub-ansamblu de a funcţiona sub-optim, fapt ce duce mai devreme sau mai târziu la defecte incontrolabile şi scoaterea din uz pe o perioadă dată a sistemului. În acest context, mentenanţa predictivă pune în context date obţinute în urma monitorizării infrastructurilor date plus date adiţionale relevante, cum ar fi prognoza meteo ori cele cu privire la costul materiilor prime folosite, şi oferă o recomandare pe diferite orizonturi de timp, dependente de impactul asociat cu privire la modul de întreţinere a infrastructurii monitorizate. Această abordare reprezintă un pas relevant înainte faţă de mentenanţa "în orb" la care inspecţia instalaţiilor se face de regulă la intervale periodice de timp ori determinate de aproximarea statistică a gradului de uzură a diferitelor componente.
Marile instalaţii de producere a energiei electrice, uzual cunoscute drept centrale electrice, reprezintă investiţii complexe, de mare volum şi cu impact pe o lungă perioadă de timp. Ultimele decenii au arătat că mixul de surse posibile atât din surse fosile ori regenerabile (hidro, eolian, solar) aduce cu sine provocări specifice în ceea ce înseamnă planificarea şi decizia cumpărării din una sau mai multe surse în condiţiile în care consumatorul final așteaptă un preț predictibil optim.
În acelaşi timp, pentru centralele electrice costul evaluat pentru utilizare (TCO - Total Cost of Ownership) în regim continuu (centrala nu se opreşte decât pentru revizii) este estimat ca fiind compus din cel mult 30% investiţie initială şi cel puţin 70% costuri de mentenanţă. Se observă din aceste cifre că impactul unui proces de mentenanţă făcut inteligent este extrem de mare de-a lungul întregii vieţi a centralelor. Toate aceste date au condus la căutarea de soluţii IT capabile să poată monitoriza în timp real ori aproape în timp real parametri relevanţi de proces (aşa numita instrumentare a proceselor) ţin la estimarea cu maximă acurateţe posibilă a contextului de lucru în procesele relevante cum ar fi combustie, vibraţii, disponibilitatea vântului (în generarea Wind Power), temperatura ori încărcarea instalaţiilor suport de transport a combustibilului.
Toate aceste surse creează un volum imens de date, implicând o problemă Big Data extrem de complexă având ca scop generarea de suport de decizie în ceea ce priveşte mentenanţa, atât componentele implicate cât şi momentul realizării (actionable insights). Este de presupus, în acest mod, că o problemă de Big Data să realizeze ca produs relevant Smart Data.
Pentru a putea înţelege cum este abordată o astfel de problemă de Big Data, putem identifica un număr de paşi generici (termenii în engleză sunt autodescriptivi): identificarea punctelor de măsură relevante, plasarea de senzori, transmiterea periodică ori la cerere a parametrilor măsuraţi (operațiuni cunoscute ca fiind îndeplinite de către sistemele SCADA), curăţarea datelor, clasificarea/clusterizare, Data Mining/Pattern Matching, Model Learning, Model Calibration, decizie/analiza de context/recomandare de modificare/diagnostic.
Pentru a putea da o imagine corectă unei astfel de probleme putem spune că un centru de diagnostic la distanţă capabil să gestioneze mai multe parcuri de turbine eoliene primeşte date măsurate pentru 3200 de parametri pentru fiecare turbină, şi în jur de 300 de milioane de măsurări pe saptămână. Dacă bazele de date cu măsurători istorice conţineau 97 de terabytes, în 2013 volumul lor a crescut la 270 terabytes în 2015. Este evident imposibil pentru operatorul uman să poată observa trenduri utile la o astfel de scară într-un timp care să justifice o intervenţie corectă pe teren.
Cantitatea foarte mare de date detaliate de timp real sunt cheia succesului pentru un astfel de sistem deoarece permite experţilor în modele de diagnostic să folosească algoritmi de machine learning şi modele simulate pentru a determina cu precizie crescută cu ce fel de defect se confruntă şi în ce mod trebuie abordate activităţile de mentenanţă. Performanţele obţinute sunt pe măsură, deoarece permit rezolvarea remote a peste 80% dintre cazurile posible de defect într-un timp minim de scoatere din producţie a turbinei. În condiţiile actuale, un maxim de 15% dintre cazuri solicită prezenţa fizică a tehnicienilor pentru a remedia problemele apărute.
Bineînţeles, tehnologia este extrem de utilă, dar impactul ar fi net mai scăzut fără cunoaşterea a priori a modului de funcţionare a instalaţiilor monitorizate. În acelaşi timp, Big Data Analytics permite analiza și corelarea pe intervale relevante de timp a datelor colectate şi generarea de produse noi Analytics Ready pregătite pentru o piaţă a energiei capabilă să ofere surse fiabile, ecologice şi preţuri stabile către consumatori.
Big Data schimbă şi va schimba profund modul în care se face IT, şi aceasta datorită paradigmei de lucru complet diferite, mult mai adaptate realităţii, indiferent că vorbim de pieţe, procese industriale ori ştiinţele vieţii (atât pharma cât şi diagnostics). În locul ancorării în baze de date ori procese relativ inflexibile, realitățile cele mai prețioase sunt datele brute. În ele minerii viitorului pot descoperi corelaţii şi schimbări la care sistemele integrate Ciber-Fizice plus factor uman pot reacţiona mult mai eficient. Fiecare etapă de preprocesare relevantă din abordarea Big Data precum curăţarea datelor, eliminarea anomaliilor, reducerea dimensională, pregăteşte fazele cheie: analiza statistică şi aplicarea algoritmilor potriviţi de învăţare necesari în identificarea modelelor funţionale de pattern matching. În cele din urmă, putem observa cum Big Data schimbă profund modul în care inginerul de mâine va aborda problemele.