Nu de multe ori avem șansa de a vorbi despre un subiect la fel de captivant precum "conducerea autonomă" și implicațiile sale inter-industriale, dar un lucru este cert: pentru a rezuma caracteristicile și complexitatea acestui subiect, o analogie simplă este mai potrivită:
" Dacă există ceva ancorat în realitatea imediată, dar asemănător cu știința rachetelor (en. "Rocket Science"), aceasta este conducerea autonomă și ingineria din spatele ei ".
Sistemele autonome sunt aici și acum: de la un vechi subiect "SF", la implementările concrete în aplicații militare începând cu anii 1900, la provocările Darpa privind conducerea autonomă în anii 2000 și, în prezent, asistând la pachetul Tesla Full Self-Driving comercializat în mod activ în 2022, putem înțelege că acest subiect nu este un truc de marketing. Având în vedere cât de transformațională este această industrie în momentul prezent și faptul că cele mai multe dintre Top 500 de companii de tehnologie investesc activ în această direcție, dar și considerând realitățile particulare pe care le vom explora mai jos, va deveni clar cât de mult suntem înconjurați de această tehnologie.
Cele mai interesante părți relevate în analiza sistemelor de conducere autonomă se încadrează în următoarele domenii funcționale:
Ingineria de hardware din spate (cipuri SoC, senzori, MCU) și Software Stacks alături de "Sensor Fusion", inclusiv algoritmi (SLAM, Path Planning), dar și frameworkuri, API-uri și SDK-uri.
Module de awareness/detecție, inclusiv camere stereo, LIDAR (Detecție și Ranging de Lumină), IMU (unitate de măsurare inerțială) și GPS asistat.
Disciplinele emergente de inginerie (platforme de AI, ML onboard și găzduit central, "Smart Data" Lakes) combinate cu implementări Extended Reality (AR, XR).
Hărți topografice, hărți HD, huburi de date de trafic live, hărți geofencing.
Dar, așa cum am promis, nu vom uita să menționăm pe scurt preocupările legate de reglementările legale și de siguranță sau provocările cu standardizarea sistemelor de automatizare a conducerii: sisteme avansate de asistență a șoferului (ADAS) și sisteme de conducere automată (ADS); vom continua să folosim acronimul ADS în continuarea articolului.
Înainte de a relua "călătoria noastră" virtuală în acest domeniu, este important să înțelegem că în spatele implementărilor ADS se află numeroase domenii științifice și o mulțime de studii și cercetări care fac imposibil să vorbim într-un mod complet cuprinzător despre ansamblul menționat mai sus într-un singur articol - ar putea deveni cu ușurință acea " enciclopedie de 1000 de pagini ", doar pentru a atinge, în fapt, vârful aisbergului.
Acest lucru sugerează că cea mai bună șansă a noastră de a dobândi un nivel minim de înțelegere al subiectului ar fi să ne concentrăm doar pe câteva elemente bine delimitate legate de ADAS și ADS.
O notă de clarificare: activitatea de "conducere autonomă" se întinde cu mult dincolo de aplicațiile banale "de consumator" B2C, în cea mai mare parte, legate de mașini cu conducere autonomă. Un set cuprinzător de aplicații de lucru pentru ADS se află în centrul afacerilor cum ar fi companiile aeriene comerciale și industriile maritime, liniile de producție industrială și sistemele de execuție de producție.
Doar citind titlurile menționate mai sus cu impact asupra industriei care beneficiază de ADS, putem înțelege profunzimea ingineriei inter domeniale și știința din spatele acesteia.
Sistemele autonome de conducere și nu numai sunt un subiect al implementărilor end-to-end, fiind, de fapt, cheia în această afacere: unitățile care pot efectua operațiuni autonome, au cipuri/senzori și software locale complexe la bord, comunică cu un sistem găzduit central (cloud), utilizează o comunicare wireless cu latență scăzută și valorifică infrastructura (artefacte rutiere, elemente de cartografie). Probabil, cu puțin curaj, putem deja să recunoaștem că ne uităm la un domeniu emergent bazat pe date "hyper-end-to-end" .
Punctul cheie în tema ADS este distincția dintre Automatizare versus Autonomie. Prin urmare, este util să clarificăm acest lucru în cel mai scurt mod posibil:
Autonomia în vehicule este clasificată în șase niveluri, conform unui sistem dezvoltat de SAE J3016 (actualizat J3016_202104). Nivelurile SAE pot fi înțelese aproximativ ca Nivel 0 - fără automatizare; Nivelul 1 - mâinile pe volan; Nivelul 2 - fără controlul volanului; Nivelul 3 - fără să privim drumul; Nivelul 4 - fără să fim atenți la condus și Nivelul 5 - volanul este opțional.
Pentru fiecare mișcare, vehiculul folosește LiDAR, radar, camere și estimatori de poziție, care scanează constant la 360 de grade.
Importanța unui sistem LiDAR vine din precizia acestuia, care are un câmp vizual de 100 m, dar și din capacitatea sa de rotație la 360 de grade. Cu peste două milioane de citiri pe secundă, un sistem LiDAR furnizează detalii de înaltă rezoluție asupra mediului din jurul mașinii.
Radarul, senzorii cu ultrasunete și camerele stereo sunt dispozitive relevante pentru construirea percepției asupra împrejurimilor imediate ale unei mașini. Această fuziune a datelor senzorilor și a datelor GPS permite poziționarea locației unei mașini la o rază de 10 cm.
Utilizarea SLAM (Simultaneous Localization and Mapping): vehiculele își cartografiază împrejurimile în timp real, orientându-se pe baza intrării senzorului, câteva provocări pentru această tehnologie fiind:
Colectare masivă de date: o oră de conducere înseamnă aproximativ un terabyte de date.
Prelucrarea datelor: interpretarea unui terabyte de date colectate utilizând o putere mare de calcul necesită două zile pentru a obține date de navigare utilizabile.
Pe măsură ce datele sunt furnizate în mod constant algoritmilor de învățare automată (ML), vehiculele încep să dea un anumit sens tonelor de date colectate, realizând modele pe baza cărora sistemele adaptive pot lua decizii.
Cartografierea online este interpretată la bordul vehiculului, exemple clasice fiind sistemele SLAM pentru localizare și cartografiere simultană. Recent, SLAM semantic, care se concentrează pe geometria și semnificațiile semantice ale marcajelor de suprafață de pe drum, este explorat ca o soluție ușoară pentru cartografiere. În plus, cartografierea semantică online monoculară (monoSOM) este un subiect de tendință, în care o rețea neuronală este utilizată pentru a fuziona secvențe temporale de imagini monoculare de la mai multe camere într-o hartă semantică de tip birds-eye-view.
Datele senzorilor colectate de mii de mașini permit stabilirea de hărți dinamice de mare precizie (HD), cu acuratețe ridicată și informații în timp real.
Proiectul Waymo de la Google este un exemplu de astfel de "aspecte" ale sistemului autonom:
Direcția fără mâini ghidează mașina fără mâinile șoferului pe volan. Șoferul este încă obligat să acorde atenție.
Controlul adaptiv al vitezei de croazieră (ACC) până la oprire menține automat o distanță selectabilă între mașina șoferului și mașina din față.
Și acestea sunt doar aspecte de asistență de nivelul 2! Integrările complet autonome de nivel 4 și 5 sunt deja implementate în câteva alte aplicații comerciale, deși sunt încă indisponibile la nivel de vehicule private.
ADAS/cipurile folosite în conducerea autonomă au cunoscut un val de adaptări și îmbunătățiri. De asemenea, mulți producători de cipuri au lansat sau au planificat să lanseze cipuri de mare putere de calcul. În ianuarie 2022, Mobileye a introdus EyeQ ® Ultra™, cel mai avansat și mai performant sistem pe cip (SoC) al companiei, conceput special pentru conducerea autonomă. Așa cum a fost dezvăluit în timpul CES 2022, EyeQ Ultra maximizează atât eficacitatea, cât și eficiența la doar 176 TOPS, cu tehnologia de proces de 5 nanometri.
Cipurile SoC, care implică în cea mai mare parte un design eterogen, includ diferite unități de calcul, cum ar fi GPU, CPU, nucleu de accelerare, NPU, DPU, ISP etc. În general, puterea de calcul nu poate fi evaluată doar de la eficienţa cipului. Lățimea de bandă a cipului, perifericele, memoria, precum și un raport de eficiență energetică și costul ar trebui, de asemenea, luate în considerare. În același timp, lanțul de instrumente de dezvoltare a cipurilor SoC este foarte important - numai prin formarea unui ecosistem de dezvoltatori o companie se poate construi o competitivitate durabilă pe termen lung.
În proiectarea cipurilor, configurația IP eterogenă este crucială, iar furnizorii de cipuri SoC cu conducere autonomă consolidează în mod constant cercetarea și dezvoltarea IP-ului de bază pentru a-și menține avantajele competitive decisive. De exemplu, NVIDIA și-a actualizat linia de produse existentă bazată pe GPU la o strategie cu trei cipuri (GPU+CPU+DPU):
GPU: NVIDIA se bucură de superioritate în GPU și procesarea imaginilor derivate din GPU;
DPU: NVIDIA a anunțat finalizarea achiziției Mellanox Technologies, Ltd., o companie israeliană de cipuri, cu o valoare a tranzacției de 7 miliarde de dolari și a lansat unitatea de procesare a datelor (DPU) BlueField ®-3. DPU este o componentă electronică programabilă, cu versatilitatea și programabilitatea unei unități centrale de procesare (CPU), destinată gestionării eficiente a pachetelor de date din rețea, cererilor de stocare sau solicitărilor de analiză;
Tesla a lansat platforma Dojo de instruire pentru supercomputing, folosind cipul de antrenament AI de 7nm dezvoltat de către Tesla și bazându-se pe o bază imensă de clienți pentru a colecta date de conducere autonomă și a realiza antrenamente model pentru sistemele de învățare profundă. În prezent, Tesla Autopilot utilizează, în principal, imagini 2D + adnotări pentru antrenament și iterare a algoritmului. Prin intermediul platformei de supercomputing Dojo, Autopilot poate îndeplini antrenamentul prin imagini 3D + marcaje temporale (sistem Autopilot 4D). Sistemul 4D Autopilot va fi previzibil și va marca traiectoria de mișcare 3D a obiectelor rutiere pentru a spori fiabilitatea funcțiilor de conducere autonomă.
NVIDIA a anunțat NVIDIA Omniverse Replicator, un motor pentru generarea de date sintetice cu adevărul de bază pentru antrenarea rețelelor AI. NVIDIA are, de asemenea, cel mai puternic procesor de antrenament - NVIDIA A100.
Implementarea Sistemelor de Conducere Autonomă presupune o revoluție în:
Producție (piese și unități pentru utilizatorul final);
Software (platforme - atât onboard, cât și găzduite, algoritmi, SDK-uri), arhitectură, tehnologii emergente (AI, XR);
Transformarea infrastructurii;
Schimbarea cererii de petrol;
Potrivit Consumer Reports, "Aproape fiecare mașină nouă vândută astăzi în SUA se încadrează într-o zonă de la nivelul 0 la nivelul 2-3".