ABONAMENTE VIDEO REDACȚIA
RO
EN
Numărul 148 Numărul 147 Numărul 146 Numărul 145 Numărul 144 Numărul 143 Numărul 142 Numărul 141 Numărul 140 Numărul 139 Numărul 138 Numărul 137 Numărul 136 Numărul 135 Numărul 134 Numărul 133 Numărul 132 Numărul 131 Numărul 130 Numărul 129 Numărul 128 Numărul 127 Numărul 126 Numărul 125 Numărul 124 Numărul 123 Numărul 122 Numărul 121 Numărul 120 Numărul 119 Numărul 118 Numărul 117 Numărul 116 Numărul 115 Numărul 114 Numărul 113 Numărul 112 Numărul 111 Numărul 110 Numărul 109 Numărul 108 Numărul 107 Numărul 106 Numărul 105 Numărul 104 Numărul 103 Numărul 102 Numărul 101 Numărul 100 Numărul 99 Numărul 98 Numărul 97 Numărul 96 Numărul 95 Numărul 94 Numărul 93 Numărul 92 Numărul 91 Numărul 90 Numărul 89 Numărul 88 Numărul 87 Numărul 86 Numărul 85 Numărul 84 Numărul 83 Numărul 82 Numărul 81 Numărul 80 Numărul 79 Numărul 78 Numărul 77 Numărul 76 Numărul 75 Numărul 74 Numărul 73 Numărul 72 Numărul 71 Numărul 70 Numărul 69 Numărul 68 Numărul 67 Numărul 66 Numărul 65 Numărul 64 Numărul 63 Numărul 62 Numărul 61 Numărul 60 Numărul 59 Numărul 58 Numărul 57 Numărul 56 Numărul 55 Numărul 54 Numărul 53 Numărul 52 Numărul 51 Numărul 50 Numărul 49 Numărul 48 Numărul 47 Numărul 46 Numărul 45 Numărul 44 Numărul 43 Numărul 42 Numărul 41 Numărul 40 Numărul 39 Numărul 38 Numărul 37 Numărul 36 Numărul 35 Numărul 34 Numărul 33 Numărul 32 Numărul 31 Numărul 30 Numărul 29 Numărul 28 Numărul 27 Numărul 26 Numărul 25 Numărul 24 Numărul 23 Numărul 22 Numărul 21 Numărul 20 Numărul 19 Numărul 18 Numărul 17 Numărul 16 Numărul 15 Numărul 14 Numărul 13 Numărul 12 Numărul 11 Numărul 10 Numărul 9 Numărul 8 Numărul 7 Numărul 6 Numărul 5 Numărul 4 Numărul 3 Numărul 2 Numărul 1
×
▼ LISTĂ EDIȚII ▼
Numărul 58
Abonament PDF

Detecția drumurilor din imagini satelitare folosind Deep Learning

Bogdan Gliga
Associate Software Engineer @ Telenav



PROGRAMARE

Recent, rețelele neuronale adânci (Deep Neural Networks) au fost folosite pentru a genera rezultate de ultimă oră în numeroase subdomenii ale industriei procesării de imagini. Această categorie de algoritmi poate fi folosită pentru a extrage o cantitate semnificativă de informație din multe tipuri de imagini sau suporturi vizuale. Activitatea noastră se axează pe antrenarea unei rețele neuronale care să detecteze cu acuratețe drumurile, analizând zeci de mii de imagini provenind din satelit. În industria cartografierii, este crucial să existe hărți detaliate și corecte pentru a putea construi aplicații de stabilire a rutei de călătorie care să fie precise și de calitate. Primul pas în atingerea acestui obiectiv este detectarea tuturor drumurilor dintr-o anumită zonă. Celelalte informații relevante pentru trafic, adică restricțiile de viraj sau limitele de viteză, depind de cunoașterea infrastructurii subiacente de drumuri.

Progresele recente în domeniul tehnologiei imagistice aeriene fac posibil ca sateliții să furnizeze imagini de rezoluție înaltă în care să se poată distinge ușor de către oricine drumurile . Obiectivul este construirea unui sistem inteligent care, odată ce primește o imagine din satelit, poate să extragă topologia drumurilor cu acuratețe. În termeni tehnici, trebuie să generăm o predicție pentru fiecare pixel al imaginii sursă, anume probabilitatea ca acel pixel să facă parte dintr-un drum. Cercetarea academică numește această problemă segmentare semantică (Semantic Segmentation), deoarece imaginea trebuie segmentată în obiecte de interes. La final, odată ce pixelii sunt etichetați în funcție de drum, construirea rețelei de drumuri pentru uz ulterior devine o problemă comună.

Soluția

Pasul premergător în realizarea unui astfel de sistem este existența unui set mare de imagini și o topologie a drumurilor inclusă în fiecare imagine. Acest set de date va fi folosit pentru antrenarea rețelei neuronale adânci, pentru a o "învăța" să recunoască drumurile într-o imagine făcută din satelit. Există deja un set de date pentru această problemă specifică, "Massachusetts Roads Dataset". Un exemplu al modului de reprezentare din aceste imagini și topologii de drum este cel de mai jos:

Al doilea pas premergător este alegerea unei arhitecturi optime pentru rezolvarea problemei. Deoarece aici vorbim de o activitate de procesare de imagini, soluția noastră se bazează pe o versiune modificată a unei rețele neuronale convolutional (Convolutional Neural Network), creată special pentru analiza imaginilor.

Arhitectura

Arhitectura utilizată de noi seamănă cu arhitectura standard Deep Learning pentru acest tip de activitate, anume segmentarea semantică (Semantic Segmentation), care este explicată într-o lucrare scrisă de Long et al, cu titlul "Fully Convolutional Networks for Semantic Segmentation". O abordare similară este descrisă în Ronneberger et al "U-Net: Convolutional Networks for Biomedical Image Segmentation".

Pipeline-ul conține două etape: Convolutional Network și Deconvolutional Network. Scopul principal al etapei Convolutional Network este realizarea unei reprezentări reduse a imaginii. Acest lucru se realizează analizându-se secvențial fiecare sub-regiune și efectuându-se operații matematice complexe asupra valorilor pixelilor. La final, rezultatul obținut va reprezenta probabilitatea ca un drum să apară în fiecare din sub-regiunile analizate.

Următorul pas este luarea acestui vector de probabilitate și transformarea lui în topologia exactă a drumului. Mai exact, probabilitatea ca un drum să apară în fiecare sub-regiune se transformă în reprezentarea în pixeli a acelui drum. Această operație va fi efectuată în a doua parte a pipeline-ului, anume Deconvolutional Network. Pentru a realiza acest lucru, se vor efectua aceleași operații ca în primul stagiu, dar în ordine inversă. Acum, în loc să luăm o imagine și să aflăm un vector de probabilitate, luăm un vector de probabilitate și producem o imagine.

Rezultatele

După un antrenament de scurtă durată, de câteva minute, pe NVIDIA GTX 1080, se pot observa rezultate extrem de promițătoare, rețeaua putând să recunoască topologia drumului în mod eficient și corect. Mai jos, avem imaginile din satelit în partea stângă, topologia reală a drumului în mijloc, iar rezultatul rețelei neuronale în partea dreaptă.

Pe viitor, dorim să extragem topologia drumurilor din rezultatul rețelei neuronale, pe care să îl comparăm apoi cu drumurile deja existente în OpenStreetMap pentru a le adăuga pe cele care lipsesc. Dacă va fi disponibil un număr semnificativ de imagini de bună calitate realizate din satelit, acest fapt va însemna că mii de kilometri de drumuri lipsă vor fi adăugați în OSM, ceea ce va îmbunătăți calitatea hărții.

LANSAREA NUMĂRULUI 149

Marți, 26 Octombrie, ora 18:00

sediul Cognizant

Facebook Meetup StreamEvent YouTube

În aceeaşi ediţie ... (58)

▼ TOATE ARTICOLELE ▼

NUMĂRUL 147 - Automotive

Sponsori

  • Accenture
  • BT Code Crafters
  • Accesa
  • Bosch
  • Betfair
  • MHP
  • BoatyardX
  • .msg systems
  • P3 group
  • Ing Hubs
  • Cognizant Softvision
  • Colors in projects