În contextul României actuale, de multe ori ne batem de un mare impediment: statul! Acolo apar uşi închise la propriu şi la figurat sau ne sunt puse piedici invizibile, dar totuşi pregnante. Însă dacă vorbim despre un context global, lucrurile pot părea mai simple în alte părţi ale lumii şi pot fi constatate de la mii de kilometri sau mile distanţă. Aşa că vă propun să facem împreună o incursiune în ceea ce înseamnă accesul la anumite informaţii, provenind de la instituţii publice din Statele Unite ale Americii.
Aşa cum este binecunoscut de către cei care fac parte din aceeaşi breaslă cu Telenav, noi ne îndreptăm toată atenţia spre crearea unor sisteme de navigaţie pentru maşini, iar scopul muncii noastre poate fi rezumat cel mai bine prin sloganul pe care îl avem: "Transforming life on the go for millions of people around the world." Pentru a reuşi să realizăm acest lucru s-a adoptat o soluţie open source care are numeroase beneficii, printre care cel mai important este faptul că hărţile se pot actualiza la minut, ceea ce este foarte diferit faţă de abordările altor companii cu acelaşi profil de activitate. Motivul din spatele acestei frecvenţe cu care se poate actualiza harta, este dat de faptul că oricine poate să editeze sau să contribuie la optimizarea hărţii, deoarece există o comunitate foarte mare de utilizatori care folosesc datele OpenStreetMap (OSM), acestea fiind datele pe care le folosim şi noi. Telenav lucrează strâns cu comunitatea menţionată anterior pentru a îmbunătăţi caracteristicile specifice necesare navigării şi pentru găsirea celor mai bune metode prin care să creeze o hartă detaliată şi corectă.
Unul dintre proiectele la care lucrăm de aproximativ un an, constă în optimizarea hărţilor în zonele principale din Statele Unite ale Americii. Printre aspectele pe care le avem în vedere în realizarea unei hărţi se numără importanţa existenţei numelor străzilor în sistemul de navigaţie şi actualizarea lor în cazul în care s-au modificat în timp. Astfel ne asigurăm că se efectuează o rutare corectă spre punctul de interes, se evită drumurile suplimentare pentru găsirea unei destinaţii şi se diminuează timpul necesar parcurgerii unei rute.
În acest scop există etape premergătoare adăugării lor ca date de hartă.
Primul pas este studierea zonelor pentru a identifica numele existente care au fost adăugate de către comunitatea de useri OSM, pentru a detecta informaţiile care lipsesc.
Apoi începe procesul de research al datelor de tip open source, realizat la trei nivele diferite:
La nivelul administraţiei locale al fiecărui oraş important dintr-o anumită zonă;
La nivelul administraţiei locale al fiecărui judeţ;
Pentru a fi mai pe înțeles, dacă se doreşte de exemplu adăugarea numelor străzilor pentru statul Florida, se caută datele open source pe site-urile primăriilor la nivelul oraşelor principale, apoi la nivelul judeţelor şi ca ultim pas se identifică datele disponibile pe portalul data.gov corespunzătoare fiecărui stat în parte. În cazul nivelelor prezentate anterior, se solicită aprobarea utilizării informaţiilor de care dispun.
Ceea ce poate frapa un utilizator român care interacţionează online cu administraţiile din SUA este gradul ridicat de receptivitate de care acestea dau dovadă, întrucât majoritatea răspund în aceeaşi zi în care sunt contactaţi, exprimându-şi permisiunea de a le folosi datele, disponibilitatea lor în cazul în care avem nevoie de suport adiţional pentru înțelegerea completă a formatelor fişierelor sau atributelor acestora, dar totodată nu îşi reprimă entuziasmul venit din interesul nostru pentru informaţiile pe care ei le deţin şi scopul în care urmează să fie folosite.
Cu toate acestea, există uneori şi situaţii în care nu primim niciun feedback, iar atunci se trece la următorul pas:
Folosirea unei surse de date publice cu acoperire la nivelul întregii ţări care conține caracteristici de tip geografic şi poartă denumirea de Tiger.
După ce se intră în posesia datelor gratuite, este important ca ele să fie utilizate într-un mod cât mai smart cu putinţă. Întrucât încărcarea lor în hartă şi compararea cu informaţiile existente poate constitui un proces anevoios şi ineficient, s-a creat un tool numit Cygnus+ care are menirea să compare datele open source cu atributele din OSM.
Pentru a soluţiona aceste diferenţe se utilizează un translation file scris în limbaj Python, care creează o legătură între datele locale şi limbajul OSM.
Folosirea fișierului de translaţie, împreună cu Cygnus+ generează un fișier xml care conţine doar segmentele care sunt diferite comparativ cu datele din OSM, având următoarele taguri:
\<tag k="telenav:cygnus-plus" v="CHANGED"/\>
Apare în situaţia în care numele există în OSM, însă în datele locale este diferit. \<tag k=”telenav:cygnus-plus” v=”NEW”/\>
În cazul în care în OSM lipseşte complet numele unui drum.
Pentru scopul proiectului s-au atribuit numele drumurilor care nu aveau deloc această informaţie. Odată cu începerea verificării fişierelor obţinute, s-a constatat că o parte din informaţii nu pot fi adăugate, deoarece sunt alcătuite din denumiri de magazine sau numele conţin caractere neobişnuite, cum ar fi anumite simboluri. La aceste situaţii se adaugă şi cele în care se revizuiesc outputurile la câteva zile după ce au fost generate, însă alţi utilizatori deja editaseră foarte recent zona respectivă.
Întreg procesul a angrenat 13 map analişti care au facut researchul pentru a identifica datele necesare şi a le rula cu Cygnus+. Apoi editările au fost realizate în total de douăzeci dintre colegii de departament.
Hartă comparativă între datele existente în OSM şi datele procesate cu Cygnus+
Munca depusă de către angajaţii Telenav aduce numeroase beneficii întrucât este cunoscută de întreaga comunitate de utilizatori OpenStreetMap prin intermediul postărilor de pe Github, dar şi a challenge-urilor de pe Maproulette care sunt menite să creeze transparenţă între task-urile noastre şi utilizatori, şi de asemenea să îi încurajeze pe aceştia să contribuie alături de noi în procesul de conturare a unei hărţi de calitate superioară.
O idee despre ceea ce a presupus efortul realizat de echipa map analyst este surprins după cum urmează:
Număr surse de date locale identificate | Număr surse de date locale aprobate |
---|---|
314 | 101 |
Număr de mile editate din date locale | Număr de mile revizuite din date locale |
4354 | 6234 |
Număr de mile editate din date Tiger | Număr de mile revizuite din date Tiger |
3432 | 4887 |
Astfel putem concluziona că accesul la date open provenite de la administraţiile publice şi locale joacă un rol important în îmbunătăţirea calităţii hărţilor, iar deschiderea autorităţilor în acest sens, constituie un factor cheie. De asemenea, datele provenind din Tiger sunt accesibile pentru orice utilizator OSM, însă calitatea lor nu o depăşeşte pe cea din sursele locale.
Drept rezultat al întregului procedeu descris se constată că în ciuda timpului îndelungat care trebuie investit pentru a parcurge fiecare dintre paşii menționaţi, beneficiile sunt văzute atât la nivel de companie cât şi prin ceea ce reușim să oferim la rândul nostru întregii comunităţi OpenStreetMap, după îmbunătăţirea informaţiilor din hartă, astfel ajungând la o situaţie de tip win-win.