TSM - Machine learning și Java - interviu Klevis Ramo

Ovidiu Mățan - Fondator @ Today Software Magazine

Care credeți că sunt avantajele și dezavantajele folosirii Java în dezvoltarea Machine Learning, comparativ cu alte limbaje precum Python?

Klevis Ramo: În general, Machine Learning a fost cunoscut ca un domeniu de cercetare dedicat studiilor doctorale, informația fiind disponibilă doar în anumite medii academice.  Mai mult, din cauza rezultatelor limitate din trecut, gradul de aplicabilitate și utilizarea efectivă a rezultatelor au fost restrânse. Azi, odată cu Deep Learning constatăm că există rezultate cu aplicabilitate în foarte multe domenii, de la recunoașterea obiectelor la recunoașterea vorbirii. Dezvoltarea aplicațiilor bazate pe Deep Learning devine din ce în ce mai ușoară, deoarece instrumentele și hardware-ul se dezvoltă continuu și există mai multe date ce pot fi utilizate. 

Ce fel de instrumente și framework folosiți în recunoșterea obiectelor?

Klevis Ramo: De obicei, majoritatea rețelelor deja antrenate provin din soluții Python precum Keras,Tesnorflow. Cu siguranță, aceste instrumente și paradigme trebuie cunoscute pentru a putea înțelege și reutiliza lucrările existente. O cunoaștere detaliată a acestor paradigme nu este necesară, iar paradigme Java precum deeplearning4j vă oferă tot ce aveți nevoie pentru a dezvolta aplicații în producție. Tensorflow oferă printre altele un API Java pentru aplicațiile mobile pe Android. Când discutăm de etichetarea datelor, totul depinde de contextul avut în vedere. De exemplu, pentru Object Detection acest tool este opțiunea cea mai bună: https://github.com/puzzledqs/BBox-Label-Tool

Credeți că am putea avea mașini autonome, care să folosească Java pentru procesarea informațiilor?

Klevis Ramo: Deep Learning, așa cum vom vedea în prezentare și detaliat în cadrul atelirului, este portabil între limbaje și paradigme datorită transferului de conținut învățat (Transfer Learning). Luând în considerare stabilitatea oferită de Java și faptul că totul va trebui migrat spre NVIDIA C CUDA, nu văd niciun motiv pentru care să nu putem folosi Deep Learning. Pe măsură ce Deep Learning devine din ce în ce mai familiar pentru inginerii software, vom vedea din ce în ce mai mult limbajul Java și Deep Learning în special pentru Android și alte sisteme Java existente. Pentru ca Deep Learning să devină o forță, trebuie să apeleze mai mult la Java, așa cum vedem în povestea de succes a Android.

Cât de precise sunt modelele curente, cu care lucrați?

Klevis Ramo: Majoritatea rețelelor folosite la prezentare și atelier folosesc Transfer Learning pentru a reutiliza modele antrenate deja în alte limbaje precum Tensorflow, Keras etc. ... Astfel, ne asigurăm că păstrăm acuratețea datelor din lucrarea originală. De exemplu, Java Autonomous Driving se bazează pe lucrarea YOLO.

Unul dintre articolele dvs. prezintă generarea artei computizării. Spuneți-ne mai multe depre tehnică și rezultate.

Klevis Ramo: Pe lângă faptul că este un subiect atractiv și fascinant, transferul neuronal oferă informații valoroase despre impactul straturilor convolutive adânci (deep convolution layers) în învățare. Cu cât mergem mai adânc în straturile unei rețele, cu atât detectăm mai în detaliu neuronii, ceea ce ne permite să identificăm trăsături de nivel înalt precum fețe, mașini, roți. Prin comparație, straturile inițiale/superficiale ale unei rețele identifică doar trăsături precum linii, forme simple, culori. Având aceste informații, permitem unei rețele neuronale să combine trăsăturile de nivel jos dintr-o imagine artistică cu trăsăturile de nivel înalt dintr-o fotografie. Rezultatele sunt foarte interesante, deși obținerea unei rezoluții mai mari va necesita mai multă putere de procesare GPU (așa cum vom explica la atelier).

Veți fi speaker la ediția IT Days de anul acesta și veți avea, de asemenea, un workshop. Povestiți-ne mai multe despre acestea.

Klevis Ramo: În cadrul prezentării vom discuta despre problemele apărute la detecția mașinilor, a semafoarelor și a persoanelor în cadrul unui video, în timp real, folosind CPU (arhitectură asincronă). Atelierul acoperă în detaliu intuiția din spatele modelelor Deep Learning și cum putem folosi această informație pentru a crea aplicații Java reale. Majoritatea tehnicilor și a conceptelor folosite la curs sunt destul de noi (\<2 ani), dar intens utilizate în industrie. Nu sunt necesare cunoștințe anterioare sau matematice. S-ar putea să vă surprindă cât de superficial poate fi Deep Learning, de fapt. Cunosc din proprie experiență obstacolele pe care le poate întâlni un programator Java în ceea ce privește Deep Learning, deci cred că pot transforma această călătorie într-o experiență extraordinară..