TSM - Cercetare AI locală folosită în viitoarele procesoare Intel - Interviu cu Răzvan Florian

Ovidiu Mățan - Fondator @ Today Software Magazine


Stăm de vorbă cu Răzvan Florian, cercetător la Institutul Român de Ştiinţă și Tehnologie din Cluj-Napoca. Tehnologia realizată de acesta și expusă acum zece într-un articol de cercetare, a fost recent valorificată și implementată în procesarea Intel. Oferă-ne câteva detalii despre această tehnologie, Răzvan.

Răzvan Florian: Este vorba de niște reguli de învăţare prin întăriri pentru reţelele neuronale cu pulsuri. E vorba de modele neuronale care, precum neuronii din creier, prezintă informaţia la momentul de timp în care emit niște pulsuri. Pornind de la aceste reguli de învăţare, Intel a înglobat recent în niște procesoare neuromorfice niște componente ale acestor reguli de învăţare numite eligibility traces care permit ca regula de învăţare în întregimea ei să fie rulată pe aceste procesoare specializate. Ideea este că noile procesoare care folosesc aceste tipuri de neuroni cu pulsuri pot să proceseze informaţia cu un consum de energie de până la 1000 de ori mai mic decât procesoarele clasice, prin faptul că fac o procesare foarte paralelizată cu niște unităţi care fac ceva foarte simplu individual, dar care prin cooperare pot să facă diverse procesări ale informaţiei.

După această realizare, în ce alte domenii ai continuat cercetarea pe inteligenţă artificială?

Răzvan Florian: Între timp am dezvoltat și alte reguli de învăţare pentru reţelele neuronale cu pulsuri. Cea despre care vorbeam eu era bazată pe întăriri. Am mai făcut și niște reguli de învăţare supervizată, așa numitul cronotron, iar mai recent am început să utilizez reţelele neuronale profunde (Deep Learning). Ne propunem să construim niște agenţi inteligenţi care în interacţiunile cu mediul să înveţe structura acestui mediu, să creeze niște modele ale mediului. Așa cum copiii, jucându-se, încep să înveţe lumea din jurul lor, așa cum cercetătorii făcând experimente dezvoltă modele complexe ale lumii înconjurătoare care ne permit să facem predicţii, tot așa agenţii care interacţionează cu mediul trebuie să înveţe despre acesta. Unul dintre aceste medii poate fi calculatorul, iar agentul este cel care învăţă să controleze calculatorul, practic învaţă să programeze calculatorul. Așadar, mergem în direcţia învăţării automate (Machine Learning), în domeniul generării automate de software, în particular generarea automată de site-uri web sau interfeţe bazate pe coduri similare cu HTML.

Ce limbaje de programare folosiţi, ce frameworkuri? Mergeţi pe Java?

Răzvan Florian: În Machine Learning, cel mai comun framework este TensorFlow, dezvoltat de Google, un proiect open source unde se programează în Python. În trecut, când trebuia optimizată performanţa computaţională a calculatorului, foloseam C++.

Ce alte proiecte sunt în desfășurare la Institutul Român de Ştiinţă și Tehnologie?

Răzvan Florian: Pe lângă acest proiect care vizează dezvoltarea automată de software, avem un alt proiect în care o echipă de aproximativ de zece persoane lucrează la folosirea unor metode bazate pe o matematică ne-euclidiană pentru a îmbunătăţi performanţa învăţării profunde prin folosirea unor tipuri de gradiente mai adaptate datelor cu care se lucrează.

Este foarte interesant. Sperăm să discutăm despre astfel de proiecte și pe viitor.

Răzvan Florian: Mulţumesc și eu.