TSM - A.I. în Product Design

Radu Chelariu - Product Design Manager @ Betfair Development Romania

Anul trecut, de IT Days, am avut plăcerea să fiu pe scenă preț de câteva minute prezentând câteva exemple practice despre modul în care un designer de produs digital ar putea să folosească noua suită de unelte generative de imagini, bazate pe A.I. Atunci, în noiembrie, Dall-E, Stable Diffusion și Midjourney 3 formau corul madrigal al noului val de A.I.

În doar patru luni, toate aceste trei unelte au lansat versiuni noi, iar spectrul de servicii și produse cu A.I. la bază a crescut exponențial. Astăzi putem genera video cu RunwayML, versuri cu LyricStudio, putem avea conversații întregi cu ChatGPT, putem genera modele 3d cu PointE, crea și lansa aplicații web cu Flatlogic sau să ne luăm la ceartă cu Bing.

Parcă în fiecare zi se mai lansează câteva zeci de noi servicii și aplicații cu A.I. în nume. Dacă are miros de dot com boom, probabil că nu e departe de adevăr.

O mare și-o sare, vă rog!

Dincolo de videouri de 15s pe Instagram și TikTok, sutele și miile de articole (ca și acesta) care discută subiectul A.I. cu iz de "jobul tău nu e în siguranță" (nu și acesta), realitatea e una mai degrabă gri decât neagră. Dar nu este, cu siguranță, așa de roz cum o văd alții - iertate-mi fie alegoriile cromatice. De ce?

Midjourney 4 încă nu e capabil să genereze un text coerent, Stable Diffusion încă generează persoane cu >45 de dinți (vizibili), iar Dall-E 2 încă are probleme în a genera altceva decât fețe umane.

ChatGPT nu distinge dacă informația pe care o are e corectă sau nu și nu învață atunci când încerci să-l lămurești. Bard oferă informație atât de incorectă încât e nevoie de intervenția manuală a echipelor de la Google ca să îl pregătească de o viitoare lansare publică, în timp ce Bing are explozii de frustrare și răspunde de parcă ar fi fost antrenat folosind răspunsuri de pe Reddit.

"Viața e ca un canal: ceea ce scoți depinde de ce pui în ea" - Tom Lehrer

Că veni vorba de antrenat, e important de menționat că toate aceste unelte sunt eminamente dependente de seturile de date cu care au fost antrenate. Eu, tu și majoritatea dintre noi nu avem petabytes de date despre arheologie, dendrologie, astronomie sau despre viteza aeriană a unei rândunici, pentru a putea să rulăm un ChatGPT local - că să nu mai vorbesc despre cerințele minime de sistem necesare să rulezi un astfel de mamut local.

Ceea ce creează două mari probleme:

Cine controlează deja baze de date semnificative și private are posibilitatea să ofere unelte pe bază de A.I. mai robuste și complexe decât eventuala competiție.
Calitatea datelor pe care A.I.-ul e antrenat determină direct calitatea serviciului. Ceea ce înseamnă că noi, utilizatorii, ne acordăm încrederea că datele folosite au fost corecte. Însă realitatea e că nici măcar echipele care construiesc acest unelte, nu știu dacă datele sunt corecte sau nu.

A.I. venit după design degeaba?

În lumea de Product Design, pe lângă cele trei generatoare de imagini menționate anterior, fac valuri o suită de pluginuri de Figma. De la Palette (generator de palete de culori având la bază Colormind), la MagiCopy (generator de texte de marketing), la Magician (generator de iconițe), până la Galileo (care promite designuri întregi pe baza unor prompturi text).

În urma unor teste non-exhaustive, majoritatea acestor unelte cad în două mari categorii:

Simpliste, dar precise - Ando, de exemplu, generează clar imaginea dorită, însă calitatea rezultatelor e departe de ceea ce ar putea face chiar și un intern.
Complexe, dar imprecise - MagicIcon, de exemplu, generează iconițe tehnic corecte, însă departe de intenția utilizatorului.

O categorie poate mai interesantă cuprinde, însă, uneltele ce promit generarea de design organizat în layere și grupuri - de exemplu, Prompt2Figma sau Galileo - ambele fiind servicii plătite și, momentan, în beta închis. O întrebare validă legată de această abordare are legătură cu cele două probleme menționate anterior: de unde vin, cât de multe sunt și cât de "corecte" sunt documentele de Figma care antrenează aceste unelte? Și oare creatorii acestora și-au dat consimțământul pentru acest tip de utilizare a datelor lor?

Dacă tot suntem la capitolul de subiecte dificile, vă relatez, pe scurt, povestea lui The Grid.

The Grid a fost un proiect care promitea exact același lucru: dai câteva prompturi text, mașina face magie și ce rezultă e un site funcțional 100%, cu un design unic, specific pentru proiectul tău. Doar că The Grid nu a fost altceva decât câteva videouri de prezentare, un alpha închis și vreo câteva milioane de dolari strânși, însă nici urmă de software public.

E o diferență destul de mare între ce vindea The Grid în 2014 și starea uneltelor de A.I. în 2023, dar e o poveste ce merită amintită într-un peisaj în care, parcă, în fiecare zi se lansează câte un serviciu nou ce promite să revoluționeze o industrie sau alta, desigur mulțumită sfintei "intelighențe artifichiale".

Ai, n-ai, A.I., pietrele rămân.

Fie că acceptăm sau nu, uneltele bazate pe A.I. în practicile noastre sunt aici, nu dispar în curând, iar progresul lor este încă incredibil de accelerat.

Totodată, îmi permit să lansez o previziune: aceste unelte nu vor să ne înlocuiască, ci mai degrabă să ne câștige timp și să deschidă drumuri noi și interesante către ceea ce ne definește umanitatea: imaginație și creație.

Până atunci, am toată încrederea că vom vedea și o mișcare opusă acestor noi unelte, similară cu Arts & Crafts de la sfârșitul secolului al XIX, împotriva revoluției industriale, a cărei valoare să fie exprimată simplu: "100% made by humans".