Ediția 2013 a congresului IEEE Evolutionary Computation (CEC) s-a desfășurat in Mexic, Cancun - un decor cel puțin exotic pentru noi, europenii. Pe lânga locația atrăgătoare, merită precizat și faptul că CEC este una dintre cele mai mari și importante conferințe, având ca subiect principal calculul evolutiv - dând astfel cel putin două motive pentru participarea la eveniment entuziaștilor metodelor de calcul evolutiv, printre care mă număr și eu.
Peste 200 de cercetători, profesori, doctoranzi, cu preponderență din America si Asia, au luat parte la eveniment, pentru a-și prezenta rezultatele, dar și pentru a beneficia de șansa unică de a schimba idei și a începe noi colaborări cu nume celebre din domeniu. Lumea companiilor IT a fost reprezentată aproape imperceptibil, eu fiind proabil singura reprezentantă a industriei - mediul academic conduce detașat în domeniul descoperirilor prin tehnici si metode specifice IT-ului, fără suportul companiilor de profil, din nefericire.
Subiectele funcționale abordate la conferință acoperă o gamă foarte variată: biochimie, biologie, medicină, economie, teoria jocurilor, meteorologie, etc. Aplicațiile algoritmilor evolutivi reușesc sa îmbrace experimentele de hibridizare și optimizare a unor metode cunoscute în așteptarea unor descoperiri importante sau, pur și simplu, a unui software performant ce ar micșora numarul erorilor umane ca urmare a interpretărilor - de exemplu, aflarea tipului unei tumori prin analiza unei radiografii. Posedând cunoștințe de bază despre calculul evolutiv, asistarea la prezentările de la CEC aduce noi perspective asupra domeniului, dar și deschide apetitul de cercetare orientată pe aplicabilitate.
Aplicațiile financiare din cadrul CEC au fost orientate în mod exclusiv pe domeniul previzunilor acțiunilor la bursă. Chiar de la începutul prezentărilor, autorii recunoșteau hazardul abordării unei asemenea tematici, datorat scepticismului multora asupra existenței unui tipar în fluctuațiile financiare, sau unei linii fine între legalitate și ilegalitate. Ipoteza pieței eficiente (Efficient Market Hypothesis - EMH) încurajează scepticii, susținând că informația este imediat disponibilă tuturor participanților, iar prețurile acțiunilor reflectă instant starea curentă a pieței. EMH presupune ca toți participanții la bursă pot obține același câștig, indiferent de experiența lor în domeniu deoarece prețurile sunt complet aleatorii. Makiel, în "The Efficient Market Hypothesis and Its Critics", explică cum EMH respinge utilitatea analizei tehnice sau fundamentale - metode de bază încorporate în aplicațiile de acest tip cu o rată de succes ce reușește să aducă îndoială asupra validității EMH. În ultimul timp, investitorii folosesc în mod independent analiza fundamentală, folosind indici macroenomici, cursul valutar, sau analiza tehnică, folosind prețul acțiunilor și volumul tranzacțiilor. Analiza tehnică pe date istorice ale bursei este utilizată în aplicațiile prezentate la CEC 2013, ele diferențiindu-se prin algoritmi de optimizare folosiți - programare genetică, căutare tabu. Metodele de optimizare din lucrarile ce fac scopul acestui articol funcționează pe structuri interne, dar toate țintesc spre a răspunde utilizatorului dacă un pachet de acțiuni merită cumpărat sau vândut și ce profit îi va aduce această operațiune.
Kampouridis et all. în "Metaheuristics Application on a Financial Forecasting Problem" propune hibridizări peste firul principal al algoritmului unei aplicații ajunse deja la versiunea 8, EDDIE (ED), ce a făcut obiectul cercetării lui pentru mai mulți ani. ED are la bază o versiune a programării genetice ce încearcă să genereze strategii optime de tranzacționare. Algoritmul folosește ca date de intrare valorile analizei tehnice aplicate asupra datelor istorice (prețul zilnic de închidere și indici tranzactionali), valorile efective ale prețului pe o perioada delimitată și rezultatul clasificării istorice ( 1 - decizia de cumpărare, 0 - decizia de a nu cumpăra). Indicii analizei tehnice folosiți sunt: "media în mișcare" (MA), "trade break out" (TBR), "filtru" (FLR), "volatilitate" (Vol), "momentum" (Mom), și "media în mișcare pe momentum" (MomMA). Valorile indicilor implicați în algoritm sunt calculate pentru un anumit număr de zile, pe termen scurt și pe terment lung. În ED7 valorile de calculare a indicatorilor tehnici erau fixe, 12, respectiv, 50 de zile - aceste perioade fiind preluate direct din modul cotidian de lucru al analiștilor economici. Structura de optimizat a algoritmului este un arbore genetic de decizie constrâns de gramatica următoare:
::= if-then-else |
::= "AND" | "OR" | "NOT" |
::= MA12 | MA50 | TBR12 | TBR50 | FLR12 | FLR50 | Vol12 | Vol50 | Mom12 |
Mom12 | MomMA12 | MomMA12
::= < | > | =
::= numar rațional
::= 0 | 1
Un arbore descris de gramatica anterioară reprezintă o soluție pentru o decizie tranzacțională pentru un pachet specific de acțiuni. Un set de astfel de decizii este evaluat prin calcularea proporțiilor între deciziile corecte și cele greșite, cu diferite ponderi - eroarea într-o decizie de cumpărare având cea mai mare pondere. Algoritmul genetic din ED7 generează arbori dintr-un spațiu de căutare limitat de perioada fixă de aplicare a indicilor tehnici; însă cu ED8 perioadele devin variabile, deschizând astfel spațiu de căutare și evitând o convergență prea rapidă. Rezultatele ED8 au fost raportate a fi promițătoare, dar eficiența căutării a scăzut, de aceea, pentru a menține diversitatea soluțiilor, dar în același timp, pentru a recupera eficiența căutării, meta-euristici de căutare au fost implicate în algoritm pentru a optimiza caracteristici punctuale are arborilor: variabilele ce descriu noile perioade de calculare a indicilor tehnici. Simulated annealing (SA) este un algoritm ce permite alegerea unei soluții mai puțin bune cu o anumită probabilitate (pentru evitarea găsirii unui optim local); în ED8, SA se aplică nodurilor limitrofe ale unor arbori aleatorii din populație, modificând perioada cu o valoare din intervalul [-10, +10]. Căutarea tabu (TS) este o meta-euristică ce forțează căutarea unei soluții mai bune să nu se întoarcă la soluții vizitate creând din acestea o lista tabu cu o existență limitată; în ED8, TS se aplică în același mod ca SA.
Această aplicație a fost testată față de 10 seturi de date obținute prin finance.yahoo.com. Dacă ED8 era capabil sa ofere în medie o rată a corectitudinii de 0.5735 pentru 10 seturi de date, și pentru cele mai bune soluții 0.75, ED8-SA întoarce 0.5773 pentru aceleași date, iar cea mai bună soluție 0.81; ED8-TS întoarce 0.5591, iar cea mai bună soluție 0.81. Din rezultatele tocmai enunțate, îmbunătățirea nu e remarcabilă la nivel de medie, însă investitorii care ar folosi aplicația cu siguranță vor cauta cea mai bună soluție, astfel noi hibrizi devin eficace.
Kuo et all. în "Dynamic Stock Trading System based on Quantum-Inspired Tabu Search Algorithm" vine cu un sistem dinamic ce e capabil să genereze într-un context real strategii complete - vânzare și cumpărare. Algoritmul de bază al aplicației, o formă nouă pentru căutarea tabu, având concepte împrumutate din fizica cuantică, a fost dezvoltat de aceeași echipă. Ideea algoritmului este de a asigna fiecărei soluții posibile o matrice cuantică, fiecare caracteristică a soluției având o valoare din intervalul [0,1] - probabilitatea cuantică. Căutarea tabu se traduce în acest context prin actualizarea matricilor tuturor soluțiilor prin scăderea ponderilor din matrici pentru caracteristicile din cea mai slabă soluție, respectiv, prin creșterea ponderilor pentru caracteristicile din cea mai bună soluție. Dinamismul aplicației este dat prin aplicarea conceptului de fereastra glisantă (sliding window) - seturile de date de antrenament de la o iterație la alta se modfică, în același timp cu seturile de test. Din teoria economică, se aleg din nou indici de analiză tehnică, cu perioade fixe de aplicabilitate per indice. Alegerea unor indici reprezintă o strategie de cumpărare/vânzare, o soluție. O soluție este apreciată prin estimarea profitului în valută și număr de acțiuni. Evaluarea sistemului s-a făcut pe date istorice, în comparație cu alte soluții propuse în trecut. Simulările prezentate în lucrare raportează pentru unele seturi de date un profit maxim de 69.94%, față de doar aproximativ 14% pentru alte implementări pe aceleași date.
Cele două aplicații descrise anterior sunt comparabile doar la nivel de domeniu de aplicabilitate, întrucât prima dintre ele oferă doar un mecanism de suport al deciziilor investitorilor, iar cea de-a doua, un software complex și independent. La nivelul implementării, cele două se aseamănă prin utilizarea indicilor de analiză tehnică ca suport decizional. Din punct de vedere algoritmic, cele două propuneri suferă la capitolul de dimensionare a spațiului de căutare - Kampouridis îl extinde foarte mult, iar Kuo, aș putea spune, îl ține foarte bine controlat (deși autorii nu intra în detalii). Aceste comparații sunt făcute doar cu scopul de a indica diversitatea abordărilor ce poate rezulta în soluții performante, nu ca o recenzie a acestor lucrări foarte apreciate de audiență la CEC.
Ca notă de final, de inspirație lirică, participarea la CEC 2013 a fost o experiență unică prin numărul mare de idei și metode noi prezentate, prin numărul mare de participanți doritori de discuții și dezbateri la nivel algoritmic, prin organizarea demnă de invidiat a organizatorilor, și prin tot exoticul oferit de locația conferinței. Asemenea conferințe se organizează anual - următoarea ediție CEC 2014 va fi în Beijing, China. Așadar, cercetați!