A existat multă publicitate exagerată în jurul unor concepte precum deep learning, ensembles (ansambluri) sau bagging (ambalare) în ultima perioadă. Aceste subiecte sunt în prezent unele dintre cele mai în vogă în învățarea automatizată - Machine Learning (ML).
Intenția mea inițială a fost de a scrie despre deep learning, nou cuvânt cu rezonanță în cercurile tehnice, dar mai apoi am decis să îmi schimb puțin pălăria de statistician și mai degrabă să mă concentrez pe rolul ML din perspectiva conducătorilor de business și produs.
În acest sens, voi prezenta nevoile unei afaceri în prezent - un scenariu - care pot fi ajustate cu abordări ale învățării automatizate. Ca și al doilea obiectiv, vreau ca acest articol să fie un argument sau punct de sprijin atunci când dorim să răspundem la următoarele întrebări: (1) Machine Learning presupune multe date? (2) Machine Learning) presupune o mare putere a computerului?
Atunci când vine vorba de ML, am luat în considerare întotdeauna trei părți implicate principale, cu puncte de vedere foarte diferite, care pot fi implicate într-un proces de dezvoltare de aplicații constructiv. Prima parte interesată este reprezentată de oamenii de știință ai datelor, care sunt foarte interesați de puterea și acuratețea instrumentelor. A doua categorie include dezvoltatorul software, care este concentrat pe performanța aplicației (viteză, scalabilitate, etc.). A treia și cea mai importantă parte implicată dintr-o perspectivă pragmatică este omul de afaceri care dorește de fapt o soluție pentru o anumită problemă reală.
Marii furnizori de software consideră ML o piață mare de bani și de aceea există mulți furnizori de instrumente și platforme de machine learning, precum SAS și IBM pentru analitică, Oracle sau Amazon pentru soluții cloud, etc. Dintr-o perspectivă a afacerii, acest instrument poate ajuta la soluționarea problemelor, dar eu consider mai important domeniul specific de cunoaștere în care este aplicat. Know-how -ul în domeniu este un ingredient fundamental în construirea de soluții pentru probleme reale.
Punerea întrebărilor potrivite, adunarea presupunerilor corecte și succesul măsurătorilor este, în cele mai multe cazuri, rolul și centrul atenției părților interesate ML care au o mentalitate business. Oamenilor de știință ai datelor și dezvoltatorilor software le pasă uneori de reclama de marketing, referințele sau reputația instrumentelor sau abordărilor ML. Pe de altă parte, valoarea ML este lăudată de persoanele de afaceri pe baza contribuțiilor sale sau a realizărilor dovedite.
În continuare, voi prezenta cum R poate fi utilizat într-o problemă ML într-un scenariu business curent: gestionarea veniturilor pentru hoteluri și optimizarea beneficiilor. R este un limbaj de programare și un mediu open source. El sprijină calculul statistic și învățarea automatizată. Pachetul Caret dezvoltat de Max Kuhn este favoritul meu, dar mai există multe altele. R este "arma" aleasă de mine, iar următoarele exemple vor face referire la biblioteci diferite. Unele similare pot fi găsite în Python, Java sau alte limbaje de programare, dar, rezumând din nou, punerea întrebărilor potrivite și găsirea datelor corecte atunci când implementăm o metodologie bună, sunt elemente mai importante în punerea în folosință a unei soluții ML bune.
Machine Learning are cel puțin trei aplicații în managementul beneficiilor în general și în strategiile de gestionare a veniturilor pentru hoteluri, în particular:
A. Segmentarea pieții: Clienții diferiți sunt dispuși să plătească prețuri diferite pentru aceeași cameră. Un manager de hotel știe că 20 de camere cu 400 euro/ zi aduc același venit ca și 40 de camere cu 200 euro pe zi, dar scopul lor principal este maximizarea profitului, ceea ce implică identificarea segmentelor de piață și descoperirea segmentelor țintă potrivite care pot fi servite: ex. 30 de camere cu 300 euro/zi. Obiectivul principal al hotelului atunci când utilizează segmentarea este să descrie și să anticipeze valoarea creată pentru clienți în diferite segmente și să îi vizeze într-un mod eficient.
În acest sens, tehnicile ML precum clasificatorii ajută managerii de hoteluri să găsească clienți cu adevărat rentabili. Acești clienți sunt cei mai potriviți și cei mai aliniați cu propunerea de valoare a hotelului. Pachetul Caret de la R implementează și oferă documentație de sprijin pentru cele mai rafinate instrumente de clasificare - Naive Bayes, Bagged AdaBoost, etc. 1
B. Previziunea - cererea de camere nu este sigură în viitor și singura modalitate de a prezice cu o anumită probabilitate este aplicarea tehnicilor de previziune2. Multe hoteluri încep să ia în considerare sisteme computerizate de management al veniturilor. Previziunile lor nu sunt perfecte, dar sunt mai bune decât nimic. Aceste sisteme ajută la cunoașterea comportamentului clienților, descrierea caracterului sezonal al cererii și prezicerea numărului de oaspeți. Managerii de hotel pot, de asemenea, prezice costurile, identifica provocările și se pot adapta cererii de pe piață, din regiune sau sezon.
Cererea înregistrată este afectată de decizia business și nu reflectă cererea reală. În vocabularul de management al veniturilor, "cererea liberă" este cantitatea care ar putea fi vândută dacă nu ar exista limitări precum cele de livrare a producției sau limitarea impusă de capacitate. Hotelurile ar trebui să identifice când cererea liberă este peste capacitatea hotelului. Aceasta este o parte importantă a strategiei de management al veniturilor unui hotel. În general, informațiile vin din sistemul de rezervări computerizat, iar aceasta se numește "cerere constrânsă". Pe de altă parte, o situație ideală, atunci când oferta este nelimitată, este considerată "cerere nelimitată/liberă"3. Instrumentele și statistica ML pot ajuta la descrierea "cererii libere".
RM2 este un pachet R dezvoltat de Tudor Bodea (InterContinental Hotels Group), care implementează funcții utilizate în gestionarea veniturilor (ex. funcția EM eliberează cererea de constrângeri, folosind algoritmul de Așteptare - Maximizare)4. Pe de altă parte, "forecast" și "zoo" sunt doar două dintre cele mai populare pachete R care implementează previziunea și seriile temporale.
C. Poziționarea prețurilor și politica de prețuri: Obiectivul cheie al unei strategii de stabilire a prețurilor este să anticipezi valoarea creată pentru clienți și apoi să stabilești prețuri specifice pentru a capta acea valoare. Hotelurile pot adopta diferite politici de preț pentru a întări percepția de valoare pentru clienți.
Tactica implică crearea unor instrumente de fixare a prețului care se schimbă în mod dinamic pentru a reacționa la modificările cererii și pentru a aduce câștig în mod continuu. Optimizarea prețului implică reglarea fină a unor variabile multiple precum elasticitatea prețului și prețul de inventar pentru a maximiza profitul și nu neapărat veniturile 5. Machine Learning implică găsirea unor tipare în date și utilizarea acelor tipare pentru a prezice viitorul. Învățarea tiparului cererii și stabilirii prețurilor înseamnă identificarea și recunoașterea acelor tipare atunci când le vedem din nou. Optimizarea are un rol foarte important în acest proces. În centrul său, managementul beneficiilor implică un control strategic al inventarului, pentru a-l vinde clienților potriviți la momentul potrivit și pentru prețul corect. În limbaj matematic, gestiunea inventarului poate fi încadrată într-o problemă de optimizare. "Mecanicul" din spatele învățării automatizate pentru gestiunea veniturilor implică câțiva pași fundamentali: în săptămânile cu cerere mare, limitați rata de discount și rezervările de grup, pentru a crește beneficiul general (rata medie) și venitul. În săptămânile cu cerere scăzută, vindeți camerele goale la orice preț scăzut, pentru a crește factorii de randament și câștig. Maximizarea venitului presupune un echilibru între factorii beneficiu și randament6.
În acest moment nu voi menționa nici un pachet R, chiar dacă R are multe librării de optimizare. Acum vreau doar să subliniez că nu există cutii vrăjitorești care să ne poată ajuta să ne meșteșugim cel mai eficient instrument de stabilire a prețurilor. Doar practica, răbdarea și munca din greu s-ar putea să ne ajute…
ML este un proces iterativ care este rulat până când se obține modelul care face previziuni bune. Modelul de venit al hotelului s-ar putea să implice adesea reglaje fine sau reconstrucție atunci când descrește puterea sa predictivă sau acuratețea. Gestionarea veniturilor nu este un subiect recent. A fost și este o practică business obișnuită în ultimii cincisprezece ani. ML este utilizată, pe lângă hoteluri, în multe alte industrii, precum cea a companiilor aeriene, închirierilor sau în inventarul reclamelor online.
Întorcându-ne la întrebările de la începutul articolului, aș răspunde așa:
Machine learning (învățarea automatizată) nu necesită întotdeauna multe date pentru a funcționa. Volumul de date al hotelului nu este prea mare. Bineînțeles, sistemele de rezervare online și motoarele de recomandare pot furniza date suplimentare, dar tehnologiile din prezent pot produce rezultate și singure.
Applied Predictive Modeling, ediția 2013. New York: Springer, 2013. ↩
2 Essentials of Marketing Research, ediția a 3-a. New York, NY: McGraw-Hill Education, 2012. ↩
"What is unconstrained demand? definition and meaning," BusinessDictionary.com. [Online]. Disponibil: http://www.businessdictionary.com/definition/unconstrained-demand.html. ↩
T. B. & D. K. & M. Ferguson, RM2: Revenue Management and Pricing Package. 2008. ↩
How to Price: A Guide to Pricing Techniques and Yield Management. Cambridge ; New York: Cambridge University Press, 2008. ↩
Yield Management: Strategies for the Service Industries, ediția a 2-a. Cengage Learning EMEA, 2001. ↩
de Ovidiu Mățan
de Cristina Juc
de Ioana Luțaș
de Ovidiu Mățan