
Come fanno i siti online a stabilire i nostri gusti e le nostre preferenze?
Chi tra voi si sta immaginando algoritmi complicati e simboli arcani, resterà sorpreso nel leggere che le idee matematiche coinvolte sono relativamente semplici e alla portata di chi abbia anche solo una piccola infarinatura di indici di correlazione, calcolo di probabilità e angoli tra vettori. Questi algoritmi si basano sulle recensioni o indicazioni di interesse che noi utenti forniamo consapevolmente (per esempio, ricerche specifiche di oggetti e prodotti, rating di prodotti) o inconsapevolmente (click, visualizzazioni di annunci, tempi passati su una pagina web, o simili). Secondo il volume Recommender Systems di Jannach, Zancher, Felfernig e Friedrich, da cui sono tratti diversi spunti di questo articolo (e che potete approfondire sul sito dedicato http://recommenderbook.net), per suggerire a un utente articoli e contenuti di suo interesse, i sistemi di raccomandazione online si possono basare su uno (o più) di questi tre parametri:- un paradigma collaborativo basato sull'analogia di comportamenti tra utenti;
- le informazioni e i tag di prodotti simili tra loro;
- la conoscenza specifica delle esigenze dell’utente attraverso la storia delle sue ricerche e dei filtri di ricerca usati.
Come si calcola la similarità tra utenti sul web?
Il paradigma collaborativo si basa sull'idea di "crowd wisdom", cioè di "saggezza della folla", e sull'assunto di base che persone concordi nel valutare un prodotto nel passato, si troveranno allineate nel recensire prodotti diversi anche in futuro. Occorre perciò solo trovare il modo di calcolare la "similarità" tra utenti. Immaginate, per esempio, di avere la tabella sottostante contenente le valutazioni (o rating) date da alcuni utenti (users) ad alcuni prodotti (item) e di voler stabilire se e quanto Alice gradirà il prodotto numero 5 (in modo da consigliarglielo nei "suggeriti per te" oppure no). Come procedereste?









Come si calcola la similarità tra prodotti?
Avevate indovinato? Se volete potete rimettervi alla prova con un altro approccio, quello del calcolo della similarità tra prodotti, anziché tra utenti. Per esempio, potremmo confrontare il prodotto Item 1 con Item 4, considerandoli come vettori.


Per chi volesse cimentarsi oltre, segnaliamo la possibilità di un ulteriore interessante approccio mediante l’uso del calcolo della probabilità e del teorema di Bayes come riportato nella diapositiva di Jannach, Zancher e dal libro citato di cui potete leggere alcune pagine in anteprima Google Books.
Come si calcola l'affinità di coppia nei social media e nei siti di incontri online?
La matematica, anche quella più basilare che usa solo semplici medie pesate e sommatorie, può bastare, per esempio, per calcolare la nostra affinità con i nostri "amici" e far decidere a un social network se e cosa mostrarci tra i post e gli stati dei nostri contatti. Questo era quello che accadeva per Facebook e per il suo algoritmo di Edgerank (usato fino al 2011 prima di venire raffinato con l’uso di ulteriori centomila parametri!). Edgerank usava la semplice somma di tre parametri: affinità tra utenti (determinata da like e commenti), peso del post (dipendente dal tipo di messaggio condiviso, se contenente link, immagini o video), e il tempo di decadimento (più il post "invecchia" e meno valore assume).In realtà anche in questo caso sono i nostri comportamenti in rete (quantità di commenti, numero di like, tempi di visualizzazione e click) a determinare quello che ci viene consigliato. Così come sono i nostri desiderata ad aiutare siti di incontri virtuali a trovarci addirittura la nostra anima gemella con l'uso di una semplice media geometrica, come mostrato in questo video Ted Ed:
Desideriamo 15 minuti di notorietà o di anonimato?
Forse ve ne siete convinti anche voi, la matematica guida la nostra vita online in modo molto più diffuso e semplice di quanto possiamo immaginare. Come dice Dino Pedreschi, «siamo come Pollicini digitali, e ci lasciamo dietro briciole del nostro vivere, che giorno dopo giorno diventano una valanga (di dati)». Prima o poi, anziché desiderare "15 minuti di notorietà", come diceva Andy Wharol, secondo Juan Enriquez (nel video che segue), ambiremo tutti a ritagliarci anche solo 15 minuti di anonimato, per non farci suggerire nulla che possiamo scegliere e trovare da soli.













