I tag come strumento per trovare correlazioni

Sunday, 15 April 07
nuvola di tag Come qualcuno forse ricorda, il blog engine che uso e' stato sviluppato da me stesso, perche' non ero molto felice di quello che c'era in giro (non perche' non offriva abbastanza, ma perche' offriva troppo e in maniera non congrua con il mio modo di scrivere i post e usare i servizi web in generale).

Compreso il codice html non riesce ancora a superare le 2000 righe di codice, e alcune parti sono librerie non utilizzate, insomma e' piccolo e posso modificare tutto come voglio con pochi sforzi... ma si sa, una cosa parte facile e tende a complicarsi sempre di piu' man mano che le necessita' crescono.

In particolare da quando posto piu' regolarmente e' nata l'esigenza di poter disporre della funzione che visualizza gli articoli correlati alla fine di ogni post. Sembra una buona idea permettere al lettore di poter continuare la lettura con altro materiale di potenziale interesse.


Bisognava trovare un modo per implementare la cosa che fosse abbastanza semplice da gestire nella pratica. La prima idea che ho avuto e' stata sicuramente la peggiore, ho pensato di poter settare in ogni post una lista di articoli correlati. In pratica per ogni post scritto bisogna andare a scorrere potenzialmente centinaia di post (se si posta una volta al giorno in un anno sono 360 post circa e non e' strano che ci sia un articolo correlato scritto un anno prima) e marcare quelli che hanno abbastanza affinita' come correlati: un incubo.



Siccome sono tra le persone piu' pigre del pianeta (almeno quando si tratta di fare cose che non sono esattamente in focus, alias scrivere post mi piace, marcare articoli correlati un po' meno) ho scartato l'idea originale cercando di partorirne una migliore.


L'idea successiva e' stata quella di fare una analisi sul testo e calcolare la keyword density per cercare di trovare correlazioni tramite parole chiave, e come evoluzione di questa e' arrivata l'idea che ho deciso di adottare.

Tag

oltre la moda c'e' lo strumento



Ci sono casi in cui i tag sono usati in maniera magistrale: certamente del.icio.us e' un esempio dirompente di cosa si puo' fare con i tag, ma in molti contesti web 2.0 ho visto una esplosione di tag che difficilmente aumentano la fruibilita' e l'utilita' del servizio offerto in maniera considerevole.

Quando una cosa non e' abbastanza utile diventa dannosa perche' aumenta il rUm_o_Re


Il fatto che a volte siano usati male non toglie nulla ai tag, rimangono uno strumento eccezionale. Inoltre, come dimostrano i social bookmark che rimangono utili anche se analizzati senza considerare l'aspetto social di somma dei dati degli utenti si vede chiaramente che I tag sono molto utili anche quando usati in maniera individuale.

Un'altra idea diffusa e' che l'utilita' dei tag e' quasi unicamente legata alla possibilita' di organizzare e permettere in un secondo tempo la ricerca da parte nostra o di terzi delle risorse taggate. In realta' i tag, aggiungendo delle etichette alle risorse si prestano non solo alla loro organizzazione e alla ricerca di queste, ma anche alla ricerca di similitudini e rapporti tra le diverse risorse taggate.

Nel caso degli articoli correlati e' chiaro il modo in cui i tag possono essere usati (molti lettori avranno indovinato dalle prime righe di questo post)

Aggiungendo ad un blog la possibilita' di poter taggare i diversi articoli, operazione che fara' lo stesso blogger per ogni articolo dopo averlo scritto, il sistema' sara' in grado di trovare automaticamente i post correlati cercando tra tutti i post quelli che hanno uno o piu' tag in comune. Si puo' assumere che piu' sono numerosi i tag in comune e piu' due risorse sono correlate.


Per finire, siccome sembra interessante dare piu' peso alle risorse piu' recenti, ad ogni risorsa correlata sara' associato un rank proporzionale al numero di tag in comune, ma inversamente proporzionale alla sua eta' cosi' da poter ordinare le risorse correlate in relazione al rank e mostrarle listate in un ordine che e' un compromesso tra novita' e affinita'.

Non mi resta che trovare il tempo per implementarlo, e in questo caso i tag free e time non mi saranno troppo di aiuto.

Per approfondire

15422 views*
Posted at 20:09:18 | permalink | 25 comments | print