Combinare tag e altri sistemi di classificazione per migliorare la trovabilità

Come trasformare una lista disordinata di tag in un sistema più elastico e scalabile? Come scegliere meglio i tag per classificare una risorsa? Classificazione a faccette, vocabolari controllati e altri strumenti della knowledge organization ci vengono in soccorso.

Lettura: 4 minuti

Indice

I tag e il problema dell’entropia

I tag sono uno strumento veloce per organizzare l’informazione ma nascondono molte insidie. Nel tempo tendono facilmente all’entropia, anche quando sono gestiti centralmente da una redazione. Fra i problemi più frequenti:

  • aumento esponenziale del loro numero: introduzione incontrollata di nuovi tag
  • ridondanza: sinonimi e varianti per descrivere uno stesso concetto
  • incoerenza: i tag scelti rispondono a criteri diversi.

Tuttavia, i tag sono anche uno strumento molto comodo e quasi irrinunciabile quando a classificare i contenuti è il pubblico, come nei social network. Col tempo si è pensato di integrare i tag con sistemi di classificazione più tradizionali per governare la tendenza al disordine che i tag portano inevitabilmente con sé. Il tagging collaborativo o folksonomy infatti non è solo una possibile alternativa agli altri modelli di classificazione, ma anche un complemento a questi ultimi. Integrando un modello di classificazione creato dagli utenti “dal basso” (bottom-up) con modelli di classificazione creati “dall’alto” (top-down) si possono ridurre i difetti che ciascuno schema porta con sé potenziandone contemporaneamente i pregi.

Tag e classificazione a faccette

Rispetto alle tassonomie, la classificazione a faccette possiede senza dubbio una maggiore flessibilità: e allora perché non usare quest’ultima per migliorare la performance dei tag? Insomma, se la comodità dei tag sta nella loro fluidità perché non abbinarli a forme di classificazione altrettanto fluide e scalabili come le faccette?

Propongo due possibili scenari di integrazione tag-faccette:

  1. l’impiego di schemi a faccette per organizzare, estrarre e visualizzare i tag di un sistema
  2. l’impiego di schemi a faccette come ‘guida’ per taggare una risorsa.

Classificazione a faccette per estrarre e visualizzare i tag

Immaginiamo di avere un insieme di tag che col tempo sia cresciuto in modo disordinato, e immaginiamo di voler fare un po’ d’ordine senza stravolgere il sistema. A livello di CMS (content management system) lasceremo tutti i tag su uno stesso livello, ma li estrarremo e visualizzeremo secondo uno schema a faccette.

Il metodo è questo:

  1. riportiamo tutti i tag in uno foglio di calcolo
  2. buttiamo via quelli obsoleti, inutili ecc.
  3. raggruppiamo quelli simili (sinonimi e varianti)
  4. per i tag simili scegliamo il termine preferito e facciamo in modo che le varianti rimandino al preferito (con rimandi espliciti nel front-end o mediante regole di riscrittura delle url via server)
  5. individuiamo le faccette sotto cui raggruppare i vari tag secondo un metodo up&down; vale a dire che da un lato sceglieremo le faccette in base alle risorse da classificare effettivamente presenti (metodo induttivo o bottom-up); dall’altro ragioneremo in termini concettuali più generali, guardando avanti e immaginando possibili evoluzioni del sistema (metodo deduttivo o top-down)
  6. per la scelta delle faccette possiamo basarci sullo schema a 5 categorie di Ranganathan o sullo schema a 13 categorie del Classification Research Group.

Questo blog

Ho adottato questo metodo per gestire i tag di questo blog. Tutti i tag sono disposti su unico livello, ma vengono gestiti e visualizzati secondo una logica a faccette, che ho ricavato applicando lo schema a 5 categorie di Ranganathan (Personality, Matter, Energy, Space, Time – PMEST).

I tag di WordPress usati per classificare i post di questo blog sono gestiti e visualizzati secondo un sistema a faccette.

La Grande Guerra

Una soluzione simile è adottata dal sito La grande guerra, un progetto di GEDI Gruppo Editoriale curato da Federico Badaloni e raccontato in questo blog nell’articolo Storytelling mediante correlazione. Il progetto La Grande Guerra, i diari raccontano.

La grande guerra - Homepage
Il sito La grande guerra utilizza i tag secondo una logica a faccette: Temi, Eventi e luoghi bellici, Autori.

FaceTag

Anche il progetto sperimentale FaceTag si muove secondo una logica simile, sfruttando le faccette come filtro per organizzare e ottimizzare i tag.

FaceTag: Integrating Bottom-up and Top-down Classification in a Social Tagging System
Integrazione di tag e faccette nel prototipo FaceTag.

Classificazione a faccette per taggare

Un’altra via per integrare faccette e tag è quella di sfruttare uno schema a faccette come guida per taggare una risorsa. In questo caso le faccette restano però nascoste: vengono cioè usate solo per scegliere e gestire i tag, ma non sono mostrate a livello di front-end, dove i tag appaiono come una lista piatta.

L’idea in questo caso è quella di usare lo schema a faccette come falsariga per attribuire i tag a una risorsa. Le faccette servono come criterio interno alla redazione per organizzare in modo più razionale i tag e averne una visione sfaccettata, così da limitare i problemi di duplicazione, incoerenza, disordine.

Tag e vocabolari controllati

I vocabolari controllati sono un ottimo sistema per gestire i problemi tipici dei tag, come la sinonimia, le varianti dovute a flessione nominale e verbale, singolare e plurale ecc. Un esempio molto elegante è stato messo a punto dalla BBC, attraverso la cosiddetta soglia dei metadati (metadata threshold). Questa soluzione prevede di “assorbire” all’interno di un vocabolario controllato i tag che superano una certa “soglia” di frequenza. Il progetto è raccontato nell’articolo Changing approaches to metadata at bbc.co.uk: From chaos to control and then letting go again.

La BBC è probabilmente la realtà che ha sperimentato nel modo più spinto e raffinato l’uso di strumenti avanzati di organizzazione della conoscenza per ottimizzare la gestione dei metadati delle proprie risorse. Una panoramica è contenuta nella presentazione How the BBC is approaching metadata quality measurement (ISKO UK Meetup 2020).

BBC metadata threshold
Vocabolario controllato per governare i tag: un progetto della BBC.