Home > Blog > Combinare tag e classificazione a faccette per migliorare la trovabilità

Combinare tag e classificazione a faccette per migliorare la trovabilità

Come trasformare una lista piatta e disordinata di tag in un sistema più elastico e scalabile? Come scegliere meglio i tag per classificare una risorsa? Può venirci in soccorso la classificazione a faccette.

Il problema dell’entropia

I tag tendono facilmente all’entropia, anche quando siano gestiti centralmente da una redazione. Fra i problemi più frequenti: aumento del loro numero (introduzione incontrollata di nuovi tag); ridondanza (sinonimi o varianti per descrivere uno stesso concetto); incoerenza ecc. Tuttavia, i tag sono anche uno strumento molto comodo proprio perché flessibili e scalabili, specie se disposti su un unico livello (lista piatta).

E allora come conciliare il meglio dei due mondi: l’agilità dei tag con il rigore degli schemi più tradizionali? Una strategia consiste nel combinare tag e classificazione a faccette (faceted classification). Rispetto alle tassonomie tradizionali (gerarchico-enumerative), la classificazione a faccette possiede senza dubbio una maggiore flessibilità: e allora perché non usare quest’ultima per migliorare la performance dei tag? Insomma, se la comodità dei tag sta nella loro fluidità perché non abbinarli a forme di classificazione altrettanto fluide e scalabili come le faccette?

Propongo due possibili scenari di integrazione tag-faccette:

  1. l’impiego di schemi a faccette per organizzare, estrarre e visualizzare i tag di un sistema
  2. l’impiego di schemi a faccette come ‘guida’ per taggare una risorsa.

Scenario 1: schemi a faccette per estrarre e visualizzare i tag

Immaginiamo di avere un insieme di tag che col tempo sia cresciuto in modo disordinato, e immaginiamo di voler fare un po’ d’ordine senza stravolgere il sistema. A livello di CMS (content management system) lasceremo tutti i tag su uno stesso livello, ma li estrarremo e visualizzeremo secondo uno schema a faccette. Il metodo è questo.

  1. Riportiamo tutti i tag in uno spreadsheet
  2. buttiamo via quelli obsoleti, inutili ecc.
  3. raggruppiamo quelli simili (sinonimi e varianti)
  4. per i tag simili scegliamo il termine preferito e facciamo in modo che le varianti rimandino al preferito (con rimandi espliciti nel front-end o mediante regole di riscrittura delle url via server)
  5. individuiamo le faccette sotto cui raggruppare i vari tag secondo un metodo up&down alla Spencer; vale a dire che da un lato sceglieremo le faccette in base alle risorse da classificare effettivamente presenti (metodo induttivo o bottom-up); dall’altro ragioneremo in termini concettuali più generali, guardando avanti e immaginando possibili evoluzioni del sistema (metodo deduttivo o top-down)
  6. per l’analisi a faccette possiamo usare come matrice lo schema a 5 categorie di Ranganathan o lo schema a 13 categorie del Classification Research Group (CRG)

Esempi

Ho adottato questo metodo per gestire i tag di questo blog. Tutti i tag sono disposti su unico livello, ma vengono gestiti e visualizzati secondo una logica a faccette, che ho ricavato applicando lo schema a 5 categorie di Ranganathan (Personality, Matter, Energy, Space, Time – PMEST).

I tag del blog lucarosati.it

I tag del blog lucarosati.it sono scelti e gestiti secondo una classificazione a faccette, ma a livello di back-end appaiono come una lista piatta.

  • Personalità – gli oggetti di cui si parla in questo blog: Spazi digitali (siti web, motori di ricerca ecc.); Spazi fisici (punti vendita, musei, ecc.); Ecosistemi fisico-digitali (omnichannel)
  • Materia 1 – Ambito di analisi (architettura dell’informazione, usabilità ecc.)
  • Materia 2Concetti chiave (affordance, coerenza ecc.)
  • Energia – processi o azioni che interessano l’oggetto: Attività e metodi (classificazione, design partecipativo ecc.)
  • SpazioSettore di mercato (un’interpretazione un po’ esoterica della faccetta spazio)
  • Tempo – non rilevante
  • tipo di articolo – faccetta extra-semantica.
Le faccette del blog lucarosati.it

I tag del blog lucarosati.it sono estratti e visualizzati secondo una logica a faccette.

I vantaggi di questa soluzione sono: maggiore ordine nei tag; scalabilità; possibilità di spostare un tag da una faccetta all’altra senza modificarne la url.

Una soluzione simile è adottata ad es. dal sito La grande guerra (un progetto del gruppo L’Espresso curato da Federico Badaloni); e anche dalla rivista Trovabile (sezione articoli).

La grande guerra - Homepage

Il sito La grande guerra utilizza i tag secondo una logica a faccette (Temi, Eventi e luoghi bellici, Autori).

Scenario 2: schemi a faccette per taggare

Il secondo scenario ricalca il primo, salvo che le faccette in questo caso restano nascoste. Vengono cioè usate solo per scegliere e gestire i tag, ma non sono mostrate neppure a livello di front-end, dove i tag appaiono come tali su un unico livello.

L’idea in questo caso è quella di usare lo schema a faccette come guida per attribuire i tag a una risorsa. Le faccette servono come criterio interno alla redazione per organizzare in modo più razionale i tag e averne una visione sfaccettata, così da limitare i problemi di duplicazione, incoerenza, disordine.

Per approfondire

  1. Badaloni, Tag. Raccolta di articoli sul tema del tagging
  2. Johnson, Using Tags to Increase Findability
  3. Quintarelli et al. The Facetag Engine: A Semantic Collaborative Tagging Tool