22/07/09
Teksten visualiseren met word clouds
Om lange teksten in een oogopslag te tonen, gebruiken blogs en krantensites vaak word clouds. Een word cloud generator zoals Wordle maakt van toespraken, verkiezingsprogramma’s en regeerakkoorden in een handomdraai mooie plaatjes. Het formaat van de woorden in de een word cloud (voor webstek- en e-postadtepten: woordenwolk) hangt af van de frequentie waarmee ze in de tekst voorkomen. Staat een woord tienmaal in een tekst, dan is het dubbel zo groot als een woord dat vijf keer voorkomt. De meest gebruikte woorden springen dan meteen in het oog. Op die manier kan een word cloud de ondertoon van een tekst duidelijk maken.
Een word cloud ziet er een stuk aantrekkelijker uit dan een frequentietabel of een histogram. Dat zijn twee alternatieven om frequenties weer te geven. Een word cloud toont geen absolute cijfers, maar gaat visueel wel handig om met het quasi onbeperkte aantal waarden – woorden in een tekst – dat uitgezet wordt.
Een word cloud of een tag cloud?
De Standaard noemt de visualisatie van de regeerverklaring van Peeters II een tag cloud. Dat is niet helemaal correct. Een tag cloud gaat de frequenties tellen en tonen van tags die aan objecten zijn toegekend. Als je foto’s op Flickr of posts op een blog tags geeft, kan je in een tag cloud hun frequenties ten opzichte van elkaar visualiseren.
De beperkingen van word clouds
Uiteraard zegt de woordfrequentie niet alles over een tekst. Je kunt met dezelfde termen verschillende betekenissen onder woorden brengen. Bovendien gaat enkel tellen van de frequentie voorbij aan andere betekenisdragende aspecten van een tekst zoals de context of de intonatie van de spreker.
Bovendien wordt het herhalen van woorden in een tekst beschouwd als een stijlfout. Wie schrijft, hoort voor afwisseling te zorgen en moet synoniemen gebruiken. Dat beïnvloedt de frequentie en dus ook de word cloud. Zo kan een tekst waarin niets steeds over besparen wordt gesproken, maar ook over saneren, wegsnoeien, rationaliseren… een word cloud opleveren die een vertekend beeld geeft.
In een volgende post geven we een aantal tips om je word clouds nuttiger te maken.
Update: Lees ook ‘Vijf tips om word clouds nuttiger te maken’.

[...] een vorige post schreven we over het gebruik van word clouds om teksten te analyseren. Word clouds hebben zeker en vast beperkingen, maar met deze vijf tips worden ze al een stuk [...]