<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Captain Cornelius Blog &#187; Datavisualisatie</title>
	<atom:link href="http://www.captaincornelius.com/blog/topics/datavisualisatie/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.captaincornelius.com</link>
	<description></description>
	<lastBuildDate>Sat, 22 Aug 2009 12:51:16 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Vijf tips om word clouds nuttiger te maken</title>
		<link>http://www.captaincornelius.com/blog/vijf-tips-om-word-clouds-nuttiger-te-maken/</link>
		<comments>http://www.captaincornelius.com/blog/vijf-tips-om-word-clouds-nuttiger-te-maken/#comments</comments>
		<pubDate>Tue, 28 Jul 2009 17:55:08 +0000</pubDate>
		<dc:creator>Stijn</dc:creator>
				<category><![CDATA[Datavisualisatie]]></category>
		<category><![CDATA[tekstanalyse]]></category>
		<category><![CDATA[tips]]></category>
		<category><![CDATA[word cloud]]></category>

		<guid isPermaLink="false">http://www.captaincornelius.com/?p=62</guid>
		<description><![CDATA[Word clouds kunnen meer zijn dan mooie plaatjes. Maak je visualisatie nuttiger met deze vijf tips.]]></description>
			<content:encoded><![CDATA[<p>In een vorige post schreven we over <a href="http://www.captaincornelius.com/blog/teksten-visualiseren-met-word-clouds/">het gebruik van word clouds om teksten te analyseren</a>. Word clouds hebben zeker en vast beperkingen, maar met deze vijf tips worden ze al een stuk nuttiger.</p>
<p><span id="more-62"></span></p>
<h3>1. Tel de juiste woorden</h3>
<p>Vervoegde werkwoorden, verwijzende voornaamwoorden en verbogen bijvoeglijke naamwoorden zorgen ervoor dat het aantal woorden toeneemt, zonder dat het aantal betekenissen stijgt. Bestudeer je tekst vooraf goed. Het kan zinvol zijn om van werkwoorden steeds de infinitief te tellen, voornaamwoorden te vervangen door een uniforme referent en adjectieven te wijzigen in de grondvorm. Op die manier beperk je het aantal waarden en hou je de word cloud overzichtelijk.</p>
<h3>2. Tel woordgroepen in plaats van woorden</h3>
<p>Als de auteur een combinatie van woorden meermaals gebruikt, beschouw en tel je die combinatie best als een aparte waarde. Mocht Kris Peeters herhaaldelijk spreken over <em>daadkrachtig beleid</em> dan moet dat ook uit de word cloud blijken. Uiteraard ga je de andere plaatsen waar <em>daadkrachtig</em> en <em>beleid</em> staan ook nog apart gaan tellen. De elementen van de woordgroep kunnen dus ook als aparte waarden voorkomen.</p>
<p>Woordgroepen tellen kan je ook helpen om verkeerde conclusies te vermijden. De <a href="http://www.pekesenertjes.be/2009/07/20/albert/">word cloud van de toespraak van Albert II op 21 juli 2009</a> lijkt te suggereren dat hij vooral over de <em>financiële crisis</em> en de <em>economische crisis</em> sprak. Nochtans komen die combinaties respectievelijk twee en één keer voor in de tekst.</p>
<h3>3. Sluit de juiste woorden uit</h3>
<p>Woorden die veel voorkomen en geen echte inhoudelijke betekenis hebben, kan je uitsluiten van de analyse. Zo beperk je het aantal waarden en blijft de cloud overzichtelijk. Maar hou er rekening mee dat sommige op het eerste gezicht betekenisloze woorden toch betekenis kunnen hebben. Die woorden kunnen bijvoorbeeld deel uitmaken van een woordgroep of een afkorting of letterwoord zijn. Negeer woorden van 3 letters en minder dus nooit zonder meer.</p>
<p>Het kan nuttig zijn om woorden die overduidelijk wel betekenis hebben, maar om evidente redenen vaak in een tekst staan, uit te sluiten. Dat deed De Standaard in tweede instantie met de regeerverklaring van Peeters II. In een eerste versie stonden ook Vlaanderen, Vlaamse, Vlaamse en regering in de word cloud. Die verwachte woorden schrappen maakte het resultaat een stuk relevanter.</p>
<div id="attachment_43" class="wp-caption alignnone" style="width: 570px"><img src="http://www.captaincornelius.com/wp-content/uploads/destandaard_wordclouds_090713.jpg" alt="Word clouds regeerverklaring Peeters II" title="destandaard_wordclouds_090713" width="560" height="470" class="size-full wp-image-43" /><p class="wp-caption-text">Word clouds van de regeerverklaring van Peeters II in De Standaard op 13/07/2009</p></div>
<h3>4. Analyseer niet de volledige tekst</h3>
<p>Word clouds hoeven niet noodzakelijk gebaseerd te zijn op de analyse van de volledige tekst. Als je brontekst erg lang is, kan het verstandig zijn om het onderwerp van je analyse te beperken. Waarom niet enkel de werkwoorden of de adjectieven tellen en weergeven. Dat kan vaak al de teneur van een tekst duidelijk maken.</p>
<p>Een analyse en visualisatie van verwante termen of synoniemen kan ook zeer nuttig zijn. Tel bijvoorbeeld hoe vaak de auteur naar de inwoners van Vlaanderen verwijst op verschillende manieren (mensen, burgers, Vlamingen, consumenten…) en geef de verhouding weer in een cloud.</p>
<h3>5. Vergelijk word couds</h3>
<p>Een goede manier om de beperkingen van word clouds te omzeilen, is het vergelijken van een reeks teksten. Op die manier introduceer je in de analyse een stuk van de context die anders ontbreekt.<br />
Je kunt teksten vergelijken die elkaar opeenvolgen in tijd. Een voorbeeld is de <a href="http://blog.seattlepi.com/microsoft/tags/">analyse van documenten van Microsoft tussen 1975 en 2007</a> door de Seattle Post-Intelligencer.</p>
<p>Ook verwante teksten uit dezelfde periode analyseren en vergelijken is mogelijk. Zo kan je de verkiezingsprogramma’s van de verschillende partijen op deze manier naast elkaar leggen. Tijdens de campagne van de Amerikaanse presidentsverkiezingen maakte <a href="http://www.boston.com/bostonglobe/ideas/articles/2008/08/03/portrait_of_the_candidate_as_a_pile_of_words/">The Boston Globe een vergelijking tussen de blogs van Obama en McCain</a>.</p>
<p>Uiteraard hoef je ook niet de volledige teksten te vergelijken. Je kunt je ook beperken tot bijvoorbeeld de vergelijking van de werkwoorden in de verkiezingsprogramma’s van de verschillende partijen of in de opeenvolgende verkiezingsprogramma’s van één partij. Let wel goed op de lay-out van de word clouds in een vergelijkende analyse: als in de verschillende visualisaties eenzelfde woord telkens op een andere plaats staat, zal dat afbreuk doen aan het resultaat.</p>
<h3>Tot slot</h3>
<p>Een word cloud maken lijkt een snelle manier om een tekst te analyseren. De kwaliteit van de word cloud zal echter aanzienlijk verbeteren als je tekst vooraf zorgvuldig bestudeerd en de analyse grondig voorbereidt. Als je tijdens die voorbereiding beslist dat het zinvol is om het bronmateriaal te bewerken, geef dit dan duidelijk aan bij het eindresultaat.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.captaincornelius.com/blog/vijf-tips-om-word-clouds-nuttiger-te-maken/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Teksten visualiseren met word clouds</title>
		<link>http://www.captaincornelius.com/blog/teksten-visualiseren-met-word-clouds/</link>
		<comments>http://www.captaincornelius.com/blog/teksten-visualiseren-met-word-clouds/#comments</comments>
		<pubDate>Wed, 22 Jul 2009 19:21:11 +0000</pubDate>
		<dc:creator>Stijn</dc:creator>
				<category><![CDATA[Datavisualisatie]]></category>
		<category><![CDATA[tekstanalyse]]></category>
		<category><![CDATA[visualisatie]]></category>
		<category><![CDATA[word cloud]]></category>

		<guid isPermaLink="false">http://www.captaincornelius.com/?p=31</guid>
		<description><![CDATA[Word clouds worden steeds vaker gebruikt om teksten te visualiseren.]]></description>
			<content:encoded><![CDATA[<p>Om lange teksten in een oogopslag te tonen, gebruiken blogs en krantensites vaak word clouds. Een word cloud generator zoals <a href="http://www.wordle.net/">Wordle</a> maakt van toespraken, verkiezingsprogramma’s en regeerakkoorden in een handomdraai mooie plaatjes. Het formaat van de woorden in de een word cloud (voor webstek- en e-postadtepten: woordenwolk) hangt af van de frequentie waarmee ze in de tekst voorkomen. Staat een woord tienmaal in een tekst, dan is het dubbel zo groot als een woord dat vijf keer voorkomt. De meest gebruikte woorden springen dan meteen in het oog. Op die manier kan een word cloud de ondertoon van een tekst duidelijk maken.</p>
<p><span id="more-31"></span><div id="attachment_41" class="wp-caption alignnone" style="width: 617px"><a href="http://lvb.net/item/7643"><img src="http://www.captaincornelius.com/wp-content/uploads/2009/07/lvb_wordcloud_090712-607x1024.jpg" alt="Screenshot van een word cloud van het Vlaamse regeerakkoord 2009 - 2014 op weblog LVB.net" title="Screenshot van een word cloud op weblog LVB.net" width="607" height="1024" class="size-large wp-image-41" /></a><p class="wp-caption-text">Screenshot van een word cloud van het Vlaamse regeerakkoord 2009 - 2014 op weblog LVB.net</p></div></p>
<p>Een word cloud ziet er een stuk aantrekkelijker uit dan een <a href="http://nl.wikipedia.org/wiki/Histogram">frequentietabel of een histogram</a>. Dat zijn twee alternatieven om frequenties weer te geven. Een word cloud toont geen absolute cijfers, maar gaat visueel wel handig om met het quasi onbeperkte aantal waarden – woorden in een tekst – dat uitgezet wordt.</p>
<h3>Een word cloud of een tag cloud?</h3>
<p>De Standaard noemt <a href="http://www.standaard.be/Artikel/Detail.aspx?artikelId=DMF20090713_051">de visualisatie van de regeerverklaring van Peeters II een tag cloud</a>. Dat is niet helemaal correct. Een tag cloud gaat de frequenties tellen en tonen van tags die aan objecten zijn toegekend. Als je foto&#8217;s op Flickr of posts op een blog tags geeft, kan je in een tag cloud hun frequenties ten opzichte van elkaar visualiseren.</p>
<h3>De beperkingen van word clouds</h3>
<p>Uiteraard zegt de woordfrequentie niet alles over een tekst. Je kunt met dezelfde termen verschillende betekenissen onder woorden brengen. Bovendien gaat enkel tellen van de frequentie voorbij aan andere betekenisdragende aspecten van een tekst zoals de context of de intonatie van de spreker.</p>
<p>Bovendien wordt het herhalen van woorden in een tekst beschouwd als een stijlfout. Wie schrijft, hoort voor afwisseling te zorgen en moet synoniemen gebruiken. Dat beïnvloedt de frequentie en dus ook de word cloud. Zo kan een tekst waarin niets steeds over <em>besparen</em> wordt gesproken, maar ook over <em>saneren</em>, <em>wegsnoeien</em>, <em>rationaliseren</em>… een word cloud opleveren die een vertekend beeld geeft.</p>
<p>In een volgende post geven we een aantal tips om je word clouds nuttiger te maken.<br />
<br />Update: <a href="http://www.captaincornelius.com/blog/vijf-tips-om-word-clouds-nuttiger-te-maken/">Lees ook &#8216;Vijf tips om word clouds nuttiger te maken&#8217;</a>. </p>
]]></content:encoded>
			<wfw:commentRss>http://www.captaincornelius.com/blog/teksten-visualiseren-met-word-clouds/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
