Sociale media: de beer is los en niet meer te stoppen

Als er iets BIG is aan internetdata, dan is dat niet het internet zelf als bron van informatie, maar de hoeveelheid communicatie die wij met elkaar bedrijven. Hoe kunnen we uit de wirwar van communicatiestromen de juiste informatie destilleren en interpreteren?

 

‘We leven in een informatiemaatschappij’ of ‘Nederland moet een kennismaatschappij worden’. Twee kreten uit een niet zo ver verleden, maar ze klinken nu al gedateerd. Zo snel gaat het in de wereld. Het grote buzzwoord is nu big data. Big data haalt op vrijdag 14 maart zelfs de voorpagina van de Volkskrant met de kop ‘Hoe bang moet je zijn voor big data?’. Bang worden we zeker gemaakt met berichten over de NSA en de MIVD, over Google dat alles van je weet en de ING bank die zijn klantgegevens zou willen verkopen. Voor veel mensen en ook voor veel media gaat het vooral om angst voor het onbekende.

Wat zijn die big data en wat kan iemand er mee? Het grappige is dat de data over jou en mij eigenlijk heel klein zijn, big data zijn voornamelijk interessant, en dus alleen BIG, als het over grote aantallen gaat en niet om een enkel individu, over de grote lijnen en trends en niet over de details. Data hebben het vaak mis in de details en zijn alleen correct als we uit de massale gegevens een duidelijk signaal opvangen en de ruis kunnen uitfilteren. Vraag Google om alles wat ik het afgelopen jaar gedaan heb en je krijgt een warrig verhaal met veel gaten en fouten. Vraag hetzelfde aan Facebook en je krijgt een incompleet en vertekend beeld. We zouden dus niet zozeer bang moeten zijn over de big data, maar meer voor de inlichtingendiensten en overheden en de ethische waarden die zij hanteren bij het omgaan met small data.

Op één dag in 2012 sturen wij 300 miljard e-mails

Toch is er wat veranderd sinds de introductie van de woorden informatiemaatschappij en kennismaatschappij met hun sterke positieve connotatie, en het huidige buzzwoord big data, dat een negatieve connotatie dreigt te krijgen. We zitten namelijk midden in de tweede internetrevolutie: die van de sociale media. Tot het jaar 2000 was het internet een web van kennis en informatie, tegenwoordig is het internet echter veel meer een web van communicatie. Het gebruik van het internet overstijgt vele malen de omvang van het inmiddels klassieke internet van webpagina’s . De consumptie en uitwisseling van informatie tussen mensen van vlees en bloed is per dag meer dan het volume aan informatie die op het internet staat. Op één dag in 2012 consumeren wij met zijn allen 168 miljoen dvd’s aan data, sturen wij 300 miljard e-mails, posten wij twee miljoen blogs, bezoeken 172 miljoen mensen Facebook en versturen 40 miljoen mensen 175 miljoen tweets. Op één dag! En dat terwijl de meerderheid van de mensheid nog niet op het internet zit. Die komen er dadelijk nog bij.

We zijn in een paar jaar verworden tot communicatiemachines

Terwijl we een paar duizend jaar geleden nog over de steppen renden om te overleven, zijn we in een paar jaar verworden tot communicatiemachines die een groot deel van de hun tijd digitale data heen en weer schuiven over het internet. Wat gebeurt hier? Hoe gaat ons dit veranderen? We hoeven alleen te kijken naar de snelheid waarmee nieuwe sociale communicatiesystemen elkaar opvolgen: Google in 1998, Wikipedia in 2001, Facebook in 2004, YouTube in 2005, Twitter in 2006, iPhone in 2007. Dit is een lijstje van alleen de grote klappers en ze volgen elkaar inmiddels jaarlijks op.

Als er iets BIG is in de huidige tijd dan is dat niet het internet zelf als bron van informatie, maar de hoeveelheid communicatie die wij met elkaar bedrijven. We unleashed the beast en nu is die niet meer te stoppen. Niemand kan nog voorspellen waar het heengaat, maar een ding is zeker: het gaat ons en alles om ons heen compleet veranderen.

Moeten we bang zijn voor dit monster? Sommige mensen wel. Lord Alistair MacAlpine, een Brits conservatief politicus uit het Thatcher tijdperk, werd in 2012 door twitteraars veroordeeld als een pedofiel. Het bericht werd via Twitter verspreid en klakkeloos overgenomen door de BBC en ITV. Het ging echter om een naamgenoot die was gearresteerd op verdenking van kindermisbruik.

Heel veel mensen baseren zich op een handje vol bronnen

Een ander voorbeeld: het nationale vaccinatieprogramma tegen het papillomavirus (HPV) is gedeeltelijk mislukt door een hetze die op het internet rondwaart tegen vaccinatie. Zo beweert men op de site www.wanttoknow.nl: ‘Want noch de wetenschappers, noch de politieke beleidsmakers schijnen het nog te weten. Zij volgen bijna klakkeloos het geratel van de farmaceutische industrie, die niet voor niks als “Big Pharma” te boek staat ...!’1 Let vooral op het taalgebruik dat niet erg zakelijk en objectief is. Let ook op de naam van de URL waar deze informatie staat. Een kleine studie van het sociale netwerk achter de vele wilde geruchten over bijwerkingen van vaccinatie leert ons dat heel veel mensen zich baseren op een handje vol bronnen. Er is dus weinig informatie en heel veel communicatie over dit onderwerp waarin mensen voortdurend op elkaar reageren en naar elkaar verwijzen. Ook interessant is te zien dat de websites van de overheid en de overheid zelf naar niemand linken en niemand naar hen linkt. Zij staan volledig buiten de discussie en nemen niet deel aan het communicatieproces.

Dit voorbeeld is illustratief voor wat er gebeurt. Veel communicatie over weinig of veel minder informatie. Communicatie die vaak misleidend en foutief is en waar iedereen is overgeleverd aan een niet te controleren stroom van invloeden. Diegenen die de communicatiesystemen van de toekomst ontwikkelen hebben hier een belangrijke taak, een plicht! Hoe kunnen wij mensen helpen om uit de wirwar van communicatiestromen de juiste informatie te destilleren en inzicht te geven in het volledige spectrum aan meningen en de waarde van die meningen?

Waar ik zou beginnen? Als taaltechnoloog zou ik programma’s schrijven die voornamelijk letten op de manier waarop mensen hun mening en informatie brengen. Dat zegt veel over hoe ze aan die informatie komen en hoe gefundeerd die waarschijnlijk is. Zulke programma’s hebben we nu al: ze bepalen hoe subjectief het taalgebruik is, wie de bron is van de beweringen, wie wat zegt en wie elkaar tegenspreken. Het analyseren van onze eigen communicatie kan worden gebruikt om ons te helpen beter te communiceren. Communiceren doen we toch wel, maar effectief communiceren wordt steeds moeilijker.

Piek Vossen is hoogleraar Computationele Lexicologie aan de Faculteit der Letteren van de Vrije Universiteit Amsterdam.

Noot:

1. http://www.wanttoknow.nl/nieuws/hpv-vaccin-gardasil-vernielt-eierstokken-jonge-vrouw/