INTERVIEW Data-expert Evelyn Ruppert: ‘Facebook-likes vertellen niet wie je bent’

Niet alleen voor tech-bedrijven, ook voor onderzoekers en beleidsmakers zijn big data een goudmijn. Maar we moeten niet denken dat die bergen gegevens voor zich spreken, stelt data-hoogleraar Evelyn Ruppert. ‘Data geven ons geen antwoorden zodat we niet meer na hoeven denken.’

Evelyn Ruppert weet nog hoe zij zich na een loopbaan als ambtenaar ruimtelijke ordening in Toronto begon te interesseren voor de geschiedenis van het verzamelen van statistieken, en hoe overheden die gegevens probeerden te benutten voor het maken van beleid. Big data was toen nog geen buzzword. ‘Als je in die tijd over data begon, haakten mensen verveeld af.’

Nu, amper tien jaar later, kunnen we er niet meer omheen. Data wordt allang niet meer enkel verzameld in basisregistraties. ‘Digitale technologieën, platforms, apparaten – het overstijgt qua volume alles wat overheden ooit verzameld hebben’, stelt Ruppert.

Ze raakte geïnteresseerd in de vraag hoe data de manier waarop wij ons leven organiseren beïnvloed, en – vooral – hoe wij als burgers in digitale samenlevingen gekend en bestuurd worden. In 2013 was ze mede-oprichtster van Big data and society, het eerste sociaalwetenschappelijke tijdschrift op het snijvlak van data en samenleving. ‘Het is een nieuw regime.’

Nieuwe manieren van data verzamelen

Rupert bestudeert onder meer hoe nationale statistiekbureaus zoals het CBS nieuwe technieken gebruiken en experimenteren met big data en nieuwe dataverzamelingstechnieken. ‘Organisaties produceren zoveel data die real time, vaak goedkoper en gedetailleerder zijn dan de traditionele vragenlijsten en officiële registers.’ Het CBS gebruikt bijvoorbeeld sensoren om verkeersstromen te monitoren. En uit supermarktscanners wordt afgeleid welke producten worden gekocht.

‘Het is niet simpelweg statistische innovatie. Als onze technologieën veranderen, verandert ook hoe we populaties kennen en begrijpen. Dat is voer voor sociologen. Gegevens zijn niet simpelweg een reflectie van de werkelijkheid. Het gaat nog steeds om keuzes die je maakt, om interpretaties.’

Sociologen hebben altijd al data verzameld. Verandert de digitale datarevolutie de aard van het vak?

‘Het verzamelen en analyseren van gegevens is, zeker sinds Durkheim, een fundamenteel aspect van sociologisch onderzoek. Traditioneel zou je aan de hand van een vragenlijst eens in de zoveel tijd mensen ondervragen over wie ze zijn en wat ze vinden. Nu gebruiken al die mensen apparaten waarmee ze permanent digitale sporen achterlaten. Digitale technologieën vertellen waar we ons bevinden, wat we kopen, wie we bellen, wat we zoeken. De traditionele methodologie is gebaseerd op reflecties op gedrag. Methodologen zullen zich afvragen of je niks bent vergeten, en of je wellicht sociaalwenselijke antwoorden geeft. Maar de gps in je telefoon vertoont geen sociaalwenselijk gedrag.’

Mooi, zou je kunnen denken: die gegevens zijn erg betrouwbaar.

‘Dat zou je denken. Maar hoe je telefoon is ingesteld, hoe signalen worden opgepikt, welke conclusies we eraan verbinden – het speelt allemaal een rol. Ook nieuwe digitale gegevens zijn geen simpele reflectie. Nog steeds doet het ertoe hoe die data verzameld worden. Interpretatie is nog steeds een probleem. Als ik jullie zou vragen naar jullie geslacht, zouden jullie antwoorden dat je een man bent. Maar als de gps-gegevens van je telefoon laten zien dat je in damesmodezaken bent geweest, zou daaruit afgeleid kunnen worden dat je een vrouw bent. Jouw Facebook-likes vertellen niet wie je bent. Het zijn hooguit afgeleiden. En dan zijn er nog alle mogelijkheden van politiek gebruik en misbruik. Dan hoeft het nog niet eens te raken aan kernkwesties als het om data gaat: privacy en vertrouwelijkheid. Zelfs als dat verzekerd is, kunnen gegevens gebruikt worden om te manipuleren.’

Het Facebookschandaal is wake up call

We spraken Ruppert in de week waarin uitkwam dat Cambridge Analytica gegevens van miljoenen Facebook-gebruikers misbruikte om verkiezingscampagnes mee te beïnvloeden. Het schandaal is volgens haar een ‘wake up call’.

‘Het is heel goed dat het is uitgekomen. Facebook staat onder enorme druk, Zuckerberg kan zich niet langer verschuilen achter zijn Facebookprofiel. Het bewustzijn groeit. Bedenk, dit zijn nog steeds relatief jonge technologieën. Ik kan me nog herinneren dat ik mijn eerste iPhone kreeg, niet eens zo lang geleden. Nu zijn ze overal. In het begin overheerste de euforie. Ik zou ook niet meer zonder kunnen. In een vreemd land kan ik opzoeken hoe laat de trein rijdt en contact houden met mensen over de hele wereld. Maar de schaduwzijden worden steeds meer zichtbaar.’

Toch zijn ook (lokale) overheden dol op big data. Bijna elke zichzelf respecterende stad wil een ‘smart city’ worden, met slimme verkeerslichten en slim re-integratiebeleid. Big data kunnen zelfs onze veiligheid vergroten, aldus het officiële kabinetsstandpunt. Is dat niet veel te optimistisch, om niet te zeggen naïef?

‘Wat we nodig hebben is niet een optimistische of pessimistische kijk op het gebruik van big data, maar een zorgvuldige benadering. Er zullen altijd menselijke besluiten genomen moeten worden over hoe data te genereren, hoe te interpreteren, hoe om te gaan met de ethiek van privacy. Algoritmen kunnen niet zonder menselijke beslissingen. Zoiets als ‘data-gestuurde oplossingen’ bestaan niet. Alle data die ik ooit onder handen gehad heb, vertoonden gebreken. Data zijn niet neutraal, volstrek objectief, onafhankelijk van de mens.’

Photo by Sai Kiran Anagani on Unsplash

‘Data kunnen veel betekenen voor dienstverlening, zeker. In Londen zorgt de analyse van Oyster Card-gegevens ervoor dat de underground beter rijdt. Maar data geven nooit zelf een antwoord. De noodzaak van onderzoek en begrip blijft.’

Maar zelfs gegevens die met goede bedoelingen verzameld worden, kunnen misbruikt worden?

‘Het probleem is dat steeds meer data eigendom zijn van, of beheerd worden door multinationals. Als gebruiker onderteken je een overeenkomst, maar wie leest die lappen tekst? Veel mensen geloven het wel. En wat gebeurt er met partijen buiten de overeenkomst, datamakelaars, die gegevens kopen en doorverkopen? Heel veel data worden verhandeld en te gelde gemaakt zonder dat mensen zich daar bewust van zijn. Verzekeraars of kredietverstrekkers willen graag weten of jij een risicogeval bent.’

‘We zijn een product geworden omdat we data creëren die geld waard zijn. Het platform is gratis, maar we betalen met onze gegevens. Het is een markt, een economie. En blijkbaar zijn onze Facebookprofielen heel wat waard. Staten zoeken wel naar mogelijkheden om te reguleren, maar dat is moeilijk, vanwege de internationale dimensie. Al die data gaan grenzen over. Tegelijkertijd proberen overheden er zelf hun voordeel mee te doen voor de publieke zaak. Dat gegevens van mijn Oyster Card geanonimiseerd gebruikt worden om het spoorboekje van de Londense metro te perfectioneren, daar kan ik trouwens wel mee leven.’

Maar wie bepaalt wat een publiek goed is?

‘De grens tussen data verzamelen en toezicht houden is dun. In principe ben ik met mijn Oyster Card een anoniem onderdeel van een massale verkeersstroom. Maar als iemand mijn identiteit kan koppelen aan mijn metrokaart, kan diegene zien waar ik ben en ben geweest. Naarmate gegevens meer gepersonaliseerd zijn, wordt het controversieel. Zeker als het idee is dat er uit die gegevens conclusies kunnen worden getrokken.’

Worden er genoeg kritische vragen gesteld bij het gebruik van big data?

‘Het is belangrijk bij nieuwe toepassingen na gaan wat de beperkingen en problemen zijn bij het gebruik van big data. Zeker als het over beleidstoepassingen gaat. Als ik als onderzoeker data analyseer, heeft dat gevolgen voor de kennis die ik produceer. Maar als beleidsmakers er mee aan de slag gaan, kan dat gevolgen hebben voor de levens van mensen. Het spreekt voor zich dat je daar erg voorzichtig mee moet zijn. Beleid is nooit ‘data-gestuurd’, hooguit ‘data-geïnformeerd’. Het is niet zo dat data ons de antwoorden gaan bezorgen en we niet meer na hoeven denken. Het is onze taak als sociale wetenschappers dat duidelijk te maken.’

‘In een democratie moeten we beleidsmakers altijd dwingen verantwoording af te leggen over hoe data gebruikt worden. Het woord ‘staat’ vertoont verwantschap met ‘statistiek’: staten willen alles van hun inwoners weten. Om beter beleid te maken, ja. Maar controle is de andere kant van dezelfde medaille.’

Jurre van den Berg is redacteur van socialevraagstukken.nl en van de Volkskrant. Marcel Ham is hoofdredacteur van het Tijdschrift voor Sociale Vraagstukken.

Evelyn Ruppert is hoogleraar sociologie aan Goldsmiths, University of London. Van 1 februari tot 1 juli 2018 bekleedt ze de J.A.A. van Doorn wisselleerstoel aan de Erasmus School of Social and Behavioural Sciences (ESSB). Tegelijkertijd is Ruppert Van Doorn Fellow aan het Netherlands Institute for Advanced Study in Humanities and Social Sciences (NIAS), waar ze werkt aan het ontwikkelen van nieuwe modellen van ‘citizen data’. Tijdens de Dag van de Sociologie op 14 juni spreekt Ruppert de Van Doornlezing uit.