Verdwenen in de massa’s

Het zijn griezelige tijden voor ons individuen. We zijn gekend. We zijn bespied en bekeken. Als we niet opletten, zijn binnen afzienbare tijd onze gedachten bekend. Kortom, we gaan naar een situatie waarin anderen onszelf beter kennen dan wij zelf.

Een draconisch spookbeeld.

Het heeft iets bedreigends omdat het wáár is dat er voldoende kennis in zit om ons in kaart te brengen. Big data. Het spook dat rondwaart over de wereld. Een rupsje-nooit-genoeg als het gaat over ‘gegevens’. Er valt niet aan te ontkomen dat over jou en mij heel interessante conclusies zijn te trekken op basis van het combineren van afzonderlijke gegevensbanken.

En toch is het onzin.

Big data is een soort hoax. Niet dat het een echt broodje-aapverhaal is. Maar er zit wel enorm veel fantasie, veel projectie en veel overschatting aan vast. Precies zoals een broodje-aapverhaal een reële griezelsensatie versterkt; het ‘het zal je maar gebeuren, zeg’-gevoel.

Uit alle data die beschikbaar is, ben ik te destilleren. En vast ook nog geloofwaardig en accuraat. Jij ook. En zowat willekeurig ieder ander ook. Dus wat is er dan zo broodje-aap?

Het feit dat je de naald in de hooiberg niet zult vinden. Het is statistisch onjuist, maar wel realistisch: nóóit zult vinden (anders dan bij toeval).

De miljarden die zijn gestoken in data crushers zijn weggegooid geld, tenzij je vindt dat het uitzoeken hoe dit te doen die investeringen waard zijn. Als de drijfveer primair academische interesse is, prima. Maar de verkoopargumenten zijn heel andere: ‘met behulp van de nieuwe algoritmes kunnen we onheil voorkomen, doordat we terroristen en ander tuig in beeld krijgen’.

Iets vinden, is ongelooflijk lastig. Iets vinden waarvan je niet weet hoe het er uit ziet of wat het is, is zo goed als ondoenlijk. Wat wél goed kan, is iets terugzoeken. Maar dan weet je wat je zoekt, na afloop van een aanslag bijvoorbeeld. Dan blijken inderdaad alle gegevens over de daders al in je bezit te zijn. Dan blijkt er (ineens?!) in de hooiberg een duidelijke route te zien naar de dader(s). Maar dat lukt pas als je wéét wie of wat je zoekt.

Daarom is big data onzin.

Natuurlijk is het handig om patronen te herkennen. Maar dat doet statistiek al honderden jaren, zij het langzamer en met kleinere datasets. Maar jij en ik zijn niet te vinden.

Om een individu te vinden, zul je precies dáár moeten beginnen: bij dat individu. Alleen dan kun je een spoor (terug) volgen. Wat dat betreft, zal het belang van goede informatieverzamelaars, bekend als bijvoorbeeld rechercheurs, alleen maar toenemen. Intelligence noemen de Amerikanen dat: spionnen, goede straatagenten, rechercheurs, ménsen die luisteren en op basis van díe informatie verder zoeken. Dán kan big data een handig instrument zijn.

Het is een ruwe, primitieve techniek waar we nu bang voor zijn. Mensen die met grof geweld op die enorme berg data af stormen in de hoop daaruit interessante conclusies te trekken. Nog nooit ís er iets uit geconcludeerd dat privacy-bedreigend is. Nog leuker: de keren dat big data een rol van betekenis speelden, waren het niet de data crushers die iets konden aanreiken. het waren veeleer ‘sociale professionals’ als journalisten of (sociale) wetenschappers.

Nee hoor, als je je in een berg hooi als hooi gedraagt, wordt het lastig je als speld te identificeren. Dat neemt niet weg dat je alert moet blijven op je eigen privacy. Maar of dat nu plots significant meer is dan voor de komst van de term big data?! Ook toen was het een kwestie van niet opvallen.

Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s