achtergrond

Geenstijl

@Weglaksoftware

Wobsoftware: Tekstherkenning ingezet tégen media en burgers die overheidsdocs opvragen

Mailtje van een bekende naar aanleiding van de vele Wob-berichten

Beste redactie,

Sinds een aantal jaar bij een grote instelling waar ik de technische ontwikkelingen rond tekstanalyse van grote bestanden nauwgezet volg. Met name de inzet van kunstmatige intelligentie hierbij fascinerend. Nu las ik in september het interessante artikel over de 'robowob' op GS: Hugo de Jonge heeft speciale software om Wob-verzoeken zwart te lakken - én te openbaren. Ik ben alleen bang dat de auteur niet helemaal begrijpt wat die software nu eigenlijk kan en waarom deze zo beangstigend is.

Op basis van de site denk ik dat deze tool van Zylab niet alleen een fraaie zoekmachine is die op trefwoorden zoekt, maar dat dit bedrijf ook gebruikmaakt van nieuwe technieken uit de Digital Humanities-gereedschapskist die ik in de praktijk heb gezien. De software doet onder meer aan 'topic modelling' en dat betekent dat clusters van bij elkaar horende woorden worden geïdentificeerd. Hierdoor kunnen delen van teksten worden gevonden over bijvoorbeeld 'toeslag', die daar op het eerste gezicht niets mee te maken kunnen hebben. Zo is sneller na te gaan welke delen van de tekst ook dienen te worden gelakt, omdat die informatie bevatten over een bepaald gevoelig onderwerp. Door gebruik te maken van zelflerende software kan de computer nog sneller verbanden leggen in enorme hoeveelheden tekst waar een normaal mens nooit in staat toe zou kunnen zijn (en bijvoorbeeld namen van mensen aan bepaalde termen koppelen). 

Zie bijvoorbeeld deze verkenning over historisch onderzoek (pdf) en deze tweets:

Hugo de Jonge heeft speciale software om Wob-verzoeken zwart te lakken - én te openbaren

GS onderzoekt: VWS gebruikt software die documenten kan lakken, maar ook beter doorzoekbaar maakt. Wob-verzoeken zouden dus sneller afgehandeld en geopenbaard kunnen worden. Maar dat wil Hugo niet...

De Ruttedoctrine was ook voor het vertrek van de halve cast al een erg slechte film. Maar nu stoppen ook de mensen ermee die achter de schermen werkten aan al die stunts en special effects: de wob-ambtenaren, die met hun zwartgelakte bladzijden kleur gaven aan de zo beteurde beeldvorming over de demissionado's in Vak K . Al die excuses van Hugo (en Mark) zijn allemaal nepnieuws en desinformatie.
Ze zijn niet overwerkt omdat ze niks kunnen vinden, of randje burnout door de polarisatie in de samenleving. Hun werk is leuker en belangrijk, zeker nu. Een hele eer. En bepaald geen moderne slavernij of zoeken naar spelden in papierbergen, 'meer dan je in een mensenleven kan doorkomen' stelde Hugo de Jonge in het laatste coronadebat. Hij wil daar zijn ambtenaren tegen beschermen, wimpelde hij Wybren van Haga af, toen die om openbaarheid van informatie vroeg.

Na flink onderzoek (veelal in via de Wet openbaarheid van bestuur opgevraagde documenten) concludeert GeenStijl, onder voorbehoud van lakstift: de vicepremier verspreidde in de Ridderzaal nepnieuws, middenin een parlement. Want in werkelijkheid kunnen de ambtenaren van VWS dankzij de komst van RoboWob al dat tijdrovende en geestdodende werk automatiseren. Zelfs op Algemene Zaken kunnen ze tegenwooridig met een paar zoekopdrachten elke mistige herinnering van de demissionaire premier opnieuw activeren.

Tip de redactie

Wil je een document versturen? Stuur dan gewoon direct een mail naar redactie@geenstijl.nl
Hoef je ook geen robotcheck uit te voeren.