01/20/2026 | Press release | Distributed by Public on 01/20/2026 07:05
Ook al is hij de pensioengerechtigde leeftijd vorig jaar gepasseerd, Arno Siebes doet nog volop onderzoek en begeleidt nog promovendi. De hoogleraar Algorithmic Data Analysis vindt zijn vak gewoonweg veel te leuk om te stoppen. "Emeritaat is wat mij betreft Latijn voor vrijwilliger. Ik ga gewoon door, alleen betaalt de universiteit geen salaris meer."
Geheel in stijl nam Arno Siebes in september vorig jaar na 25 jaar hoogleraarschap afscheid van zijn dienstverband. Met een symposium en een "behoorlijk ingewikkelde" afscheidsrede over statistische patronen zei hij zijn vakgebied Algorithmic Data Analysis officieel vaarwel.
Het hoogtepunt van die dag? Siebes hoeft er niet lang over na te denken: de toespraak van twee van zijn promovendi - "een praatje met veel lof" - eindigend met een Festschrift, een academisch vriendenboekje gevuld met wetenschappelijke bijdragen en persoonlijke verhalen. "Ik had niet verwacht dat ik er een zou krijgen, en zeker niet een die door uitgever Springer op de markt wordt gebracht. Toen ik zag hoeveel grootheden uit het vakgebied eraan hebben meegewerkt, was ik wel even sprakeloos. En dat ben ik niet vaak."
Ondanks zijn officiële afscheid denkt de hoogleraar absoluut niet aan stoppen; daarvoor vindt hij zijn vakgebied veel te leuk. Sinds zijn emeritaat is Siebes nog vrijwel dagelijks in zijn kamer op de vierde verdieping van het Buys Ballotgebouw te vinden. Hij begeleidt nog steeds promovendi, bezoekt conferenties en werkt verder aan zijn eigen onderzoek. "Ik wil blijven bijdragen aan mijn vakgebied. De spreekwoordelijke kers op de taart van mijn afscheid was een overzicht van mijn wetenschappelijke nageslacht, oftewel alle promovendi die ik heb begeleid. In het Duits noemen ze de promotor een Doctorvater, ik ben nu dus een Doctor Großvater en zelfs Doctor Ur-Großvater. Fantastisch toch?"
Arno Siebes begon 25 jaar geleden als hoogleraar Grootschalig Gedistribueerde Databases, al heeft hij zich daar geen moment mee bezig gehouden. "Ik studeerde Wiskunde in Utrecht en promoveerde in Amsterdam bij het Centrum Wiskunde & Informatica, waar ik vervolgens vijftien jaar heb gewerkt aan database-managementsystemen en later aan data mining. Bij mijn sollicitatie hier in Utrecht heb ik ook gezegd: ik doe wat aan datamining, niet aan datasystemen. Daar zijn ze mee akkoord gegaan. Bij het ontstaan van de faculteit Bètawetenschappen in 2005 en het departement Informatica heb ik mijn leerstoel omgedoopt tot Algorithmic Data Analysis en ons onderzoeksgebied helemaal zelf kunnen vormgeven."
Siebes noemt zichzelf dus 'dataminer', iemand die graaft in grote hoeveelheden data om bepaalde, soms onverwachte, verbanden te ontdekken en te analyseren. Dit is een onderdeel van unsupervised learning, wat betekent dat je een computermodel voedt met data, en het algoritme vervolgens zelf op zoek gaat naar patronen. Het model krijgt geen aanwijzingen over wat goed of fout is. Siebes: "Het standaardvoorbeeld dat in mijn vakgebied vaak wordt gebruikt, is het geval dat uit analyse van grote hoeveelheden supermarktdata blijkt dat mensen die luiers kopen, ook bier kopen. Dat onverwachte patroon leidde tot de suggestie dat bier en luiers dichtbij elkaar moesten staan, of gezamenlijk in de aanbieding moesten."
Een grappig verhaal, maar is dit écht een patroon dat steeds terugkomt, of is het toeval? Siebes: "De vraag waar ik me de afgelopen vijftien jaar mee bezig heb gehouden, is in hoeverre je er zeker van kunt zijn dat het model dat het algoritme gebruikt om patronen te herkennen, het goede model is. Er kunnen verkeerde aannames in het model zitten, of de data is onvolledig, waardoor het antwoord van het algoritme niet klopt met de werkelijkheid. Mijn doel is om die vraag te kwantificeren, een rekenmethode te bedenken waarmee je zou kunnen uitrekenen hoe betrouwbaar het gebruikte model is."
Een van de kronen op zijn werkzame leven is dat Siebes denkt dat hij een antwoord op die vraag heeft gevonden. Het is een universele oplossing waarmee je voor elk model kunt berekenen hoe betrouwbaar de uitkomst is, ook als je helemaal niets van de data weet.
Maar zeker weten zal hij het nooit, omdat in unsupervised learningaltijd een zekere mate van onzekerheid zit, in tegenstelling tot supervised learning. "Mijn onderzoek is vooral een theoretische oefening, waarbij de argumentatie waarom ik denk dat het op deze manier berekend zou moeten worden, belangrijk is. Er is geen formule die je kunt toepassen, het is onberekenbaar."
Als wetenschapper doe je dingen ook omdat je ze gewoon zelf wil weten
Hoewel Siebes dit deel van zijn onderzoek een "puur nieuwsgierigheidsgedreven hobbyproject" noemt, zijn de voorbeelden voor toepassing van deze kennis wel degelijk relevant voor de samenleving. "Het voorbeeld van de luiers en het bier is natuurlijk geinig, maar het levert geen wereldverbeterende kennis op. Maar voor artsen, bijvoorbeeld, is het óók belangrijk te weten of de modellen die zij gebruiken om hun patiënten te behandelen of te diagnosticeren, betrouwbaar zijn."
Voor Siebes zijn z'n drijfveren niet zo romantisch, zegt hij. "Het is mooi om te kunnen zeggen dat je iets doet voor de samenleving, maar voor mij gaat het om pure wetenschapsbeoefening; als wetenschapper zou ik het heel onbevredigend vinden om te weten dat mijn model niet dichtbij de waarheid zit. Onderzoekers doen dingen ook omdat ze er gewoon zelf meer over willen weten."
Hoewel zijn vakgebied valt onder wat kunstmatige intelligentie wordt genoemd, probeert Siebes weg te blijven van die benaming. "Ik vind de term kunstmatige intelligentie pretentieus. Zeker die large language models, dat is geen intelligentie. Het zijn kansmodellen over taal, en taal en denken hebben niet zoveel met elkaar te maken, dat gebeurt in verschillende hersengebieden. Ik geloof ook niet in door AI-geschreven boeken, films, of muziek. Dat gaat op z'n best allemaal middle of the road worden."
Volgens Siebes gaan bedrijven die momenteel honderden miljarden in AI pompen, dat geld dan ook niet terugverdienen. "Ik zie kunstmatige intelligentie als een gereedschapskist met hulpmiddelen. De ene AI kan goed het weer voorspellen, de ander wint altijd met het spel Goen de derde kan teksten herschrijven. Geen van die toolsis in zijn eentje de oplossing voor alles. Die hype is een AI-bubbel die verschrikkelijk gaat barsten."
Hoe AI en data mining zich ook zullen ontwikkelen de komende jaren, Siebes zal het blijven volgen zoals altijd: nieuwsgierig, eigenzinnig, en met een flinke dosis humor. "Emeritaat is wat mij betreft Latijn voor vrijwilliger. Ik blijf doen wat ik nu doe, alleen krijg ik er geen salaris meer voor."