11/06/2025 | Press release | Distributed by Public on 11/06/2025 02:18
'Data science technieken kunnen echt het verschil maken bij het ontsluiten van nieuwe kennis.' Dat zei Gita Salden vandaag bij de opening van het Data Science Event bij DNB in Amsterdam. Ze gaf in haar speech tal van voorbeelden van hoe data science kan helpen data beschikbaar te krijgen die ons iets vertellen over nieuwe ontwikkelingen.
Gepubliceerd: 06 november 2025
© GettyImages
Welkom allemaal bij De Nederlandsche Bank, fijn dat jullie er allemaal zijn. Twee weken geleden, op 20 oktober, was het World Statistics Day. Dat zal jullie natuurlijk niet ontgaan zijn. Het is een dag die is uitgeroepen door de VN en die een keer in de vijf jaar wordt gevierd om stil te staan bij het belang van betrouwbare en kwalitatief goede data. Statistische betrouwbare bronnen zijn essentieel voor het nemen van geïnformeerde beslissingen.
De wereld verandert snel en wordt steeds complexer. Jawel, we zijn nog geen twee minuten onderweg en ik hoor de cliché-politie al met gillende sirenes aan komen rijden. Maar zoals met veel clichés: het is wel waar. En in die snel veranderende wereld hebben we behoefte aan data die tijdig beschikbaar zijn en die ons iets vertellen over die nieuwe wereld. En dat is best een uitdaging, want die data zijn niet altijd zomaar beschikbaar.
Neem een voorbeeld dicht bij ons huis als DNB. Om te weten welke risico's financiële instellingen lopen als gevolg van klimaatverandering, willen we graag inzicht hebben in hun blootstelling aan bedrijven met een grote ecologische voetafdruk. Maar voor financiële instellingen bestaan er momenteel geen wereldwijde en consistente wettelijke vereisten om duurzaamheidsgegevens aan te leveren. De rapportageverplichtingen verschillen nog sterk in strengheid en reikwijdte tussen landen. En zo kunnen jullie waarschijnlijk allemaal een voorbeeld noemen uit jullie eigen praktijk, waarin je zicht wil krijgen op een nieuwe ontwikkeling, maar waarin dat bemoeilijkt wordt door een gebrek aan betrouwbare en tijdige data.
Daar kan data science helpen. Dat klinkt een beetje als Mike van TellSell, maar data science technieken kunnen echt het verschil maken bij het ontsluiten van nieuwe kennis. Er zijn drie gebieden die ik er even uit wil lichten: alternatieve databronnen, nieuwe technieken en het delen van code.
Ten eerste: alternatieve databronnen. Een goed voorbeeld daarvan vind ik PortWatch. Dat is een open platform van het IMF dat satellietgegevens gebruikt om verstoringen in maritieme handelsstromen te monitoren en te simuleren. Hiermee kunnen we de effecten van verschillende klimaatscenario's op de wereldhandel simuleren. Daarmee zien we hoe groot de impact van klimaatverandering is op de economie, en dus op de financiële sector. Ook DNB is op dit gebied werkzaam en heeft een flexibel raamwerk ontwikkeld voor een Digital Twin van fysieke klimaatrisico's. Door toezichtgegevens, overheidsbronnen en live weerdata te combineren, kunnen we steeds beter overstromingsrisico's in Nederland in kaart brengen. Het is de bedoeling dat dit project wordt opgeschaald en beschikbaar komt voor derde partijen, zoals overheden.
Naast het gebruik van alternatieve databronnen kunnen ook nieuwe technieken helpen om tot betere inzichten te komen. Opnieuw een voorbeeld vanuit onze eigen praktijk. Bij het maken van statistieken over duurzame financiering combineren we vaak uiteenlopende datasets. Maar vaak ontbreken unieke identificatiecodes of duidelijke definities, wat het proces complex maakt. We hebben daar een nieuwe techniek ontwikkeld om het combineren van datasets eenvoudiger te maken, De techniek heet Fuzzy String Matching Algorithm. Nee, dit is niet een of andere kinky dating app, maar een nieuwe techniek om bijvoorbeeld namen van financiële instellingen in het ene databestand te koppelen aan namen in het andere databestand.
Een andere vorm van nieuwe data science-technieken is nowcasting. Dit is een techniek die uitkomst kan bieden bij gegevens die vertraagd beschikbaar komen, zoals commerciële gegevens over CO2-emissies. Samen met de ECB passen we nowcasting toe om actuelere CO2-statistieken voor het eurogebied op te leveren - iets waar gebruikers al geruime tijd om vragen.
In een wereld waarin duurzaamheidsrapportages onder druk staan, zal de beschikbaarheid van brongegevens voor statistieken ongetwijfeld teruglopen. Wellicht zullen we vooralsnog dan ook meer moeten afgaan op gemodelleerde en geïmputeerde gegevens. Des te belangrijker om deze gegevens te baseren op transparante methoden, geharmoniseerd tussen verschillende landen.
En last but not least: het delen van code. Open source code ligt aan de basis van heel wat toepassingen. Ik weet zeker dat als we meer code kunnen gaan delen, overheden efficiënter kunnen worden. Daarom zijn we momenteel in internationaal verband bij de BIS in gesprek over de voorwaarden waaronder we ons als centrale bank comfortabel zouden voelen in het open source ecosysteem. Open source is namelijk niet gratis - er is inzet nodig om het tot bloei te laten komen.
Dus, om het samen te vatten: We hebben onderlinge afstemming en samenwerking nodig om consistentie en betrouwbaarheid van gegevens en modellen te waarborgen. De maatschappelijke vraagstukken zijn nieuw en complex, maar nieuw data science technieken en het delen van onze code kunnen ons werk verbeteren en tot betere inzichten leiden om deze moeilijke vraagstukken het hoofd te bieden. En daarom word ik ontzettend blij als ik naar het programma kijk en als ik u jullie hier in deze zaal zie. Want zijn jullie hier om precies dat te doen wat nodig is: namelijk samenwerken.
Dus dat is wat ik jullie wens: samenwerking, inspiratie, en bovenal een leuke dag!
Delen: