Boosting business value op basis van Predictive Analytics

Kennisontwikkeling en het delen van kennis staan centraal bij Qquest. Samen met Actuals werken we in dit kader aan het oplossen van datavraagstukken die spelen bij Actuals. Eén ervan is het kunnen voorspellen van een situatie op basis van veel klantgegevens.

Wie is Actuals?

Actuals biedt organisaties die veel transacties verwerken inzicht in de volledigheid en juistheid van hun omzet. Dat doet ze via een SAAS-oplossing. Een klant van Actuals kan hierin het aantal transacties zien en ook welke matchen en welke niet met elkaar matchen. Een transactie bestaat uit data van een bestelling, de vordering, de levering en de betaling. Voor alle data die bij deze ene transactie hoort, bestaan verschillende applicaties binnen en buiten de organisatie. Zo kan de betaling via bijvoorbeeld een provider als Adyen of Mollie lopen. Actuals brengt al deze data uit de verschillende applicaties bij elkaar in de SAAS- oplossing.

Wie is Qquest?

Qquest is een IT-detacheerder die organisaties helpt bij tijdelijke hulp op een project. Dat kan zijn op het gebied van softwaretesten, api-integratie en low-code. Daarnaast biedt Qquest ook een detavast constructie voor bedrijven die op zoek zijn naar vast IT-talent. Door intensieve training en coaching weten we in korte tijd ambitieuze talenten klaar te stomen. Zij starten onder andere in rollen voor data-analyse, beheer, development en business analyse.

Wat is het vraagstuk en hoe is het opgelost?

Normaal gesproken sluit alle transactiedata qua geldstroom op elkaar aan. Maar dat is niet in alle gevallen zo. Bijvoorbeeld omdat de BTW niet betaald is of dat de klant teveel betaalt voor zijn bestelling. En dat kan in de duizenden transacties en euro’s lopen. Een organisatie met 1 miljoen transacties heeft bijvoorbeeld bij 0,2% al 2.000 ‘unmatched transacties’.

De vraag die met elkaar is opgelost luidt: hoeveel unmatched transacties kan een klant van Actuals redelijkerwijs verwachten op basis van de data uit voorgaande maanden? Dat helpt de klant om capaciteit bij de Finance afdeling te plannen en ook om inzicht in trends te krijgen.

Belangrijk hierbij is dat voor het voorspellen rekening moet worden gehouden met werkdagen, weekenden, eenmalige uitschieters, seizoensinvloeden zoals vakanties en andere informatie waardoor niet simpelweg het gemiddelde van de afgelopen periode kan worden genomen.

Hoe hebben we het vraagstuk aangepakt?

Allereerst is met elkaar een beeld gevormd van de data en de bronnen waarin de data staat. Voor een geanonimiseerde testset is sprake van vier bronnen met transactiegegevens. Het is belangrijk eerst de data en hun context te begrijpen, voordat je ermee aan de slag gaat. Alle transacties die bij elkaar horen zijn in één rij in een tabel gezet en er zijn velden toegevoegd aan de tabel, zoals dag, maand en weekendindicatie.

Vervolgens is de tabel opgeschoond en zijn alle rijen zonder match eruit gefilterd. De tabel is, met behulp van Python, geanalyseerd om bepaalde week- en maandtrends, weekend- en seizoensinvloeden te vinden. Uiteindelijk was het resultaat een tabel met het aantal transacties met een bijbehorende datum én analyses per dag, weekend en week, weergegeven in onderstaande grafieken.

Figuur 1. aantal unmatched transacties in 2020

Qquest-actuals-verdelingen-unmatched-transacties

Figuur 2. verdelingen van unmatched transacties

Met Time Series (tijdreeksen) is verdergegaan om een geschikt voorspelmodel te vinden. Bij het analyseren van tijdreeksen zochten we naar structuren en patronen om het onderliggende proces te beschrijven en te verklaren. Maar ook naar manieren om op basis van geschikte modellen toekomstige waarden te voorspellen of om de effecten van alternatieve scenario’s te onderzoeken.

Uiteindelijk is aan de hand van verschillende Time Series modellen gekeken, welke het beste bij het vraagstuk paste. De effectiviteit van de modellen is bepaald aan de hand van een zogenaamd MAPE (Mean Absolute Percentage Error).

Wat is het resultaat geworden?

Er zijn zes modellen getoetst op hun betrouwbaarheid. Hiervan vormt Holt’s Winters Seasonal Exponential Smoothing het model dat het beste presteert met een MAPE van 5%. De voorspelling had een afwijking van 5% op de werkelijke resultaten op een voorspelling van 7 dagen. Hierbij moeten we wel in ogenschouw nemen dat we slechts 8 maanden aan data hebben gebruikt die sterk beïnvloed is door de coronamaatregelen. Niettemin wordt op dit moment het model gebruikt in de praktijk bij Actuals om de betrouwbaarheid te toetsen en klanten al een indruk te geven van dagvoorspellingen.

Inmiddels zijn we gestart met de volgende vraag, namelijk of er in de type unmatched transacties clusters te onderkennen zijn, zodat je gerichter te werk kan gaan met het voorkomen van unmatched transacties. Hierbij kan je denken aan transacties met hetzelfde verschil, of waarbij dezelfde leverancier is betrokken, of waar sprake is van een BTW-issue etc. De stap die we hierbij maken, is dat middels machine learning een systeem zelf clusters kan vinden.

“Als startup zijnde is tijd kostbaar en daarom is het erg fijn om samen met Qquest een oplossing te hebben ontwikkeld die ons veel tijd bespaart bij het monitoren van ons data-landschap. Daarnaast was de samenwerkig erg prettig met een professioneel en pragmatisch Qquest team en we zijn dus erg blij met het fraaie machine learning algoritme als resultaat”
Peter Lem – Actuals.io

Valkuilen waar we mee te maken kregen

Vraagstukken over voorspellen zijn vaak uniek waarbij je onderweg tegen allerlei uitdagingen en problemen aanloopt. Zo ook bij dit vraagstuk.

Ten eerste ging het om het omzetten van een dataset (met vanuit verschillende bronnen transactie data die zijn uitgesmeerd over meerdere regels), naar een dataset waarin per dag het aantal transacties volgens een gegeven bron wordt weergegeven. Je loopt dan tegen allerlei issues waarbij de transactiedata niet op elkaar aansluiten.
Een tweede uitdaging was de vraag hoe om te gaan met meerdere datums voor een Transaction ID? Dus hoe weet je welke transacties bij elkaar horen? We konden deze issues oplossen door te kijken wat de betekenis is van bepaalde velden en transacties en hoe de gegevens worden opgeslagen in de vier bronnen. Zonder die kennis zouden we van te veel aannames uitgegaan zijn.
Een derde issue was dat de testset data bevatte van 12 maanden en die viel precies in de coronaperiode. Eigenlijk heb je voor een goede voorspelling meer historische data nodig en vooral data die niet veel beïnvloed wordt door een bijzondere gebeurtenis. Bij het testen van de algoritmes lijken corona en de decembermaand veel invloed te hebben op de prestaties van de modellen. Om hier een oplossing voor te maken is er bij het testen van de algoritmes gebruik gemaakt van de periode april t/m november, om vervolgens 80% van deze data als train data te gebruiken. Of dat voldoende is geweest, zijn we nu aan het testen in de praktijk.

Nieuwsgierig geworden?

Ben je naar aanleiding van deze case nieuwsgierig geworden wat wij voor jou kunnen betekenen of heb je vragen over de case? Neem dan gerust contact met ons op. We gaan graag met je in gesprek onder het genot van een goede kop koffie.

Meer weten over Data & Analytics?

Lees alles over waar wij goed in zijn met Data & Analytics.

Lees meer

Meer weten over Data & Analytics?

Lees alles over waar wij goed in zijn met Data & Analytics.

Lees meer

Actualiteit

Boosting business value op basis van Predictive Analytics

Wie is Actuals?

Wie is Qquest?

Wat is het vraagstuk en hoe is het opgelost?

Hoe hebben we het vraagstuk aangepakt?

Wat is het resultaat geworden?

Valkuilen waar we mee te maken kregen

Nieuwsgierig geworden?

Meer weten over Data & Analytics?

Meer weten over Data & Analytics?

De laatste ontwikkelingen

Qquest is Exhibition partner van Test Automation Days 2024

Weerwolven op WhatsApp: Versterk teamdynamiek en plezier onder medewerkers

Qquest is Content partner van Test Automation Days 2023

Jeroen de Hond nieuwe algemeen directeur!

Welke functie heeft een functioneel ontwerp?

Qquest IT-kompas – ontdek of er een IT’er in jou schuilt

Hoe werf je IT-talent?

IT-afdeling volledig uitbesteden? Dit is de gezonde verhouding tussen intern en extern personeel

Wat is het verschil tussen uitzenden en detacheren?

Creëer interactie op de hybride werkvloer!

De sparringsessie – Test maturity

Stappenplan om je ASL 2 Certificaat te behalen

Hoe testvolwassen is jouw team? – Test maturity

Implementatie van softwarepakketten

Van boekhandelaar naar developer: Omschakelen naar IT met de Talentclass van Qquest

Muziekbingo

Wat doet een Business Intelligence Specialist?

Stoelendans – Dé gratis werkplek reserveringsapplicatie

Qquest aanwezig bij Tekkie Worden week Rotterdam 2021

Development skills ontwikkelen met de bingo

Starten met testautomatisering – de voorbereiding

Wat is een procesanalist?

De rol van een accountmanager binnen Qquest

Testen van rapporten met grafieken en diagrammen

QQUEST WINT FD GAZELLEN 2020 AWARD

Wat is de invloed van Corona op Scrum werken?

‘Collectedata’ analyseren voor een optimaal resultaat – data testen

Processen verbeteren door eigen gebouwde inzetplanningapplicatie

Werking vaccins tegen corona onderbouwd op basis van data

Starten op afstand bij CZ middenin de coronacrisis. Het kan dus wel!

Timemanagement voor thuiswerken

Miljoenenbesparing op IT-projecten door PDRE®

Zo krijg je ook jouw oma van 83 op Skype!

Datacleaning met AWS Stepfunctions & AWS Lambda

Hans Andringa softwaretester binnen Qquest, na 15 jaar nog niet uitgekeken en uitgeleerd!

7 Tips om effectief en goed thuis te kunnen werken

Qquest in de top 250 Groeibedrijven

Al tien jaar een duurzame samenwerking tussen CB en Qquest

De eerste TalentClass Trainee bij Qquest

Qquest wint FD Gazellen 2019 Award

Expeditie Robinson Qquest Editie

Personeelsmeeting Rotterdam

Social event 2018

Kan een IT-bedrijf ook bier testen?

Eindejaarsevent: Fort aan de Klop te Utrecht

Op weg naar de visie en richting van Qquest