Specialistenpraat: 3 fabels over data analyses
Fabel 1: “Meer waarnemingen zorgt altijd voor een betere analyse”
Ik krijg soms de vraag of 1.000 waarnemingen genoeg is om een model te bouwen of een analyse te doen. Mijn antwoord daarop is dat dit helemaal afhangt van de representativiteit. Zijn die 1.000 waarnemingen een goede afspiegeling van de groep waar je iets over wilt zeggen? Dat dit niet het geval is, komt vaak voor. Zo kun je bijvoorbeeld klantdata hebben van alleen een selecte groep, zoals alleen recente klanten, en je hiermee iets wilt zeggen over alle klanten. Of je wilt met klanten die offline geworven zijn, aanbevelingen doen voor online werving. Dat zijn natuurlijk geen representatieve groepen. Vaak is het mogelijk deze scheefheid deels te corrigeren. Maar het allerbeste is om op de juiste manier te beginnen. Ook kun je beter 500 representatieve waarnemingen hebben, dan 2.000 die sterk vertekend zijn.
Fabel 2: “Statistisch significant betekent dat het belangrijk is”
In ons werk als marktonderzoekers doen we vaak analyses op grote hoeveelheden data. Dan heb je al snel een klein verschil of samenhang die toch statistisch significant is. Stel dat in een klantgroep 51,2% vrouw is, terwijl in heel Nederland dat 50,8% is. Dat is misschien significant, maar vaak kun je er toch weinig mee. We gebruiken ‘statistisch significant’ meer om een shortlist te maken van bevindingen. Vervolgens kijken we naar wat het betekent: wat is werkelijk van belang? Het doel van het onderzoek of de analyse is hierin vaak maatgevend. Meestal krijg je een duidelijkere conclusie als je minder bevindingen in de focus zet. Clichés zijn niet voor niets clichés, net zoals: less is more!
Fabel 3: “Anno 2020 kan iedereen zelf zijn analyses doen: er is online zoveel eenvoudige tooling beschikbaar”.
De term ‘analyse’ wordt al snel in de rondte geslingerd. Bijvoorbeeld als een campagnetool toont hoeveel bezoekers en clicks je hebt. Baat het niet, dan schaadt het niet, toch? Nou, wel als je hieruit de verkeerde conclusies trekt. Bijvoorbeeld dat het verschil in clicks tussen twee e-mailuitingen komt door de content. Terwijl je er niet bij stilstaan dat de twee groepen die de verschillende e-mailuitingen hebben ontvangen niet vergelijkbaar zijn. Zo kan de ene groep altijd voor lagere clicks zorgen, bij welke content dan ook. Of denk aan het verschil in tijdstip van verzenden. Het interpreteren van de cijfers is iets dat die eenvoudige tooling niet voor je doet!
Behoefte om te sparren?
Heb je zelf een actueel thema waarover je van gedachten wilt wisselen of hulp bij kunt gebruiken? Neem dan gerust contact met ons op via telefoonnummer 020 – 750 4400 of per email info@4orange.nl.
Onze experts staan voor jou klaar.