Hai mai avuto dubbi sul fatto di avere abbastanza dati per prendere decisioni di marketing valide?
Non è raro essere incerti sull’affidabilità dei dati che si hanno a disposizione, in maniera particolare se stiamo lavorando su un Ecommerce con un tasso di conversione basso, abbiamo un banner dei cookies con un tasso di accettazione ridotto, oppure un sito con pochi visitatori (o, se siete particolarmente sfortunati, una combinazione di questi fattori 🥲).
In questo articolo riassumo una ricerca che ho condotto personalmente, tradotta in termini spero non troppo statistici, per stabilire se i dati che abbiamo a disposizione sono sufficienti per prendere decisioni statisticamente affidabili.
La dimensione del campione: perché è importante?
L’inferenza statistica ci aiuta a fare previsioni su una popolazione più ampia basandoci su un campione di dati: è la situazione in cui ci troviamo se abbiamo un banner dei cookies installato nel sito e questo banner permette a sistemi come Google Analytics o il Pixel di Meta di attivarsi solo post consenso (leggi il nostro articolo su come ottimizzare il tasso di consenso). Per ottenere risultati affidabili, il campione, ovvero la porzione di utenti che ci lasciano il consenso, deve essere sufficientemente grande e rappresentativo della popolazione (cioè rappresentativo di tutti gli utenti).
Ma facciamo un elenco completo di tutte le variabili da considerare:
•Dimensione della Popolazione: numero totale di utenti.
•Utenti Visibili: quelli che hanno accettato il consenso alla raccolta dei dati.
•Sottopopolazioni: utenti che convertono e che provengono da specifici canali.
•Significanza Statistica e Margine di Errore: parametri che determinano la precisione delle nostre conclusioni. Io durante i miei test ho impostato una significanza statistica del 95% con un margine di errore del 5%, una sorta di benchmark per avere una buona inferenza statistica.
Vediamo ora qualche linea guida che ho ricavato dai vari test effettuati.
Linee guida
Ecco alcune linee guida per capire se i tuoi dati sono sufficienti, considerando le variabili menzionate sopra.
- Consent rate basso 🛑 e numero di utenti basso 🛑: hai bisogno di molte conversioni per canale e/o analisi a lungo termine.
- Consent rate alto ✅ e numero di utenti basso 🛑: necessiti di un numero medio di conversioni per canale e/o analisi a medio termine.
- Consent rate basso 🛑 e numero di utenti alto ✅: richiede un numero medio di conversioni per canale e/o analisi a medio termine.
- Consent rate alto ✅ e numero di utenti alto ✅: un numero basso di conversioni per canale è sufficiente, e/o puoi fare analisi a breve termine.
Vediamo un esempio pratico
Immagina di avere una popolazione totale di 1000 utenti, con un livello di confidenza del 95% e un margine di errore del 5%. Il campione minimo necessario è di 278 utenti (circa il 30%).
Se questi utenti sono distribuiti così:
•300 da organic
•400 da email
•300 da social
Con un campione di 278 utenti, la distribuzione sarà:
•Organic (30%): 278 × 0.30 = 83.4 (circa 83 utenti)
•Email (40%): 278 × 0.40 = 111.2 (circa 111 utenti)
•Social (30%): 278 × 0.30 = 83.4 (circa 83 utenti)
Per fare inferenze statistiche valide, ogni sottogruppo dovrebbe avere almeno 169 utenti per organic e social, e 196 per email. Pertanto, con un campione di 278 utenti, sarà difficile fare inferenze precise per ciascun sottogruppo. E questo senza nemmeno iniziare parlare di un ulteriore sottogruppo, ovvero chi proviene dal determinato canale e converte.
Se hai pochi utenti e un tasso di consenso basso, sono poche le analisi che potrai fare con una buona inferenza statistica.
Cosa succede con un campione più grande?
Se avessi un campione di 278,000 utenti che lasciano il consenso (su 1 milione di utenti totali), la situazione cambierebbe? Si, drasticamente. Un campione così ampio permetterebbe di fare inferenze statistiche molto precise anche con tassi di conversione bassi.
Distribuiamo i 278,000 utenti secondo le proporzioni originali dei canali:
•Organic (30%): 278,000 × 0.30 = 83,400 utenti
•Email (40%): 278,000 × 0.40 = 111,200 utenti
•Social (30%): 278,000 × 0.30 = 83,400 utenti
Numero di conversioni necessarie
Per ciascun sottogruppo, consideriamo le stesse regole ma con campioni molto più grandi, possiamo essere molto più specifici e precisi.
1. Utenti da Organic:
•Un tasso di conversione anche molto basso dell’1% fornirà: 83,400 × 0.01 = 834 conversioni
•Un tasso del 2% fornirà: 83,400 × 0.02 = 1,668 conversioni
•Un tasso del 5% fornirà: 83,400 × 0.05 = 4,170 conversioni
2. Utenti da Email:
•Un tasso di conversione dell’1% fornirà: 111,200 × 0.01 = 1,112 conversioni
•Un tasso del 2% fornirà: 111,200 × 0.02 = 2,224 conversioni
•Un tasso del 5% fornirà: 111,200 × 0.05 = 5,560 conversioni
3. Utenti da Social:
•Simili a quelli da organic per gli stessi tassi di conversione.
Con campioni così grandi, anche con tassi di conversione molto bassi, il numero di conversioni è molto alto, garantendo inferenze statistiche estremamente precise.
Hai abbastanza dati per prendere una decisione valida?
Quindi, hai abbastanza dati per prendere una decisione valida? Come hai visto, meno utenti hai a disposizione, più fare inferenze statistiche è a rischio di errore. Con un ampio numero di utenti, anche con tassi di conversione molto bassi, le inferenze statistiche saranno altamente precise e affidabili per ciascun canale di marketing.
Newsletter noiosa? Naaah.
Ti interessano contenuti come questi? Iscriviti alla nostra newsletter. Ne inviamo poche ma buone. E promettiamo zero spam.
Unisciti agli oltre 400 iscritti.

