C.F. Kettering una volta disse: "Il mio interesse è per il futuro perché trascorrerò il resto della mia vita lì".
Quando guardiamo i dati e le analisi, siamo concentrati sul passato. Come abbiamo fatto lo scorso trimestre? Che cosa è successo nel primo semestre del 2019? E come si confronta con il primo semestre 2018? In che misura le pagine di destinazione X, Y e Z sono state convertite lunedì scorso alle 13:03? (Sto scherzando, sto scherzando.)
I dati diventano più preziosi quando li usiamo per predire il futuro anziché semplicemente analizzare il passato. È qui che entra in gioco il modello di propensione.
Cos'è il modello di propensione?
La modellazione della propensione tenta di prevedere la probabilità che visitatori, lead e clienti eseguano determinate azioni. È un approccio statistico che tiene conto di tutte le variabili indipendenti e confuse che influenzano tale comportamento.
Pertanto, ad esempio, la modellizzazione della propensione può aiutare un team di marketing a prevedere la probabilità che un lead si converta in un cliente. O che un cliente agiterà. O anche che un destinatario di e-mail annullerà l'iscrizione.
Il punteggio di propensione, quindi, è il probabilità che il visitatore, il lead o il cliente eseguirà una determinata azione.
Perché gli ottimizzatori dovrebbero preoccuparsi della modellizzazione della propensione
Anche se al momento non stai utilizzando o stai prendendo in considerazione la modellizzazione della propensione, è importante comprendere la matematica alla base del processo. Ad esempio, conosci la differenza tra i modelli di regressione lineare e logistica?
Allo stesso modo in cui gli esperti SEO devono comprendere un po 'di content marketing, HTML, ecc., Per essere competenti, gli ottimizzatori necessitano di una comprensione di base delle statistiche e dei modelli di propensione.
Ma perché gli ottimizzatori dovrebbero preoccuparsi della modellizzazione della propensione quando ci sono test e sperimentazioni?
Tim Royston-Webb, Executive Vice President of Strategy presso HG Insights, offre alcuni motivi:
Tim Royston-Webb:
Il fatto è che non possiamo sempre fare affidamento su questi metodi statistici nel mondo reale. Potrebbero esserci diversi scenari in cui non sono possibili esperimenti reali:
- a volte la direzione può non essere disposta a rischiare perdite di entrate a breve termine assegnando vendite a clienti casuali.
- un team di vendita che guadagna bonus basati su commissioni può ribellarsi alla randomizzazione dei lead.
- Gli esperimenti del mondo reale possono essere poco pratici e costosi in alcuni casi in cui gli stessi dati o partecipanti possono essere modellati attraverso procedure quasi sperimentali o quando i dati storici sono sufficienti per produrre intuizioni fruibili.
- Gli esperimenti nel mondo reale possono comportare problemi etici o di salute, ad esempio, studiando l'effetto di determinati prodotti chimici.
Tuttavia, la modellizzazione e la sperimentazione della propensione non si escludono a vicenda. I due funzionano meglio quando combinati, quando un modello di propensione alimenta un programma di sperimentazione e viceversa.
Anche se non affronti nessuna delle sfide della sperimentazione menzionate da Royston-Webb, la modellazione della propensione può aiutarti:
- Riempi la tua pipeline;
- Risparmia tempo nella ricerca quantitativa sulla conversione;
- Esplora le opzioni di segmentazione più intelligenti.
Come costruire un modello di propensione
Non tutti i modelli di propensione sono uguali.
Come spiega Mojan Hamed, Data Scientist presso Shopify, non c'è carenza di opzioni tra cui scegliere e nessuna è intrinsecamente superiore:
Mojan Hamed:
Il primo passo è scegliere un modello perché hai alcune opzioni. Ad esempio, invece di misurare la propensione a sfornare, è possibile scegliere un'analisi di sopravvivenza.
La regressione è una buona opzione perché è molto interpretabile per un pubblico non tecnico, il che significa che può essere comunicato facilmente.
È anche meno di una scatola nera, rendendo il rischio più gestibile. Se qualcosa va storto e la precisione è bassa o si ottiene un risultato inaspettato, è facile eseguire il drill-down della formula e capire come risolverlo.
Ad esempio, se stai effettuando una previsione e noti che alcuni segmenti funzionano bene con i modelli di base, mentre altri no, puoi scavare più a fondo in quei segmenti a bassa precisione per identificare il problema. Con la regressione, l'intero processo non richiederà più di qualche minuto. Con altri modelli, questa diagnosi richiede più tempo e è complessa.
Dopo aver selezionato il modello adatto a te (in questo articolo, ci concentreremo sulla regressione), la sua costruzione prevede tre passaggi:
- Selezione delle tue funzionalità;
- Costruire il tuo modello di propensione;
- Calcolo dei punteggi di propensione.
Edwin Chen, ingegnere del software di Google, sintetizza il processo in modo più dettagliato:
Edwin Chen:
Innanzitutto, seleziona le variabili da utilizzare come funzionalità. (ad es. quali alimenti le persone mangiano, quando dormono, dove vivono, ecc.)
Quindi, costruisci un modello probabilistico (diciamo, una regressione logistica) basato su queste variabili per prevedere se un utente inizierà a bere Soylent o meno. Ad esempio, il nostro set di formazione potrebbe consistere in un gruppo di persone, alcune delle quali hanno ordinato Soylent nella prima settimana di marzo 2014 e formeremo il classificatore per modellare quali utenti diventano gli utenti Soylent.
La stima probabilistica del modello che un utente inizierà a bere Soylent si chiama punteggio di propensione.
Formare un certo numero di secchi, diciamo 10 secchi in totale (un secchio copre gli utenti con una propensione a 0,0 – 0,1 per prendere la bevanda, un secondo secchio copre gli utenti con una propensione di 0,1 – 0,2 e così via) e posiziona le persone in ognuno .
Infine, confronta i bevitori e i non bevitori all'interno di ogni secchio (diciamo, misurando la loro successiva attività fisica, peso o qualsiasi misura di salute) per stimare l'effetto causale di Soylent.
Esploriamo ogni ulteriore passo.
1. Selezione delle funzionalità per il modello di propensione
Innanzitutto, devi scegliere le funzionalità per il tuo modello di propensione. Ad esempio, potresti considerare:
- Pietre miliari del prodotto;
- Download di app e temi;
- demografia;
- Utilizzo del dispositivo;
- Cronologia degli acquisti;
- Selezione del piano.
La tua immaginazione è l'unico limite.
La selezione delle funzioni è più semplice quando sei interessato solo a una previsione. Puoi semplicemente aggiungere tutte le funzionalità di cui sei a conoscenza. Meno rilevante è la funzione, più il coefficiente sarà vicino a 0. Se sei interessato a capire la fattori di tale previsione, diventa più difficile.
Come spiega Hamed, ci sono alcuni controlli e saldi:
Mojan Hamed:
Diciamo che quando si allena il modello, lo si allena sul 50% dei dati storici e lo si verifica sul restante 50%. In altre parole, nascondi la variabile che stai cercando di prevedere dal modello nel gruppo di test e provi a fare in modo che il modello preveda il valore, in modo da poter vedere quanto riesci a prevedere qualcosa per cui hai già degli effettivi.
Se desideri interpretare i coefficienti, devi assicurarti che l'errore (il valore effettivo, quello che hai previsto) non abbia alcuna correlazione con la variabile che stai cercando di prevedere. In tal caso, significa che nel set di dati è presente una tendenza che non stai acquisendo nelle tue funzioni. È un buon segno che hai una variabile che dovresti includere e che non lo sei già.
Inoltre, assicurati che due funzioni non siano linearmente correlate tra loro. Sarebbe un buon caso d'uso per rimuovere una funzione.
Che tu sia interessato a interpretare o meno i coefficienti, una cosa è certa: dovrai raccogliere informazioni dagli esperti interni. Nonostante la credenza popolare, la modellizzazione della propensione non diminuisce la necessità di know-how commerciale e di marketing.
Quindi, raccogli una stanza piena di esperti di dominio: e-mail marketer, ottimizzatori di conversione, data scientist, esperti di finanza, specialisti di CRM, chiunque abbia un acume commerciale rilevante.
Esistono numerosi modi matematici per decidere quali funzionalità selezionare, ma non possono sostituire la conoscenza e l'esperienza umana.
2. Costruire il tuo modello di propensione
La regressione è già stata menzionata alcune volte. Ma cos'è esattamente l'analisi di regressione? È una tecnica di modellazione predittiva che esamina la relazione tra una variabile dipendente (ad es. Conversione lead-to-customer) e variabili indipendenti (ad es. Pietre miliari del prodotto, download di app e temi, ecc.)
Jim Frost, specialista in comunicazioni tecniche e statistiche presso Minitab, spiega:
Jim Frost:
Nell'analisi di regressione, i coefficienti nell'equazione di regressione sono stime dei parametri effettivi della popolazione. Vogliamo che queste stime dei coefficienti siano le migliori stime possibili!
Supponi di richiedere un preventivo, ad esempio per il costo di un servizio che stai considerando. Come definiresti un preventivo ragionevole?
- Le stime dovrebbero tendere a raggiungere l'obiettivo. Non dovrebbero essere sistematicamente troppo alti o troppo bassi. In altre parole, dovrebbero essere in media imparziali o corretti.
- Riconoscendo che le stime non sono quasi mai esatte, si desidera ridurre al minimo la discrepanza tra il valore stimato e il valore effettivo. Le grandi differenze sono cattive!
Queste due proprietà sono esattamente ciò di cui abbiamo bisogno per le nostre stime dei coefficienti!
Ai fini di questo articolo, vorrai conoscere la regressione lineare e logistica.
Nella regressione lineare, il risultato è continuo, il che significa che può avere un numero infinito di valori potenziali. È ideale per peso, numero di ore, ecc. Nella regressione logistica, il risultato ha un numero limitato di valori potenziali. È ideale per sì / no, 1 ° / 2 ° / 3 °, ecc.
3. Calcolo dei punteggi di propensione
Dopo aver costruito il modello di propensione, allenarlo utilizzando un set di dati prima di calcolare i punteggi di propensione. Il modo in cui si allena il modello di propensione e si calcolano i punteggi di propensione dipende dalla scelta della regressione lineare o logistica.
Hamed spiega:
Mojan Hamed:
In un modello di regressione lineare, moltiplica letteralmente i coefficienti per i valori e ti dà un numero continuo. Pertanto, se la tua formula è customer_value = 0,323 (sessioni al mese), dove 0,323 è il coefficiente per le tue sessioni al mese, moltiplica il numero di sessioni che hai avuto quel mese per 0,323.
Per la regressione logistica, il valore previsto ti dà una probabilità di log e il calcolo può convertirlo in una probabilità. Questa probabilità è ciò che interpretiamo come il "punteggio".
È importante che il modello di propensione funzioni con i tuoi dati del mondo reale. Questo è un esempio perfetto di come la modellizzazione e la sperimentazione della propensione vanno di pari passo. La sperimentazione può validare l'accuratezza dei punteggi di propensione.
Non importa quanto tu sia sicuro dell'accuratezza, esegui un esperimento. Potrebbero esserci fattori che non hai considerato. Oppure, ad esempio, il modello può ottimizzare inaspettatamente la quantità (ad es. Tasso di conversione da sessione a lead) senza considerare l'impatto sulla qualità (ad esempio tasso di conversione da lead a cliente, conservazione, ecc.)
L'uso della sperimentazione per convalidare la modellizzazione della propensione è fondamentale. Ti dà tranquillità.
Ancora una volta, la modellazione della propensione è uno strumento a disposizione di un ottimizzatore, non un sostituto per una comprensione approfondita della sperimentazione e dell'ottimizzazione. Approfitta di quanto sia aperta la regressione: guarda sotto il cofano e assicurati che i dati che stai vedendo ha senso prima di correre selvaggio con esso.
Come utilizzare il modello di propensione per una sperimentazione più intelligente
Lo so, lo so. Non hai bisogno di un'altra lezione su come la correlazione non sia causalità. Ma, con i modelli di propensione, è facile vedere la causalità dove non esiste.
In un modello di regressione, non puoi presumere che le caratteristiche abbiano una relazione causale con la variabile che stai tentando di prevedere.
È facile guardare il modello e vedere, ad esempio, che il download di app X durante una prova è una buona indicazione del fatto che il lead verrà convertito in cliente. Ma non c'è assolutamente alcuna prova che guidare un maggior numero di download di app durante una prova renderà chiunque più propenso a convertirsi in cliente.
Un'altra importante avvertenza: Non sostituire i punteggi di propensione alla tua (molto preziosa) conoscenza dell'ottimizzazione.
La modellazione della propensione, come altri strumenti, non te lo dirà Come ottimizzare. Quando apri Google Analytics o accendi una dashboard di Adobe Analytics, le intuizioni non cadono dallo schermo e in grembo. Usi la tua esperienza, conoscenza e intuizione per cercare queste intuizioni.
Ad esempio, potresti sapere che è molto probabile che un cliente agiti grazie al tuo modello di propensione. Ma il valore di ciò che spendi per evitare che lo sfornamento sia superiore al valore della vita di quel cliente? Il tuo modello non può rispondere a questa domanda, non è un sostituto del pensiero critico.
Tutto apposto. Mentre passiamo delicatamente su tutto quel nastro di attenzione, diamo un'occhiata a tre preziosi modelli di propensione che gli ottimizzatori possono sfruttare:
- Propensione all'acquisto o alla conversione. Con quale probabilità i visitatori, i lead e i clienti possono effettuare un acquisto o passare al passaggio successivo della canalizzazione? Coloro che hanno un punteggio di propensione inferiore hanno bisogno di più incentivi rispetto ad altri (ad esempio, potresti offrire uno sconto più elevato se sei un negozio di e-commerce).
- Propensione all'annullamento dell'iscrizione. Con quale probabilità destinatari, lead e clienti possono annullare l'iscrizione alle tue liste e-mail? A quelli con un punteggio di propensione più elevato, potresti provare a ridurre la frequenza delle e-mail o inviare un'offerta speciale per rafforzare il valore di rimanere un abbonato.
- Propensione a sfornare. Chi sono i tuoi lead e clienti a rischio? Se hanno un punteggio di propensione elevato, potresti sperimentare campagne di riconquista all'interno del prodotto o assegnare concierge di account per riconnetterli con la tua proposta di valore fondamentale.
Il modello di propensione non è prescrittivo. Sapere che un gruppo di lead ha una maggiore propensione a convertirsi da solo non è particolarmente prezioso. La cosa preziosa è combinare questa conoscenza con il know-how di ottimizzazione per eseguire esperimenti più intelligenti e mirati ed estrarre approfondimenti trasferibili.
Conclusione
Il futuro non è una scienza esatta. (Probabilmente, la scienza esatta non è una scienza esatta.) Ma è possibile prevedere il futuro con un ragionevole grado di certezza con la modellazione della propensione. Tutto ciò che serve è un processo rigoroso e uno scienziato di dati.
Ecco la procedura dettagliata:
- Seleziona le tue funzionalità con un gruppo di esperti di dominio. Valuta attentamente se vuoi interpretare i coefficienti o meno.
- Dopo aver scelto la regressione lineare o logistica, costruisci il tuo modello.
- Allena il tuo modello utilizzando un set di dati e calcola i punteggi di propensione.
- Usa la sperimentazione per verificare l'accuratezza dei punteggi di propensione.
- Combina la modellizzazione della propensione con la tua esperienza di ottimizzazione per eseguire esperimenti più intelligenti e mirati che portano a approfondimenti più preziosi e più trasferibili.
Sarai in grado di spingere i tuoi dati oltre ciò che è già accaduto e verso ciò che è probabilmente succederà in futuro.