Seuraava artikkeli auttaa sinua: Mitä Uplift-mallinnus on ja miten se voidaan tehdä CausalML:n avulla?
Kohotuksen mallinnus on ennakoiva mallinnustekniikka, joka käyttää koneoppimismalleja arvioidakseen hoidon lisävaikutusta käyttäjätasolla. Sitä käytetään usein tuotetarjonnan personointiin sekä kampanjoiden ja mainosten kohdistamiseen. Syy-seurannan yhteydessä tässä artikkelissa keskustelemme nousun mallintamisesta, sen mallinnustyypeistä ja lopuksi näemme kuinka Python-pohjaista pakettia nimeltä CausalML voidaan käyttää kausaalipäätelmän käsittelemiseen. Seuraavassa on tärkeimmät kohdat, joista keskustellaan tässä artikkelissa.
Sisällysluettelo
- Mitä Uplift-mallinnus on?
- Mallintamisen tyypit
- Yleisiä sovelluksia
- Miten CausalML kohottaa?
- CausalML:n ominaisuudet
Aloitetaan keskustelu ymmärtämällä kohotusmallinnus.
Mitä Uplift-mallinnus on?
Uplift-mallinnus on ennustava mallinnustekniikka, joka ennustaa terapian (kuten suoramarkkinointikampanjan) lisävaikutuksen henkilön käyttäytymiseen. Kohotuksen mallinnus käyttää satunnaistettua tieteellistä kontrollia toimenpiteen tehokkuuden testaamiseen sekä ennakoivan mallin rakentamiseen, joka heijastaa toiminnan lisävasteen.
Vastaus voi olla erillinen (esimerkiksi käynti verkkosivustolla) tai jatkuva (esimerkiksi puhelu) (esimerkiksi asiakkaan tulot). Uplift-mallinnus on tiedon louhintamenetelmä, jota on käytetty enimmäkseen lisämyynti-, ristiinmyynti-, vaihtuvuus- ja säilytystoimintoihin rahoituspalvelu-, televiestintä- ja vähittäiskaupan suoramarkkinointitoimialoilla.
Koneoppimista käytetään vastaamaan kysymykseen “Kuinka todennäköistä on, että kuluttaja ostaa tulevaisuudessa?” ostoalttiusmallissa, joka olennaisesti selittää asiakkaan käyttäytymisen tiettyä toimintaa kohtaan. Tätä parantaa nousumallinnus, joka käsittelee kiireellisempiä ongelmia:
- Ostiko ostaja minulta mainokseni takia?
- Hukasinko rahaa mainostamalla asiakkaita, jotka olivat jo päättäneet ostaa?
- Onko markkinoinnillani ollut negatiivinen vaikutus (negatiivinen vaikutus) jonkun oston todennäköisyyteen?
Toisin sanoen perinteinen taipumusmalli (samoin kuin useimmat koneoppimisalgoritmit) ennustaa tuloksen (y) muuttujajoukon (x) perusteella. Tietyt muuttujat huomioon ottaen nousu pyrkii määrittämään hoidon
Termi “kohoaminen” viittaa lisääntyneeseen tulokseen hoidon aikana verrattuna tulokseen ilman hoitoa. Emme voi suoraan havaita tätä eroa tai kausaalista vaikutusta, vaan meidän on pääteltävä se kokeilun avulla. Kuten alla olevasta kuvasta käy ilmi, on erittäin hyödyllistä visualisoida 2 x 2 -matriisi, jossa on neljä erilaista henkilöä (esimerkiksi), jotka luokitellaan (a) vakuuttaviksi, (b) varmaksi, (c) Älä häiritse, ja (d) Menetetty syy.
Kohdistamme “a”-demografiaan, niihin, jotka ovat vakuuttavia, kannustaaksemme haluttuun reaktioon. Hoito on joko tehotonta tai tuhlaavaa kaikille muille, mukaan lukien Älä häiritse. On riskialtista “herättää nukkuva koira” ottamalla yhteyttä Älä häiritse.
Miellyttävän löytäminen on kohottavan mallinnuksen tavoite. Tietenkin nousumallinnusta voidaan käyttää mallintamaan mitä tahansa ennustettua lopputulosta, olivatpa ne inhimillisiä tai ei, kuten lannoitteiden vaikutusta satoon tai poliittisten kampanjoiden sähköpostien lähettämiseen.
Kohotuksen mallinnus keskittyy hoidon tehokkuuteen, kun taas tyypillinen ennakoiva mallinnus keskittyy tulokseen. Sitten voit keskittyä tapauksiin, joista on todennäköisimmin hyötyä.
Mallintamisen tyypit
Suora mallintaminen ja epäsuora mallintaminen ovat kaksi peruslähestymistapaa tässä. Perimmäinen ero näiden kahden lähestymistavan välillä on se, miten nousumallit mitataan ja arvioidaan.
Suora mallinnus
Suorassa mallintamisessa mallinnetaan “suoraan” todennäköisyyserot kahden erillisen ryhmän välillä. Tähän on olemassa lukuisia lähestymistapoja, joista lähes kaikki perustuvat puupohjaisiin algoritmeihin, joita on hieman muokattu nousevan mallinnuksen mukaisiksi.
Puupohjaiset mallit ovat ihanteellisia, koska ne mallintavat luonnollisesti ryhmätasolla jakamalla ryhmän iteratiivisesti kahteen ryhmään jokaisen jakamispäätöksen yhteydessä. Toisin kuin perinteiset puupohjaiset mallit, jotka on suunniteltu jakamaan tiedot pienempiin ja pienempiin homogeenisiin ryhmiin, nousumallit on suunniteltu jakamaan asiakkaamme heterogeenisiin ryhmiin joka kerta, kun he eroavat (maksimoimalla nousun määrä).
Ne käyttävät erilaisia jakokriteerejä, kuten Kullback-Leibler-hajoamista, euklidista etäisyyttä, p-arvoa ja Chi-neliön etäisyyttä. Satoja puita sovitettaisiin ensemble-tyyliin, samalla tavalla kuin perinteiset puupohjaiset menetelmät.
Epäsuora mallinnus
Säännölliset vastemallit on tarkoitettu päättelemään nousua käyttämällä epäsuoraa nousun mallinnustekniikkaa (meta-oppijat), jotka voivat perustua mihin tahansa perusalgoritmiin. Mallimme vasteen odotettua arvoa eri hoitoille sen sijaan, että yritämme optimoida jonkin verran nousua suoraan.
Suoramainontakampanjassamme laskemme todennäköisyyden, että asiakas käyttää luottokorttiaan, jos DM lähetetään, ja todennäköisyyden, että hän käyttää tuotettaan, jos viestiä ei lähetetä. Arvioitu nousu on kahden arvioidun todennäköisyyden välinen ero. Käytännössä tämä voi olla kahden mallin lähestymistapa (erillinen malli, joka sovitetaan kaikkiin kontrolli-/hoitoryhmiin) tai yhtenäinen malli (yksi malli, johon on varattu ominaisuustilan hoito-osa).
Yleisiä sovelluksia
Alla on joitain mahdollisia sovelluksia, jotka on selostettu eri toimialoilta.
- Kohotuksen mallinnus voi auttaa ymmärtämään, kuinka hoidot voivat vaikuttaa tiettyihin ryhmiin eri tavalla kuin pelkkä tulosten vertaaminen koko hoitoryhmään verrattuna kontrolliryhmään. Ja kuinka paljon nämä vaikutukset eroavat toisistaan?
- Yritys haluaa pelastaa vaihtuvia asiakkaita ottamalla yhteyttä heihin. Tavoittaessaan asiakkaita yritys haluaa välttää heidän häiritsemisen entisestään keskittymällä vain korkean riskin säästäviin asiakkaisiin.
- Yritys haluaa toteuttaa ristiinmyyntikampanjan, mutta se ei halua ristiinmyyntiä kaikille, koska resurssit ovat rajalliset ja jotkut asiakkaat eivät ehkä tarvitse tai halua muita tuotteita.
- Yrityksellä on liiditietokanta, mutta se tuottaa enemmän liidejä kuin se pystyy toimimaan, ja monet liideistä ovat ajanhukkaa – agentit voivat nyt työstää liidejä missä tahansa järjestyksessä.
Miten CausalML kohottaa?
CausalML on Python-moduuli, joka tarjoaa sarjan nousun mallinnus- ja kausaalien päättelytyökaluja, jotka perustuvat huippuluokan tutkimukseen ja koneoppimisalgoritmeihin. Perinteiset syy-analyysimenetelmät, kuten t-testien suorittaminen satunnaistetuissa kokeissa (A/B-testaus), voivat arvioida hoidon tai toimenpiteen keskimääräisen hoitovaikutuksen (ATE).
Monissa sovelluksissa näiden vaikutusten arvioiminen tarkemmassa mittakaavassa on kuitenkin usein toivottavaa ja hyödyllistä. Loppukäyttäjä voi käyttää CausalML:ää arvioidakseen ehdollisen keskimääräisen hoitovaikutuksen (CATE), joka on vaikutus yksilön tai segmentin tasolla. Tällaiset arviot voivat mahdollistaa monenlaisia sovelluksia personointiin ja optimointiin soveltamalla erilaisia hoitoja eri käyttäjille.
Uplift-mallinnus on CausalML:n mahdollistama ratkaiseva mallinnustapa. Kohotuksen mallinnus on kausaalinen oppimismenetelmä kokeen yksilöllisen hoitovaikutuksen arvioimiseksi. Kokeellisten tietojen avulla loppukäyttäjä voi laskea hoidon (kuten suoramarkkinointitoimenpiteen) lisävaikutuksen yksilön käyttäytymiseen.
Jos yritys esimerkiksi päättää useiden tuotelinjojen välillä myydäkseen lisä-/ristikkäismyyntiä asiakkailleen, CausalML:ää voidaan käyttää suositusmoottorina tunnistamaan tuotteet, jotka tuottavat suurimman odotetun tuoton kullekin käyttäjälle.
CausalML tarjoaa johdonmukaisen API:n nousualgoritmien suorittamiseen, mikä tekee siitä yhtä yksinkertaista kuin standardin luokittelu- tai regressiomallin sovittaminen. Mukana olevia mittareita ja visualisointitoimintoja, kuten nousukäyriä, voidaan käyttää mallin suorituskyvyn arvioimiseen. CausalML:n ensimmäinen versio sisältää kahdeksan huippuluokan nousun mallinnusalgoritmia (näkyy alla olevassa kuvassa).
CausalML:n ominaisuudet
Kohdistuksen optimointi, sitouttamisen personointi ja syy-vaikutusten analyysi ovat vain muutamia CausalML:ien käyttötapauksia.
Kohdistuksen optimointi
Voimme käyttää CausalML:ää kohdistaaksemme promootiot ihmisille, jotka tuovat eniten lisäarvoa yritykselle. Voimme esimerkiksi tarjota kampanjoita kuluttajille, jotka todennäköisemmin hyödyntävät uutta tuotetta johtuen kampanjoista jo olemassa olevien asiakkaiden ristiinmyyntimarkkinointikampanjassa.
Syy-vaikutusten analyysi
Voimme myös käyttää CausalML:ää tutkiaksemme tietyn tapahtuman kausaalista vaikutusta käyttämällä kokeellisia tai havainnointitietoja, joissa on runsaasti attribuutteja. Voimme esimerkiksi tutkia, kuinka asiakkaan ristiinmyyntitapahtuma vaikuttaa pitkän aikavälin alustakuluihin.
Personointi
Sitoutumisen personointiin voidaan käyttää CausalML:ää. Yritys voi kommunikoida asiakkaidensa kanssa monin eri tavoin, kuten tarjoamalla lisämyyntivaihtoehtoja tai käyttämällä viestikanavia vuorovaikutukseen. CausalML:n avulla voidaan arvioida kunkin yhdistelmän vaikutus kullekin asiakkaalle ja tarjota asiakkaille mahdollisimman räätälöityjä tarjouksia.
Viimeiset sanat
Tässä artikkelissa olemme keskustelleet mallin nostamisesta, joka on pohjimmiltaan tekniikka, joka mallintaa käyttäjän käyttäytymistä soveltamalla toimenpiteitä syötemuuttujien ohella. Olemme myös keskustelleet sen tärkeimmistä mallintamistyypeistä ja joistakin sovelluksista, joissa sitä voidaan soveltaa. Tässä artikkelissa olemme keskustelleet CausalML-nimisestä python-paketista, joka antaa polun kausaalisen päättelyn tai kohotuksen käytännössä toteuttamiseen. Jos haluat ymmärtää lisää nousumallinnuksen toteuttamista CausalML:n avulla, voit katsoa heidän GitHub-tietovarastonsa, jossa he ovat listanneet monia toteutusesimerkkejä.