原文連結:http://tecdat.cn/?p=5383
介紹
在一個典型的“從思考到購買”的顧客旅程中,顧客在購買最終産品之前要經過多個接觸點。這在電子商務銷售方面更為突出。跟蹤哪些是客戶在最終購買之前遇到的不同接觸點相對更容易。
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiIn5GcuY2YkNzYxEmMwATNkNmN3IWYiFDNwgTMxgDM0MWOykTMvwlMxMDM4EDMy8CXzV2Zh1WavwVbvNmLzNWdo92cu4GZj5SNyITN5UTZ4gTOwIWNvw1LcpDc0RHaiojIsJye.png)
随着市場營銷越來越多地朝着消費者驅動的方向發展,确定正确的管道來瞄準客戶已經成為企業的關鍵。這有助于公司優化營銷支出,并在合适的地點針對合适的客戶。
通常情況下,公司通常投資于最終購買前客戶遇到的最後一個管道。但是,這可能并不總是正确的做法。該頻道之前有多個頻道,最終推動客戶轉換。研究這種行為的基本概念被稱為“多管道歸因模組化”。
在這篇文章中,我們看看什麼是管道歸因,以及它如何與馬爾可夫鍊的概念聯系起來。我們還将通過一個電子商務公司的案例研究來了解這個概念在理論上和實踐上如何運作(使用R)。
什麼是管道歸因?
Google Analytics為歸因模組化提供了一套标準規則。根據Google的說法,“歸因模型是決定銷售和轉化功勞如何配置設定給轉化路徑中的接觸點的規則或一組規則。例如,Google Analytics中的最後一次互動模型會為緊接銷售或轉化之前的最終接觸點(即,點選次數)配置設定100%的功勞。相比之下,第一個互動模型為啟動轉化路徑的接觸點配置設定100%的功勞。“
我們将在本文後面看到最後一個互動模型和第一個互動模型。在此之前,讓我們舉一個小例子,進一步了解管道歸因。假設我們有一個轉換圖,如下所示:
在上述情況下,客戶可以通過頻道'C1'或頻道'C2'開始他們的旅程。以C1或C2開始的機率為50%(或0.5)。我們首先計算轉換的總體機率,然後進一步檢視每個通道的影響。
P(轉換)= P(C1→C2→C3→轉換)+ P(C2→C3→轉換)
= 0.5 * 0.5 * 1 * 0.6 + 0.5 * 1 * 0.6
= 0.15 + 0.3
= 0.45
馬爾可夫鍊
馬爾可夫鍊是一個過程,它映射運動并給出機率分布,從一個狀态轉移到另一個狀态。馬爾可夫鍊由三個屬性定義:
狀态空間 - 處理可能存在的所有狀态的集合
轉換操作符 - 從一個狀态轉移到另一個狀态的機率
目前狀态機率分布 - 在過程開始時處于任何一個狀态的機率分布
我們知道我們可以通過的階段,從每條路徑移動的機率以及我們知道目前狀态的可能性。這看起來與馬爾可夫鍊相似,不是嗎?
事實上,這是一個馬爾可夫鍊的應用。我們稍後會回來; 現在讓我們堅持我們的例子。如果我們要弄清楚管道1在我們的客戶從始至終轉換的旅程中的貢獻,我們将使用去除效果的原則。去除效果原則說,如果我們想要在客戶旅程中找到每個頻道的貢獻,我們可以通過删除每個頻道并檢視在沒有該頻道的情況下發生了多少次轉化。
例如,我們假設我們必須計算通道C1的貢獻。我們将從模型中删除通道C1,并檢視圖檔中沒有C1的情況下發生了多少次轉換,即所有通道完好無損時的總轉換次數。我們計算通道C1:
P(去除C1後的轉換)= P(C2→C3→轉換)
= 0.5 * 1 * 0.6
= 0.3
30%的客戶互動可以在沒有C1頻道的情況下進行轉換; 而C1完好無損,45%的互動可以轉換。是以,C1的去除效果是
0.3 / 0.45 = 0.666。
C2和C3的去除效果為1(您可以嘗試計算,但直覺地認為,如果我們要删除或者C2或C3,我們将能夠完成任何轉換?)。
這是馬爾可夫鍊的一個非常有用的應用。在上述情況下,所有通道--C1,C2,C3(在不同階段)被稱為轉換狀态 ; 而從一個信道移動到另一個信道的機率稱為轉移機率。
客戶旅程是一系列管道,可以看作是一個有向馬爾可夫圖中的一個鍊,其中每個頂點都是一個狀态(管道/接觸點),每條邊表示從一個狀态移動到另一個狀态的轉移機率。由于到達狀态的機率僅取決于以前的狀态,是以可以将其視為無記憶馬爾可夫鍊。
電子商務公司案例研究
讓我們進行真實案例研究,看看我們如何實施管道歸因模組化。
一家電子商務公司進行了一項調查并收集了客戶的資料。這可以被認為是具有代表性的人群。在調查中,公司收集了有關客戶通路各種觸點的資料,最終在其網站上購買該産品。
總共有19個管道,客戶可以遇到産品或産品廣告。在19個頻道之後,還有三種情況:
#20 - 客戶決定購買哪種裝置;
#21 - 客戶已經做出最終購買,并且;
#22 - 客戶尚未決定。
管道的總體分類如下:
類别管道
網站(1,2,3)公司網站或競争對手的網站
研究報告(4,5,6,7,8)行業咨詢研究報告
線上/評論(9,10)有機搜尋,論壇
價格比較(11)聚合器
朋友(12,13)社交網絡
專家(14)專家線上或離線
零售店(15,16,17)實體商店
雜項。(18,19)其他如促銷活動在不同的地點
現在,我們需要幫助電子商務公司确定投資營銷管道的正确政策。應該關注哪些管道?公司應該投資哪些管道?我們将在下一節中使用R來解決這個問題。
使用R的實作
讓我們繼續前進,嘗試在R中的實作并檢查結果。
輸出:
R05A.01R05A.02R05A.03R05A.04... ..R05A.18R05A.19R05A.20
1643五NANANA
21910NANANA
9132016NANANA
8152021NANANA
1691320NANANA
11184NANANA
我們将進行一些資料處理,将其帶入一個階段,我們可以将其用作模型中的輸入。然後,我們将确定哪些客戶旅程已進行最終轉換(在我們的情況下,所有旅程都已達到最終轉換狀态)。
我們将建立一個特定格式的變量'路徑',可以作為模型的輸入。另外,我們将使用“dplyr”包找出每條路徑的總發生次數。
路徑轉變
1> 1> 1> 201
1> 1> 12> 121
1> 1> 14> 13> 12> 201
1> 1> 3> 13> 3> 201
1> 1> 3> 17> 171
> 1> 6> 1> 12> 20> 121
輸出:
路徑轉變
1> 1> 1> 201
1> 1> 12> 121
1> 1> 14> 13> 12> 201
1> 1> 3> 13> 3> 201
1> 1> 3> 17> 171
1> 1> 6> 1> 12> 20> 121
現在,我們将建立一個啟發式模型和一個馬爾科夫模型,将兩者結合起來,然後檢查最終結果。
輸出:
CHANNEL_NAMEfirst_touch_conversions... ..linear_touch_conversionslinear_touch_value
113073.77366173.773661
200473.998171473.998171
127576.12786376.127863
143456.33574456.335744
13320204.039552204.039552
3168117.609677117.609677
173176.58384776.583847
65054.70712454.707124
85653.67786253.677862
10547211.822393211.822393
1166107.109048107.109048
16111156.049086156.049086
219994.11166894.111668
4231250.784033250.784033
72633.43599133.435991
五6274.90040274.900402
9250194.07169194.07169
152265.15922565.159225
1845.0265875.026587
191012.67637512.676375
輸出:
CHANNEL_NAMEtotal_conversiontotal_conversion_value
182.48296182.482961
20432.40615432.40615
1283.94258783.942587
1463.0867663.08676
13195.751556195.751556
3122.973752122.973752
1783.86672483.866724
663.28082863.280828
861.01611561.016115
10209.035208209.035208
11118.563707118.563707
16158.692238158.692238
298.06719998.067199
4223.709091223.709091
741.91924841.919248
五81.86547381.865473
9179.483376179.483376
1570.36077770.360777
185.9508275.950827
1915.54542415.545424
在進一步讨論之前,我們先來了解一下我們上面看到的一些術語的含義。
第一次觸摸轉換:當該頻道是客戶的第一個觸摸點時,通過頻道進行的轉換。第一個觸點獲得100%的功勞。
上次觸摸轉換:當該頻道是客戶的最後一個接觸點時,通過頻道發生的轉化。100%信用給予最後的接觸點。
線性觸控轉換:所有通道/觸控點在轉換中均享有同等榮譽。
回到R代碼,讓我們合并這兩個模型,并以更容易了解的視覺吸引人的方式表示輸出。
從上圖中可以清楚地看到情景。從第一次觸摸轉換角度來看,頻道10,頻道13,頻道2,頻道4和頻道9非常重要; 而從最後接觸的角度來看,第20頻道是最重要的(在我們的例子中,應該是因為客戶決定購買哪種産品)。就線性觸摸轉換而言,通道20,通道4和通道9是重要的。從總轉換角度來看,頻道10,13,20,4和9非常重要。
結束
在上面的圖表中,我們已經能夠找出哪些是我們關注的重要管道,哪些可以被忽略或忽視。這種情況使我們對客戶分析領域馬爾可夫鍊模型的應用有了很好的了解。電子商務公司現在可以自信地建立他們的營銷政策,并使用資料驅動的見解配置設定他們的營銷預算。