天天看點

Qunar使用者畫像建構政策及應用實踐

Qunar使用者畫像建構政策及應用實踐

 1.使用者畫像的建構原則

我們做使用者畫像的目的有兩個:

必須從業務場景出發,解決實際的業務問題,之是以進行使用者畫像要麼是擷取新使用者,或者是提升使用者體驗,或者是挽回流失使用者等有明确的業務目标 。根據使用者畫像的資訊做産品設計,必須要清楚知道使用者長什麼樣子,有什麼行為特征和屬性,這樣才能為使用者設計産品或開展營銷活動。

一般常見的錯誤想法是畫像次元的資料越多越好,畫像資料越豐富越好,費了很大的力氣進行畫像後,卻發現隻剩下了使用者畫像,和業務相差甚遠,沒有辦法直接支援業務營運,投入精力巨大但是回報微小,可以說得不償失。鑒于此,我們的畫像的次元和設計原則都是緊緊跟着業務需求去推動。

2.使用者畫像資料倉庫建構

2.1 資料源的內建

Qunar使用者畫像建構政策及應用實踐

目前qunar使用者畫像資料倉庫中的資料源來自業務資料庫的資料和使用者行為日志資料,目前資料倉庫中基本涵蓋了機票、酒店、火車票以及保險等業務系統的資料,可以從全方位的了解去哪兒的一個使用者的畫像。

2.2 我們有哪些資料?-資料次元

Qunar使用者畫像建構政策及應用實踐

  2.3 我們有哪些資料?-資料倉庫

目前我們畫像資料倉庫的建構都是基于qunar基礎資料倉庫進行建構,并按照次元進行劃分。

Qunar使用者畫像建構政策及應用實踐

  目前資料倉庫中包括的資訊如下:

畫像資料倉庫表20個畫像資料倉庫國内、國際 2年+資料标簽資料每日增量

–基本資料

–業務資料

–搜尋

–booking

2.4 使用者唯一辨別設計

使用者唯一辨別是整個使用者畫像的核心,它把從使用者開始使用app到下單到售後整個所有的使用者行為軌迹進行關聯,可以更好的去跟蹤和描繪一個使用者的特征。

Qunar使用者畫像建構政策及應用實踐

  2.5 etl過程設計-排程系統

依賴資料平台排程系統定時觸發和job依賴觸發兩種模式

Qunar使用者畫像建構政策及應用實踐

  2.6 etl過程設計-任務執行

etl的過程主要是将資料源的清洗到資料倉庫表的過程(每天更新增量)summary表的處理邏輯(每天更新全量)标簽庫的處理(每周更新,2年全量)

Qunar使用者畫像建構政策及應用實踐

  2.7 使用者主題分析及資料挖掘

有了豐富的畫像資料後,産品和營運人員可以根據使用者主題進行資料分析和資料挖掘相關的工作。使用者主題cube的定義如下:

measure:

–訂單數量

–訂單金額

–搜尋次數

–booking次數

dimension:

–下單時間

–出發時間

–航司資訊

–艙位資訊

–航班(出發地、目的地)

–基本資訊(年齡、性别等自然屬性)

Qunar使用者畫像建構政策及應用實踐

  3.使用者畫像标簽建構政策

3.1使用者标簽特征屬性

使用者的特征屬性可以是事實的,也可以是抽象的;可以是自然屬性,比如性别,年齡,星座等,可以是社會屬性,比如職業,社交,出生地等;還可以是财富狀況,比如是否高收入人群,是否有豪車豪宅等固定資産,對于機票使用者來講位置特征也是比較重要的屬性,比常駐地,常出差地,老家等。這些屬性都可以清楚的描繪一個使用者的畫像特征。

Qunar使用者畫像建構政策及應用實踐

畫像标簽一般根據公司的業務體系來設計,存儲有hdfs,hbase,es标簽的更新頻率:每日更新,每周、每月更新标簽的生命周期:有的資料随時間衰減疊代

3.2使用者标簽分類及特征項

提到使用者畫像就不得不提到一個詞“标簽”。标簽是表達人的基本屬性、行為傾向、興趣偏好等某一個次元的資料辨別,它是一種相關性很強的關鍵字,可以簡潔的描述和分類人群。标簽的定義來源于業務目标,基于不同的行業,不同的應用場景,同樣的标簽名稱可能代表了不同的含義,也決定了不同的模型設計和資料處理方式。我們給機票使用者畫像打标簽分類為兩大類,基礎類标簽和個性化标簽,這些标簽可以有重複,但是都是通過不同的角度去定義和刻畫一個使用者,來滿足不同的業務營銷需求。

Qunar使用者畫像建構政策及應用實踐

  3.3使用者标簽庫建構流程

Qunar使用者畫像建構政策及應用實踐

  4.使用者畫像技術架構

4.1 技術架構

Qunar使用者畫像建構政策及應用實踐

  4.2 實施方法論

Qunar使用者畫像建構政策及應用實踐

  5.使用者畫像資料應用實踐

5.1 使用者群體特征分析

設計目标

–根據條件可選項,輸出篩選使用者群體

–圖形展示使用者群體屬性特征

應用場景

–如果篩選的使用者群組滿足業務的要求,将篩選條件形成參數

–根據參數提供接口查詢

Qunar使用者畫像建構政策及應用實踐
Qunar使用者畫像建構政策及應用實踐

  5.2 客戶行為預測

客戶行為預測建立步驟

模組化資料準備客戶流失節點判斷模型應用變量确定模型構模組化型應用模型驗證

Qunar使用者畫像建構政策及應用實踐

  可以對使用者流失做及時預測指導建議使用者維系營運。

5.3 資料和業務在一起

使用者畫像與業務産品互相依賴,相輔相成

使用者畫像标簽庫豐富優化快速提供資料服務資料分析+機器學習+模型訓練

Qunar使用者畫像建構政策及應用實踐

  6.總結

使用者畫像作為大資料的根基,它完美的描述了一個使用者的資訊全貌,為進一步精準、快速的分析使用者行為、消費等重要資訊,使用者畫像倉庫同時也提供了足夠的資料基礎,讓我們qunar更好的為使用者提供高價值的服務,滿足使用者智慧出行的需要。

作者介紹李國芳,去哪兒網機票大資料組,精于架構,追求極緻。曾先後搭建起機票實時資料處理系統,并主導使用者畫像項目,指導各業務線精準定位使用者。在資料倉庫方面,搭建saiku + kylin + hive平台,為營運及業務分析人員提供更快速精确的olap工具。技術涉獵廣泛,樂于分享和激勵新人。

本文轉自d1net(轉載)

繼續閱讀