一、标簽體系相關概念
标簽由标簽和标簽值組成,打在目标對象上,如圖所示。
打标簽示例
标簽由網際網路領域逐漸推廣到其他領域,打标簽的對象也由使用者、産品等擴充到管道、營銷活動等。
- 在行業領域,标簽更多助力于戰略分級、智能搜尋、優化營運、精準營銷、優化服務、智慧經營等。
标簽分為事實标簽、規則标簽和模型标簽,如圖所示。
三種類型的标簽
- 規則标簽是對資料加工處理後的标簽,是屬性與度量結合的統計結果,如貨物是否是超重貨物,産品是否是熱銷産品等,标簽是通過屬性結合一些判斷規則生成的,是相對客觀和靜态的;
- 模型标簽則是洞察業務價值導向的不同特征,是對于實體的評估和預測,如消費者的換機消費潛力是旺盛、普通還是低等,标簽是通過屬性結合算法生成的,是主觀和動态的。
标簽管理分為标簽體系建設和打标簽。
01 标簽體系建設
- 根據标簽的複雜程度進行标簽層級設計。
- 進行詳細的标簽和标簽值設計,包括标簽定義、适用範圍、标簽的生成邏輯等:
- 事實标簽應與業務對象中的屬性和屬性值保持一緻,不允許新增和修改;
- 規則标簽按照業務部門的規則進行相關設計;
- 模型标簽根據算法模型生成。
02 打标簽
1. 打标簽資料存儲結構
打标簽是建立标簽值與執行個體資料的關系,可以對一個業務對象、一個邏輯資料實體、一個實體表或一條記錄打标簽。
為了友善從“使用者”視角查找、關聯、消費标簽,可增加使用者表,将标簽歸屬到該“使用者”下,這裡的“使用者”是泛指,可以是具體的人,也可以是一個組織、一個部門、一個項目等。
2. 打标簽的實作方法
- 規則标簽:設計打标簽邏輯由系統自動打标簽。
- 模型标簽:設計打标簽算法模型由系統自動打标簽。
二、資料名額體系相關概念
資料名額就是将大資料之“大”的精髓給提煉出來,展現每日觀察資料的使用者最迫切想要看到的統計量。資料名額體系并不是第三方服務公司的專利,隻要對埋點科學地進行資料采集,每個成型的網際網路公司都可以自己搭建資料名額體系。
資料之大,很多時候人們并不知從哪裡着手,甚至弄不清自己到底想要什麼資料,這時候資料産品經理這一角色應運而生。資料産品經理既要完成資料體系設計,讓原本無序或龐雜的資料變得“規矩”,又要根據業務場景的變化不斷調整項目内容,推進項目進度,推進資料名額體系的建設與疊代。
資料名額體系的規劃是平台型資料産品經理必備的能力,這也是資料産品經理有别于其他産品經理和資料分析師的方面。
《荀子》有雲:“水能載舟,亦能覆舟。”在公司日常營運過程中,資料名額體系就像是水,孕育着生命,承載着萬物。科學的資料名額體系能指引公司在正确的道路上不斷前進,或者使平淡無常的業務煥發新生,而不合理的資料名額體系可能使得業務方無所适從。
01 什麼是資料名額體系?
在了解什麼是資料名額之前,我們思考一下為什麼會出現名額,它是為了解決什麼問題。人類及科學的發展是與時俱進的,早期為了使自然科學的實驗及結果更具統一性及友善标準化衡量,一些标準化的專業名額應運而生。
随着人類社會的發展,社會科學也越來越需要統計學來進行事物的衡量,一系列統計學名額也逐漸産生了。随着新資訊技術的發展,資料名額逐漸被大衆認可為衡量目标的方法。
從社會科學角度看,名額是統計學的範疇,用于資料的描述性統計。名額是說明總體數量特征的概念及其數值的綜合,故又稱為綜合名額。
在實際的統計工作和統計理論研究中,往往直接将說明總體數量特征的概念稱為名額。傳統的名額有國内生産總值(Gross Domestic Product,GDP)、國民生產毛額(Gross National Product,GNP)、居民消費價格指數(Consumer Price Index,CPI)、滬深300指數等。
1. 什麼是資料名額?
資料名額有别于傳統意義上的統計名額,它是通過對資料進行分析得到的一個彙總結果,是将業務單元精分和量化後的路徑成本,使得業務目标可描述、可度量、可拆解。
資料名額需要對業務需求進行進一步抽象,通過埋點進行資料采集,設計一套計算規則,并通過BI和資料可視化呈現,最終能夠解釋使用者行為變化及業務變化。常用的資料名額有PV、UV等。
本文提及的名額是衡量目标的方法,名額由次元、彙總方式和量度組成(見下圖)。
名額的構成
- 彙總方式是指用哪些方法衡量,是統計彙總資料的方式。
- 而量度主要是明确事物的具體目标是什麼,是對一個實體量的測定,也用來明确資料的計量機關。
比如,播放總時長是指使用者在一段時間内播放音頻的時長總和(機關:分鐘)。按照上述拆解,次元是指篩選的一段時間,彙總方式為計算了時間長度的總和,而量度就是統一的機關—分鐘數。
這裡,我們可以了解為名額是由這幾個方面構成,相當于英文的構詞法,字首、字尾等共同形成了一個單詞。
2. 什麼是名額體系?
體系化的本質是将資料名額系統性地組織起來,具體會按照業務模型、按标準對名額不同的屬性分類及分層。當然,不同的業務階段、不同業務類型會有不同階段的劃分标準。
資料名額體系含有十分豐富的統計量,從宏觀上看,它是一個相對全面的有機整體;從微觀上看,每個資料名額都有其特定含義,反映了某一細節的客觀事實。不同的資料名額定義不同,邏輯也不同,這些各種各樣的統計量共同構成了資料名額體系,使其産生不可磨滅的價值。
總的來說,資料名額體系是對業務名額體系化的彙總,用來明确名額的口徑、次元、名額取數邏輯等資訊,并能快速擷取到名額的相關資訊。
02 資料名額體系的價值
資料名額體系是業務資料标準化的基礎,其對名額進行了統一管理,體系化是為了友善統一修改、共享及維護。
宏觀方面,資料名額體系建設是資料中台建設的重要一環,不僅符合“創新驅動”的意識,更是企業實作自身“資料驅動”發展的重要途徑。
随着大資料和人工智能技術的發展,很多企業選擇借助資訊技術實作轉型更新。在大資料時代早期,大部分資料并沒有被充分地挖掘分析和利用。雖然資料規模非常大,但是卻很難利用這些資料創造價值。而資料中台的提出及資料名額體系的建構,使得資料産生了實際價值。
有了資料名額,人們做決策時不再是按照經驗“拍腦袋”,而是看看資料是怎樣呈現的,能夠及時基于資料進行戰略調整及決策規劃。
資料名額體系的價值主要展現在全面支援決策、指導業務營運、驅動使用者增長,同時統一統計口徑(如下圖所示)。其中,作為壓軸作用的統一統計口徑對于資料名額體系而言具有戰略意義。
資料名額體系的價值
在一個整體中,如果不能統一口徑,那麼一切分析及對比的參考價值就會顯得無意義,各方也會陷入公說公有理,婆說婆有理的尴尬局面。由此說明,對于衡量整個公司的業務價值而言,建立一套統一标準的資料名額體系的作用不言而喻。
1. 全面支援決策
資料名額極具參考價值,公司的管理層為了更準确地進行戰略決策,需要搭建完備的資料名額體系。一個相對全面的資料名額體系,可以讓管理者對公司的發展從資料層面有一個比較客觀的認知,而不是管中窺豹,這樣在進行戰略決策時,可以保持相對理性。
而對于新業務的洞察,也可以不斷融入新的資料名額,豐富名額體系,靈活且全面地把握業務發展趨勢,為未來的決策提供借鑒。
2. 指導業務營運
不懂資料的産品不是好營運,為了便捷地了解産品現狀及業務效果,名額體系中會有很多拆解的細分名額,這些資料的變動反映的是使用者對于營運情況的最新回報,為營運的業務決策提供了資料支援。使用者營運可以根據這些資料,了解使用者的喜好,決定下一步的營運政策和活動開展。
例如,對于閱讀行業來說,内容編輯會基于自己對内容的認知,将一組有共性特征的書籍組成一個書單推送給使用者,那麼名額體系中也會有相應的名額反映使用者對這個書單的偏好。内容編輯就可以通過這些名額,了解使用者的偏好,決定下一步是否要繼續嘗試這種類型的專題。
3. 驅動使用者增長
最近最火的詞莫過于使用者增長,資料名額體系中的使用者行為資料,可以讓産品及營運人員對使用者的行為路徑和喜好模式有一個比較深入的了解。剖析使用者的行為特征,助力使用者價值的提升,讓産品及營運更聚焦于産品細節的優化,更好地進行監測,提升使用者留存及轉化。
人們在分析和挖掘使用者行為的過程中,也許會發現不少新的使用者增長點。體系化的名額結合了使用者的場景,且多個不同的名額和次元可以串聯起來進行全局分析,解決了非體系化名額無法串聯的痛點。
公司在深入進行資料分析後,可能會在原有業務中發現某個點潛藏着巨大商業價值,進而單獨把這塊業務重點推進,實作使用者增長的二次騰飛。
4. 統一統計口徑
從技術角度來看,資料中台是為了彙總與融合企業内的全部資料,甚至外部資料,打破資料隔閡,解決資料标準與口徑不一緻的問題。資料名額體系化有個好處是可以實作名額的統一管理,實作統一的統計口徑,避免定義模糊和邏輯混亂,影響資料品質。
同時,完備的資料名額體系也可減少重複統計的問題,進而避免日志上報産生的資料備援和重複分析産生的伺服器資源浪費。
三、資料名額與标簽的差別
從内容上看:名額通常描述客觀事實,标簽往往存在人為劃分。
名額通常是描述客觀事實,并通過不同的統計口徑,疊加不同的計算次元與限定詞來展現客觀事實。名額多為數值型,最常見的資料名額為各類宏觀名額。比如 GDP、CPI,都是一個實實在在的數字,無人為判斷。在金融行業中也存在着海量的名額,比如各類經營名額、不良率等,同樣也是實實在在的數值。具有資料口徑的名額通常是抽象的概念,比如将資料計數、求和、比率等,與具體的實體無關。
但标簽通常是人為定義的概念,比如客群标簽可以分為長尾客戶、高淨值客戶;産品标簽有高風險和低風險。标簽并不是一個客觀的事實,而是由人為的定義和客觀事實結合得到的資料标簽。标簽通常會定位到具體的實體,其核心的目的是劃分不同的實體群組。比如長尾客戶,一定可以通過一些資料名額圈定出一部分人群,通過資料标簽可以進行更加精細化的使用者營運。
從二者之間的關系來說是可以互相轉化的。名額可以從标簽中轉化,比如高淨值客戶的遷移率(從長尾客戶轉化到高淨值客戶的比率),其中高淨值客戶和長尾客戶都是标簽,但在标簽的基礎上增加一個遷徙率,就由标簽轉化為了名額。同樣标簽也可以從名額轉化得來,比如說銀行中常用的資料标簽:私行客戶(AUM>=500萬),其中 AUM 就是資料名額,不同銀行的标簽設定可能是不同的。以上就是資料名額和标簽在内容上的差別。
從分類和場景上看,名額和标簽的分類原則不同,使用的場景也不同。
一般來說名額常用的分類是相對固定的,會将名額分為原子名額、派生名額和衍生名額三類。原子名額指的是不需要疊加任何緯度的,通常是 SQL 直接統計的一些基礎名額,比如客戶數、交易量等。派生名額指的是由原子名額通過疊加一個或多個次元而得到的二級名額,如客戶數疊加了管道的次元就變成了派生名額,比如手機銀行客戶數、長尾客群交易量等。除此之外還有一些常見的比率類名額是通衍生得來的。
- 标簽分類
标簽可分為事實标簽、規則标簽和模型标簽。同原子名額類似,事實标簽來自于底層的原始資料,事實标簽用于描述實體的客觀事實,例如性别标簽、車主标簽、持卡類型标簽等。規則标簽指的是基于事實的統計結果,結合一些人為判斷而生成的,比如按照年齡的不同區間就可以将使用者劃分為青年、中年和老年客戶。模型标簽則更加抽象、更加主觀,是通過事實标簽和規則标簽抽象而來的群體特征,比如月光族、白領、消費達人等。
- 名額使用場景
名額通常拆解使用。比如一個較大的名額:客戶數,可以拆解到不同次元上,并且加以限定詞,比如手機銀行客戶數、七日内客戶數的增量等,主要是用來監測和評價業務的效果。
- 标簽使用場景
标簽通常歸納使用,用來刻畫某一個群體的特征,可以是客戶也可以是産品,其核心是分類,給予不同類别不同的經營政策。
具體舉例說明:名額體系通常會首先定義一個或幾個北極星名額,比如招商銀行常年使用 AUM 作為北極星名額,将北極星名額拆解到現金/存款、投資理财或其他業務子產品,同時使用者也可以拆解為活躍使用者和非活躍使用者等。以此基礎可以梳理出整體的名額架構,進而指導業務。
在标簽的使用場景上更多的偏向一線的營銷場景,包括客戶的經營、精準營銷和資格判斷等。通過不同客戶的标簽将其分成不同的類别,并進行不同的活動、資格或者産品的推送。也可以給産品打标簽,用來辨別産品适合哪類人群,在平安銀行口袋 APP 這樣的平台就做到了千人千面,每個人進去看到的具體内容是不一樣的,這就是通過标簽去篩選圈定的。