天天看點

視訊使用者網絡畫像與應用

作者| 阿裡文娛無線開發專家 稻樂、阿裡文娛測試開發工程師 心膂

一、背景

視訊使用者是移動網絡流量的主要消費者。和其他 APP 相比,觀看視訊的使用者體驗和和網絡 環境密切相關。播放成功率、卡頓率、高清占比這些核心體驗名額無不與網絡環境下的産品表現相關。

我們能發現市場上已有的一些網絡分析和環境畫像的實踐。例如熱門手遊“王者榮耀”裡提 供了網絡品質的測量,用目前的路由器,小區,公共網絡的延遲時間來描述當時的網絡狀态, 給使用者呈現一個直覺的檢測結果。 比如用 500kbps 的網絡限速模拟公交模型;用丢包率 20%來 模拟地鐵模型等。網絡畫像的重要性用一句話概括就是:個性化,差異決策。不同使用者在觀看 視訊時,所處的網絡環境具有明顯的差異性。這種差異體可以概括在兩個方面:

1)網絡品質差異。網絡品質最終影響的是視訊碼流下載下傳的速率。當下載下傳速率長時間低于視 頻碼率或者抖動劇烈,就容易産生播放卡頓。下載下傳速率受到播放鍊路上各個環節的綜合因素的 影響,這要求我們評估鍊路上環節的品質,在發生下載下傳速率下降時找到出問題的環節,針對具 體問題應用對應的解決方案,才能做到見招拆招,得心應手。

2)網絡環境差異。使用者是在家庭網絡、公用網絡還是在通勤的路上。這裡環境的識别不再 是一個實時的資料采集分析,它需要一段周期的前置資料收集,要能根據網絡流量等一系列特 征了解出使用者所處的使用環境,進而具備這種環境下可能出現的播放事件做提前預判的能力, 結合定制化政策的應用,可以提供給使用者更好的視訊觀看體驗。

二、網絡畫像

評估播放過程中的網絡,比較通用的手段是通過視訊分片的下載下傳速度,或是播放器緩沖區(buffer)下降速速率來估計。誠然,下載下傳速度和 buffer 下降速率能反映出的播放鍊路端到端的表現,但是在實際的工程實踐中,我們希望能掌握更多元度的資訊,以采取不同的播放政策。 例如如果播放分片下載下傳速度突然下降,如果我們知道是 CDN 側發生了故障,就可以将播放鍊 路切換到備用的 CDN;而如果是使用者的區域網路帶寬擁擠了,我們可以通過智能檔邏輯切換播放 更低碼率的碼流。當我們能感覺視訊播放過程中的網絡變化,分析下載下傳速度變化的原因,就能 夠有效作出相應政策,提升播放體驗。

在使用者終端播放視訊的網絡如圖 1 所示。從網絡拓撲結構出發,影響視訊使用者播放下載下傳的 因素主要包括使用者裝置,區域網路,公網,CDN 四個部分。使用者裝置影響網絡品質的主要參數是 信号強度。區域網路的網絡品質反映了網關的資料分發能力。一些量化名額包括裝置到網關的數 據時延、丢包率,網絡信道擁擠度等。公網的網絡品質反映裝置進行随機網絡請求的品質。指 标包括到随機位址的時延、丢包率等。CDN 側主要是 CDN 的品質和排程政策是否正常,它反 映了。量化名額包括下載下傳播放分片的下載下傳速度、TCP 時延、丢包率。

視訊使用者網絡畫像與應用

使用者裝置,區域網路,公網,CDN 這 4 個次元裡的名額來源分散,且資料量綱不統一,需要 對名額資料進行處理清洗,再通過統計特征分析找到它對網速的表征能力。從原始的時序資料 裡提取出統計特征的方法如圖 2 所示:

視訊使用者網絡畫像與應用

1)資料清洗: 原始資料采集因為線程時序等問題,會引入髒資料。主要包括 0 值或極大 值。例如在處理網關時延 rtt 時會混雜一些-1,0,或逾時值等資料。異常值會影響到最終的判 定結果,一般選擇删除處理,而對于缺失值,可以做删除或者填充的操作, 填充則根據情況選 擇均值、随機、k 近鄰填充等方法。

2)資料規範化:資料規範化将清洗後的資料做歸一化,去除機關的限制,友善不同名額的 比較或者權重操作。最後将多個特征變為一個多元向量,通過向量标準化以達到資料規範化的 目的,不管是 ms 為機關的資料還是 KBps 為機關的值,統一構成向量中的一個元素。

3)特征衍生與選擇:特征衍生旨在對原始的特征進行轉換,計算出所需要的新的資料,例 如:對特征計算均值、方差、标準差,對特征選取 X 分位資料來表征等。比如,網關時延 rtt 每次上報的資料是多次采集的結果,在計算的時候一般采用計算其的均值、方差等來表示,而 網卡流量而言,期望得到是一段時間内其能達到的最大值,是以,取均值并不是最佳方案,在 這裡做的是取其的 90 分位的值來表征。

而特征的選擇方面,可以通過相關性的驗證,來選擇與校驗結果相關度較高的特征,比如 使用皮爾遜相關系數來驗證變量之間的相關性。 通過一系列的資料清洗、規範、選擇之後得到 的特征,是否具有所需的區分度,還要借助相應的聚類算法得以佐證,并可以利用散點圖+密度 圖的方式來更加直覺地觀察資料。

視訊使用者網絡畫像與應用

圖 3 是部分使用者的網關時延與其平均網速的散點圖分布情況,橫軸為平均網速,機關是 kbps, 縱軸為每次采集到的網關時延均值大小(機關 ms),每一個紅點為一條資料,與傳統散點圖不 同的是,圖中還計算了散點的密度分布情況,藍色區域為密度取,顔色越深密度越大,除此之 外,右側縱軸以及上面的橫軸還有資料分布情況的邊界分布圖。該圖通過把資料轉化為可視化 圖像的方式,展示了這部分資料的分布情況。可以從圖中獲得的資訊是:

1)密度最高的部分幾種在網關時延小的區域;

2)從橫軸來看,網速越高的部分,網關時延出現較大值的量越少;

三、應用場景

網絡品質分析提供了多元度的結果,這個結果能比較準确的告訴我們網絡為什麼出問題。 針對不同種類的問題,應用相應的政策,就可以達到理想的效果。表 1 列舉了一些不同類型弱網下的政策。

視訊使用者網絡畫像與應用

1. 弱網使用者提示

在弱網緩沖時,如果是信号或區域網路時延高的時候,如圖 4 所示,會在緩沖頁面給給使用者 相應提示,引導使用者實作相應的優化。在客服系統的卡頓檢測結果中,同樣也會給出相應的提示。

視訊使用者網絡畫像與應用

2. 弱網排程優化

如果網絡檢測結果是公網品質不錯,CDN 品質較差的情況,一般是遇到了排程問題。這時 候反查下載下傳連結是否有問題,例如 CDN 排程是否出現跨省或跨營運商;URL 是否被劫持;CDN 水位是否吃緊需要啟用備用線路等。

3. 弱網下載下傳優化

如果網絡檢測結果是公網品質較差,CDN 品質也較差,說明使用者處在弱網的環境下,我們 會啟動并發下載下傳,QUIC,BBR 等積極的下載下傳方式抵抗高延遲和高丢包率,同時也會引導使用者 使用智能檔或降低碼率觀看。

4. 使用者場景畫像

網關時延、網關 IP、信号強度、網關時延等資料在不同場景下的表現也是不同的。例如家 庭網絡相對較穩定,擁有更低的網關時延,連接配接區域網路的裝置有較為固定的,網關 IP 也有一定 的共性等。我們綜合運用前面的網絡名額進行分析和特征提取分類,可以應用到最終的使用者場 景的識别。如圖 5 所示。

視訊使用者網絡畫像與應用

繼續閱讀