01
上周,主播林珊珊測試了一下淘寶直播團隊依據他個人形象打造的虛拟主播,也就是林珊珊下播以後,讓虛拟主播上場,粉絲在直播間可以跟虛拟主播互動,虛拟主播則實時介紹商品,回答消費者提問。
第二天,林珊珊發現,在團隊沒有任何線上工作的情況下,虛拟主播為賬号增粉240人,假設一個粉絲一年成交1萬元的話,一晚上增加的240個粉絲,相當于增加了240萬的GMV,這是在沒有任何付出的情況下哦!而且也隻是一次測試而已。
想當初,淘寶直播産品經理岱岩跟林珊珊團隊溝通虛拟主播的事情時,後者的内心是想拒絕的,因為擔心技術問題,害怕虛拟主播與粉絲的互動體驗不好,沒想到結果出乎意料的好。虛拟主播是淘寶直播最近在低調測試的一個新産品,已經播出了1000多場,未來會陸續放開使用。虛拟主播的意義,主要是為主播帶來永不休息的助播。直播雖然是最好的互動零售模式,但缺點也很明顯,主播連播幾個小時,每天都播,身體吃不消,前段時間,李佳琦總是請假說,太累了,要做手術,最近幾天不播了;而每個TOP主播,幾乎都是聲音沙啞;薇娅也是經常在下播後輸氧。如何幫助主播減輕負擔呢?如何讓直播24小時永不休眠呢?這就是虛拟主播的價值了!這項技術可以根據每一個主播的形象、語言風格、肢體風格,開發屬于自己的虛拟主播形象,進而在主播下播之後,可以繼續服務粉絲。虛拟主播看起來隻是一個3D動畫,但背後,是人工智能領域最複雜的技術應用。為什麼要這麼說呢?
02
提到人工智能,你會想到什麼?人臉識别?是的,人臉識别是目前火熱的AI應用,但人臉識别大多是視覺技術;siri?各個手機附帶的人工智能,以及各類硬體産品,基本是依賴語言識别技術;自動駕駛?比起上述兩個,自動駕駛是更複雜的AI應用,但也是綜合了語言、圖檔等技術的大資料應用。而虛拟人物則是一個包含了聲音、語言、文字、圖檔、動畫、商品等衆多要素的多媒體産品,要實時了解變化的環境,要實時識别,并且了解互動的内容,還要實時在服務的具體場景裡做出反應,這種複雜程度,絕不是一般單個領域的AI技術,而是淘寶集中了全球最頂尖的科學家和多年的技術積累,才有了今天的突破,至少領先業内三年以上。更重要的是,淘寶直播偏偏還在這條路裡,選了最難的一條,硬要人工智能了解每一句實時生成的語言的真實含義、語氣,在跟虛拟主播的動作、表情結合起來,這完全是照着真人主播的标準來要求人工智能啊!
舉個例子,很多人工智能的語音都是非常平緩的,可以說沒有任何感情在裡面,但是,虛拟主播是要有人設的,是要根據每一個主播的特點來設定的,而直播也是非常講究聲音和語氣的,為什麼李佳琦一句“OMG,買它!買它!”成了直播的标志性聲音符号?這句話就代表了生産力啊。如果李佳琦的虛拟人物用毫無情緒的機器人聲音說“OMG,買它!買它!”,粉絲會買賬嗎?是以,淘寶直播集合了最頂尖的科學家來支援這項業務,阿裡巴巴達摩院資深算法專家陳海青說,他們不但為虛拟主播設定了情緒,還設定了相應的肢體語言,包括嘴型、四肢等,因為如果一個人隻有情緒而沒有肢體的配合,也是很奇怪的。
阿裡巴巴達摩院資深算法專家陳海青
是以,語言、情緒、肢體,都要配合到位,更重要的是還要結合商品資訊,随時根據粉絲的需求推薦合适的商品。總結下來,陳海青認為,一個成功的虛拟主播,需要四個方面的技術架構:感覺與認知、導演系統、3D模組化、3D素材庫。這一技術系統比較複雜,沒辦法一一詳述,僅舉一個聲音的例子,每個主播都有自己的聲音,虛拟主播如何實作每個主播的聲音不同呢?在傳統技術裡,複制一個人的聲音,一般需要好幾個月,但是顯然不适合淘寶直播這種大規模應用的領域。阿裡根據自己的人工智能技術優勢,可以通過錄制一個人20到100句話,在半小時的時間裡,就可複制一個人90%的聲音,這樣,每個主播隻需花半小時,就可讓虛拟主播複制自己的聲音。
淘寶直播使用了最複雜的人工智能技術,找到了解放主播的一條路徑。當然,這項技術不是隻服務于網紅主播,還可以給企業直播開放。試想一下,現在很多企業都有自己的吉祥物,如果用此技術,根據企業的吉祥物,開發一個企業自己的虛拟主播,24小時線上直播商品,并一對一解答顧客的疑問,那未來的商業将會怎麼樣?
03
虛拟主播是幫助主播下播以後服務粉絲,但淘寶的智能直播間技術其實是可以圍繞主播的所有工作時間來展開的。如果你是一個新手主播,可以用播小寶,相當于是主播助理。開播前,可以幫助主播規劃好直播,完成直播任務,快速更新。播出後,主播都會盤點當天的直播情況,查缺補漏,這時候,淘寶直播間背景有一個智能主播資料分析師的産品,可以幫助主播分析資料得失。一般,大主播都會有專門的資料分析師,月工資要兩萬左右,而這個智能主播資料分析師,至少可為主播整體節約3億成本。讓每一個中小主播,乃至田間地頭的農民大爺都擁有世界上最頂尖的資料分析能力。淘寶直播産品負責人岱妍表示,這其實是一個商業公平的問題。除此之外,技術不僅可以降低成本,還能增加收益。很多人都不明白,為什麼主播們總是喊“3、2、1,上連結”?這個看起來不起眼的動作背後,是一個複雜的技術解決方案——大規模低延時技術。
直播與普通電商有一個最明顯的差異化,他們是瞬時下單,幾百萬人觀看直播,主播一聲令下,幾十萬人同時下單,如何保證下單時網絡不擁堵呢?以前雙十一,每次都會系統延遲,這兩年才基本解決了這個問題。現在,淘寶的直播推流後,全世界各地的消費者之間的延時誤差不超過1秒鐘,而其它直播平台則往往有多達5到7秒。延時越久,翻車越多,消費者聽到主播說“上連結”卻看不到真的連結,自然會質疑“不公平性”。過去幾年,淘寶直播與達摩院和阿裡雲做了很多努力,依靠阿裡雲大量的全球節點(70個國家地區,2800+節點,全網130Tbps),通過AI技術,智能分發推流,又通過自己研發的編碼器技術(為了提高效率,不得不自己研發編碼,成本可節約一半),讓播碼率下降50%,是以上線之後,淘寶直播的卡頓率下降55%,播放延時低于1s,下降72%。對商家來說,低延時技術預計整體可增加收益數十億,特别對部分品類的成交率提升10%。有了這種低延時技術,就可以衍生出更多的互動,比如直播的時候抽獎、發紅包、答題,這種與消費者的互動更需要技術來保證公平。更進階的玩法是,可以在直播間加入3D或者AR展示,前段時間,天貓家裝行業商家直播的時候,就用小程式把3D家裝植入直播間,粉絲可以線上觀看家裝産品的使用效果。
此外,淘寶直播背後的首席科學家們,還可以讓人工智能實時識别直播内容。一方面,使得淘寶直播成為全平台唯一一個可以看回放的。因為長時段的回放,隻有通過内容識别,打上“看點”才有意義。消費者可以選中商品,準确地直達回放片段。消費者需要通過回放時實時溝通客服,這對于轉化率的提升,大有幫助。另一方面,在直播推薦頁裡,可以看到實時直播場面,避免在推薦頁看到直播的是項鍊,點進去卻在直播衣服,就這一個小細節,就能大大提高使用者觀看直播的時長。
04
是以,整體來看,可以把大規模低延時看做是底層技術,資料分析是中台技術,虛拟主播是前台技術,但所有層面的技術,都用了人工智能,也可以說,是人工智能應用到了淘寶直播的各個角落。在主播層面,不論你是網紅頭部主播,還是腰部中小商家,哪怕是一個農民主播,也可以用最複雜的人工智能技術來提升自己的業績。其實,直播到底是一陣風,還是一個時代的趨勢,不是靠流量來決定的,而是靠技術來推動的,技術發展的成熟度,能夠支撐更優秀的直播購物體驗,消費者就會更願意在這個管道消費。直播帶貨發展到現在,簡單的流量玩法已經玩不動了,接下來,得靠人工智能驅動了!