.本節書摘來自華章出版社《智能資料時代:企業大資料戰略與實戰》一書中的第1章,第1.6節,作者 talkingdata ,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視
智能資料就是有效融合了人工智能和人類智慧的資料,這樣的資料才能持續産生商業價值。這個名詞的出現揭示了資料、人和機器三者之間的有機聯系。這種有機聯系賦予資料更多價值,更賦予資料心智。現階段的“資料”與以往的資料已經有很大不同。資料中包含的資訊量越來越大、次元越來越多,從圖像、聲音等富媒體資料,逐漸過渡到人的動作、姿态、行為軌迹,再加上地理位置、天氣、社會群體行為等,以往處理資料的思路已經難以适應“資料”本身發展的速度。一個融合人類智慧、人工智能以及海量非結構化資料的智能資料時代已經來臨。是以,“發展多年的‘大資料’即将進入‘下半場’”。
智能資料時代最重要的三個要素是:資料、人工智能、人類智慧。這三者之間的關系又是什麼?我們可以做個比喻。資料相當于什麼?人的血液。人工智能相當于什麼?人的心髒。心髒需要靠血液供給,但同時它還會根據人的心跳把血液再輸回給人體,從此往複循環,形成一個正循環。人類智慧是什麼?大腦,這是不可替代的。所有這一切構成了智能資料時代的三個要素。資料的積累,推動了人工智能的進步(資料量越大,訓練出來的人工智能越強大)和人類智慧的積累(通過對資料的洞察和分析,人類經驗得以增強,智慧得以積累),進而産生了更多的應用場景;應用場景的增加,導緻資料在量級和次元上進一步變化,人工智能不一定能夠處理所有的變化,是以需要人類智慧的介入,調整人工智能以适應新的資料處理方式,進而使人工智能得以進步,并且也進一步積累了人類智慧——這是一個正向的循環。資料、人工智能和人類智慧互相促進,迎來了新的智能資料時代。
缺乏人類智慧的持續介入,人工智能對資料的加成作用會随着資料的變化逐漸弱化甚至失效;缺乏人工智能,人類無法處理如此海量的資料;缺乏資料,人工智能無法存在,人類智慧的積累也會放緩。比如通過人的有監督的訓練,可以獲得展現人姿态動作的手機傳感器的訓練資料集,這是展現人類智慧的資料。這些資料通過人工智能的算法分析,然後經過人類智慧的參數調整和驗證,可以趨近反映人的真實動作和姿态,實作情景感覺能力。具有情景感覺能力的手機,可以提供給應用開發者更多的應用場景,比如運動健身、金融風控、物流管理、娛樂體驗等,每個領域出現的新的使用者體驗,也會産生更多的資料,讓人類智慧繼續積累,讓人工智能更加強大。又比如,原始資料進入smartdp以後,需要經過資料架構師的人類智慧的分析和整理,通過人工智能的輔助,才能得到幹淨的或者模組化的(比如圖)資料。這些資料在使用的時候也必須結合人類智慧和人工智能。如果原始資料沒有經過營運,垃圾進垃圾出,就不是智能資料。甚至資料還需要持續的營運,如果營運中斷,有可能就慢慢地不智能了(過期了)。再比如在行業領域,我們通過咨詢(人類智慧,積累了行業的經驗)幫助客戶梳理資料的脈絡,采集必要的資料,再通過人工智能來滿足業務需求,解決場景化的問題,同時又産生更多的資料。