天天看點

大資料專家舍恩伯格演講

6月19日上午消息,第十二屆中國國際軟體和資訊服務交易會今天在大連世界博覽廣場開幕。本次會議時間為6月19日-22日,聚焦智慧城市、雲計算、物聯網等技術熱點和産品服務,主題鎖定為“智城市,酷生活”。本次展會展覽面積3萬平方米,有近600家廠商,百餘個國内外團組參展。新浪科技作為獨家網絡戰略合作夥伴直播本次大會。以下為全文:

非常感謝給我這樣的機會,能跟大家在一起進行這樣的介紹,非常高興能夠來到大連,來跟大家聊一聊大資料的重要性,因為之前我們說到雲的快速改變,在過去一段時間改變我們的生活,我想說一下大資料對經濟的含義和對商業的含義。

  大家都在說大資料,大資料到底有多大?到底有多少資訊說到zb位元組,我們說10的21次方,這是什麼意思?它的含義是什麼?它如何發揮作用?我 們看一下這張圖,它給我們顯示的是資料随時間流失的發展趨勢,我們看一下它在背後告訴我們的故事是什麼?1987年,也是很久,那個時候我在大 學,1987年資料世界還沒有達到30億gb,這是1987面的規模,2007年的時候增加到3000億gb,是以20年間資料的數量增加了100倍。如 果說回到曆史的話,看上一次,資料像這麼快的增長,那個時候是資料翻一番的,那是50年間,因為印刷的革命,帶來了資料翻一番的增長,20年間實作的,這 是曆史,我們看一下顔色,深色是數字資訊,淺色是類比資訊。

  這對我們來說意味着什麼,我們看一下我們的圖檔,如果每一分鐘對這匹馬進行拍照是這樣的;如果每一秒鐘對這匹馬進行拍照,是這個狀态。如果是六十分之一秒照一次相,就會有連續的動作,是以我們創造了影片。

  新的對世界的了解,我們有更多的海量的資料及相關的資料聯系起來,我也要跟大家解釋一下,這個更多的意味着什麼呢?意味着更多的和資料相關的或 者問題相關的一些資料,我們可以讓資料說話,我們如何了解這一點呢?如何真正的了解它呢?我們再想一下照片,如果我現在要拍一個照片,把所有人都拍進來, 我必須要有聚焦,我必須要選擇對我來說什麼是重要的,是第一排的還是後面一排的,如果我關注的是第一排的人,那遺憾的是後面一排的人就看不到了,是以我必 須要進行一個選擇,目前在收集資料時進行選擇,什麼是重要的,什麼是不重要的,但是很多時候我不知道什麼是重要的,什麼是不重要的,這種情況下,有些資料 丢失了,我們要考慮一下。

  這張照片是我四歲的兒子,這不是正常的照片,是大資料的照片,是大資料的相機拍下來的,這樣的話,我兒子就聚焦了,我可以把我兒子聚焦,也何以 把牙刷聚焦,因為我把所有的資料都收集了,我可以讓資料說話,而且可以用這些資料來回答問題,或者回答我之前沒有的問題,一旦我收集了這些資料,我們可以 做到這一點,因為我們把所有資料都收集到了,我有這麼多資料,可以做一些工作,因為我在某些方面丢失了一些東西,在某些方面就獲得了一些東西,我們必須用 全新的視角考慮世界。

  過去我們考慮世界的時候是以因果的關系考慮世界,我年輕的時候,我爸媽跟我說,在冬天的時候,出去戴上帽子,否則會感冒,是以他創造了這樣一種 因果關系,就是不戴帽子就會感冒,盡管并不是如此,是有一些病毒會導緻感冒,而不是戴不戴帽子導緻感冒。這就是過去的時間裡,人們想了解世界是通過因果關 系的連接配接,我們想要了解到事物後面的原因是什麼,來了解世界。我們想了解為什麼,盡管我們不知道發生了什麼事情,在大資料時代我們可以了解發生了什麼事 情。

  沃爾瑪(75.87, 0.17, 0.22%)可以對收集的資料進行分析,比如一個飓風侵襲了某個地方,可能會對他們産生影響,比如人們會買一些苞米花,美國人經常買苞米花,但是到現 在也不知道為什麼買苞米花,但是他們把這個東西拿出來,可以看出銷售增長了30%,這個資料之間有更多的相關性,因為這些賣家他們更好的了解了這些資料, 對這些資料進行分析,了解它的地點,地點可能不太容易擷取這樣的資訊。現在在日本,研究者們對我們的姿勢進行了一個分析,為什麼這麼做呢?好象說姿勢很獨 特,而且可以對他進行利用,進行抽取資料,怎麼做呢?可以用來防止小偷,一個小偷進了一個車,手的動作,我們通過這個方面進行分析哪個是小偷。

  這是谷歌(554.9, 1.53, 0.28%)的眼鏡,第一版不是那麼強大,第二版可以有更多的資訊,我們可以分享一下,這個資料價值非常大,我們可以了解一下,她看了什麼東西,她 看的是廣告闆嗎?看的是某一個商場,看的是某一個人,我們可以看到這些資料。也就是說,資料讓我們獲得了一些資料源,結果是什麼?第一個結果是我們如何進 行營銷,我們如何把我們的東西更好的賣出去,亞馬遜(327, -7.38, -2.21%)很好的利用了這一點,我們都知道亞馬遜,而且我們知道它的一個推薦,他會給你推薦産品,他有推薦的軟 件,我們可能感到很驚奇,但是剛開始的時候,亞馬遜聘請了工程師對它進行設計,這個工程師設計了推薦的引擎,是基于買家30種不同的行為進行推薦,推薦的 是之前預先定義的品類,亞馬遜的工程師說這是一個災難,好象你去購物,好象一個很愚蠢的人不知道自己怎麼樣去購物,亞馬遜說會從小資料轉向大資料的思維, 而且不是預先定義的品類,不再這麼做了,我們看在大資料上司是什麼樣的狀況?我們把它一項一項推薦,現在大概占到亞馬遜銷售的30%,就是讓資料可以說 話,而且這對我們來說是全新的變革,比如在制造業方面,我們可以想到100年前,亨利福特生産了福特的汽車,那是了不起的創新,是工業革命的初期,現在有 紅色、藍色或者白色的汽車,亨利福特說可以有任何顔色,隻要顔色是黑色的話,因為他們隻能生産黑色的車,大量生産和制造,那個時候亨利福特的工廠沒有買家 的資料,他們也不知道生産什麼顔色的汽車,也就是生産界可以有很大的變化,也就是靈活的生産,也就是為客戶量身定制,生産他們所需要的東西,而不僅僅是生 産唯一的東西,客戶沒有什麼選項。

  第三個轉移或者變化就是我們了解資料的價值。過去我們可以用資料來幫助銷售更多的産品,在大資料的時代,資料本身是一種資源,這也改變了我們業 務的模式,甚至說在傳統的制造業企業裡面,比如勞斯萊斯,勞斯萊斯過去是生産飛機的企業,而且營業額也很高,利潤也很高,但是後來随着飛機的發展,他們在 裡面有一些軟體以及硬體來對發動機進行改進,是以他們可以獲得很多的資料,他們現在有一些資源了,勞斯萊斯改變了自己的營業模式,過去是銷售産品的公司, 現在這個公司銷售的是服務,也就是固定費用的維修服務,尤其是針對全球各地的飛行公司,生産飛機的公司提供服務,是以如果能夠很好的了解,資料本身可以成 為資源,可以帶來價值。

  我們再來看行動電話的公司,我們看這個圖,這個不是手機的發射塔,電信行業現在面臨很大的困難,主要是價格的問題,因為價格的競争非常激烈,我 們不想通過價格來競争,我們想通過價值來競争,怎麼做呢?應該認識到你有什麼樣的機會和資源,一個移動手機的營運商,在荷蘭有一個很好的例子,資訊的強度 是不一樣的,因為天氣的不一樣,發射器的信号強度也不一樣,我們可以利用信号的變化來預測天氣,比如降雨或者濕度,我們有很多這樣的發射塔,他們突然想到 有很多這樣的天氣預測,真正實作了實時的傳遞天氣預報的資訊,基本是免費的。現在還有一個有趣的觀察,全球沒有一個國家,除了英國之外,英國對天氣感興 趣,所有人都會對當地感興趣,除了英國之外,英國對全國天氣感興趣,荷蘭的手機營運商有新的業務模式,可能成為全球最佳的天氣預報的服務商。

  創造一種新的價值,或者新的資源,而且我們可以看到手機的信号發射塔,他們會有不斷的信号傳來,這是新的業務模式,這個發射塔是收集資訊的平 台,以非常低的成本收集資訊,是以有很多新的機會,同時也會有新的競争者,沒有任何業務的領域,都是新的,因為總會有新的人加入,是以你不會永遠保持在新 的狀态。

  我們看汽車行業,汽車在不斷的發展,而且是革命式的速度在發展,過去幾年最大的創新是什麼?無人駕駛汽車,谷歌在這方面研發速度非常快,已經有 幾十萬的曆程,而且成為了這方面的專家,第一次在交通燈停下來的時候,發生了一次撞擊,是因為駕駛人員決定把計算機關掉自己駕駛,不然是零事故的,為什麼 是bmw研發的?不是奔馳研發的?因為他們沒有看到新的機會,谷歌成為了新的競争對手,看到了新的機會,當然也是新的競争。

  再來看健康和醫療,之前是結果非常完善的行業,如果我感冒的話,如果我吃阿司匹林,我要麼吃多了,要麼吃不夠,因為劑量是針對平均患者的,我和 平均患者是不一樣的,我們都不同,每個人都是不一樣的,都有不同的dna,不同的新陳代謝,有不同的嚴重程度,但是我們吃同樣的劑量,為什麼?因為在醫療 行業沒有資料,讓他能夠更加的定制化,有了大資料以後,我們能夠走向個人化、個性化了醫療,不僅能延長我們的壽命,還能提高我們的生活品質,能夠讓我們更 快的獲得醫療。

  再考慮另外一個方面,之前沒有想到大資料的影響,就是人類學習。我們現在對學生測試,他們學的多好,多蠢啊,我們沒有想到的做法就是我們看他們 的學習方法,我們的書、我們應用的教學方法,我們沒有測試這些教學方法,我們還用過去200間使用的教學方法,我們知道是否有效嗎?不知道有效性,為什麼 繼續使用呢?因為我們沒有資料,不知道,這個點要改變,而且改變速度會比你想象的快。

  我們有這樣的應用,曾經上百萬人在用,這個應用能夠幫助你學習語言,非常漂亮,很有趣,是個遊戲,很有意思,因為有千萬級的使用者,儲存了這樣的 資料,他們知道西班牙人怎麼學英文,中國人怎麼學英文,有了這樣的資料,他們發現,西班牙人教授英語哪些方法是錯誤的,應該改變這些方法,改變的方法能夠 很快的提高學習的結果,這個是以結果為導向的方式。

  有這麼一個人叫做專家,就是以自我為風格的這些專家,大家都知道,很了解這一類人,一般年紀要大一些,坐在那兒,聲音非常洪亮,我知道正确答案 是什麼,相信我吧,有時候他們隻是裝一下,但是沒人敢說,沒人敢挑戰他們,因為他們有權威,你沒有任何可以駁斥他的資料,将來這個局面會改變。

舉個例子,有這麼一個公司你肯定聽過叫做谷歌,41種不同的藍色,他們有個首席設計師,進行測試來選擇一個顔色用于設計,大概是兩個象素,他說 一定要是這個藍色,為什麼呢?上司說有沒有進行資料分析,設計師說我是設計師,我知道,上司說我不相信你,我要進行測試,設計師說你要強迫我進行資料分析 我就辭職,因為我是設計師我就是知道,是以這個設計師的上司說你的辭職報告我接受了,你被解雇了,41種不同的藍色,他發現差别非常細微,能夠創造多的多 的點選率,最後能夠把年營業額增加幾百萬美元,他真的把這個設計師解雇了,是以要記住這一點。

  未來如何改變一個組織和機構?大資料是看待現實新的角度,不僅改變市場營銷,改變生産制造,改變我們從事商業的方式,因為資料不再說你能不能 做,而是資料本身就是唯一的資源,就成為一個價值的資源,一個來源,也就是對我們來說意味着新的商業機會,沒有哪一個行業有這種競争的免疫能力,都将會受 到這個影響,包括醫療、包括學習,所有的機構,無一幸免,都必須要能夠适應大資料,他确實說得上是一個革命,是以要不斷的學習,謝謝大家!

本文來源于"中國人工智能學會",原文發表時間"2014-06-30"

繼續閱讀