天天看點

帶你讀《資料資産》第一章緒論1.2資料資源

1.2      資料資源 

資訊化在帶來便利性、提高生産力的同時,還饋贈了一種全新的資源——資料資源。得益于資訊化的實施和推進,各行各業都在不斷地使用和産生新的資料,逐漸形成資料資源。保護、開發、利用好資料資源是提高國家綜合國力和國際競争力的必然選擇。

1.2.1         資訊化的意外饋贈

20世紀 90年代,世界主要國家先後推出并實施“資訊高速公路”計劃,極大推進了資訊化程序。我國相繼啟動了以金關、金卡和金稅為代表的重大資訊化應用工程,積極推進我國國民經濟資訊化。

經過國民經濟與社會資訊化發展戰略的實施,資訊技術被人們所熟知,資訊技術的應用廣泛滲透到了社會、經濟和生活的方方面面。難以想象,如果沒有網絡,跨國公司該如何高效辦公;如果沒有銀行卡,我們如何提着幾百萬元的現金買賣房屋;如果沒有手機,我們如何快速與遠方的親朋取得聯絡……正如實施資訊化時對其所抱的期待那樣,資訊化給人們的工作、學習、生活帶來了極大的便利,促進了人類社會的進步與發展[9]。

資訊化給人類帶來了出乎意料的禮物,那就是它創造了一個全新的資源——資料資源。資訊化是生産資料的過程:一方面,計算機做了很多原先由手工做的事情,而且做得更準确、更便捷、更高效;另一方面,現實的事物通過攝像頭、錄音筆、傳感器等裝置被采集到計算機中。這個過程使得計算機中積累了大量的資料,是以我們需要不斷地增加新的存儲系統、不停地買硬碟和U盤、不斷地做備份、不斷地保證資料安全,這樣才能保護好資訊化的成果、儲存好我們的工作成果、儲存好值得紀念和美好的内容等。

随着技術的進步,資訊化生産的資料從早期僅由鍵盤錄入的字元資料,逐漸擴充成由多媒體裝置、數字化裝置(如音頻、視訊裝置等)錄入的多類型非結構化資料。而随着各種感覺大自然的裝置(例如溫度/濕度傳感器、天文望遠鏡、對地觀測衛星等)被廣泛應用,更大量的對宇宙空間和自然界的感覺資料被生産出來。資料生産的方式變得多種多樣,資料增長速度遠遠高于計算機技術進步的速度。電子商務(簡稱電商)、社交網絡、自媒體等平台所有使用者生産的資料就是人類行為資訊化的結果。此外,網絡空間自身也在生産資料(例如計算機病毒的傳播、資料的大量副本和備份等)[10]。

資料積累到一定規模後形成資料資源[11]。“一定規模”是資料資源的要求,沒有達到“一定規模”的資料不能稱之為資料資源。在資訊化早期,隻有少數人、少數實體、少數工作實施了資訊化,積累的資料規模不夠大,資料并不能形成資源。但當今社會,資訊化的廣度和深度都達到了相當高的水準,資料就成為資源。以個人資料為例,一個人的身份資料不能被稱為資料資源,但是一個城市所有居民的身份資料卻是很重要的資料資源[8]。

1.2.2         各領域産生的資料

随着資訊化的不斷深入,國家、機構、企業積累的資料已經越來越多,逐漸形成資料資源。在各行各業的工作開展過程中,資料被不斷地生産出來。政務活動生産了大量政府資料資源;科學研究過程生産了科學資料資源;經濟社會運作過程生産了農業、金融、交通等資料資源;人們的日常生活生産了個人資料資源等。

(1)政府資料資源

政府資料資源是最重要也是數量占比最大的資料資源,與國計民生關系密切,價值密度高。政府資料資源大多來自履行管理國家事務、開展政府業務及管理各項公共事務的過程中所積累的政府内部和外部的相關資料。政府資料資源主要包括政府政務活動所形成的政務資料資源和由政府資金支援而形成的公共資料資源,如國家緻力于建設的自然人資料庫、法人資料庫、空間地理資料庫和宏觀經濟資料庫,國家統計資料、海關資料等國民經濟資料資源,民生資料、社會行為資料等公共社會資料資源[12]。

(2)科學資料資源

科學資料資源是最基本、最活躍的科技資源,更是推動經濟社會發展的重要基礎和工具。科學資料主要包括在自然科學、工程技術科學等領域,通過基礎研究、應用研究、試驗開發等産生的資料,以及通過觀測監測、考察調查、檢驗檢測等方式取得并用于科學研究活動的原始資料及其衍生資料。如世界各國都在利用衛星、望遠鏡等開展太空探測、地球勘探等,收集宇宙、大氣、地球等自然資料,形成自然資料資源;人類基因組計劃所産生的生命資料資源;國家建設的國家地球系統科學資料中心、國家氣象科學資料中心等平台所形成的科學資料資源等。

(3)農業資料資源

農業資料資源主要指農業或涉農領域産生和使用的資料,主要包括種植業、林業、畜牧業、漁業等農業領域的資料資源,以及農業環境與資料、農業生産、農業市場等相關領域的資料資源。如種植業的類别和品種、生産環境、病蟲害和自然災害、生産灌溉等種植業資料資源;食品加工類型、品質安全監管、服務等農産品加工資料資源;中國農業資訊網、中國農業科技資訊網等農業資訊網站的資料資源;世界農業科技發展動态資料庫、農業科技項目資料庫、中國國家農作物種質資源資料庫等涉農資料庫的資料資源等[13]。

(4)金融資料資源

金融資料資源主要是指金融行業及相關領域生産和使用的經濟資料資源,主要包括傳統金融行業和網際網路金融的資料資源,以及與金融行業相關的資料資源等[14]。如實時行情資料、曆史金融資料、統計資料、新聞資訊等證券期貨資料資源;銀行交易系統資料、業務處理采集資料、銀行網站資料等銀行業資料資源;保單、理賠單、電話營銷錄音、車險投保者駕駛違章記錄資料等保險業資料資源;電子商務行為、各種繳費交易資料等交易資料資源;區域經濟資料、商品貿易資料、财政稅收資料等相關資料資源。

(5)交通資料資源

交通資料資源主要由交通行業運作和管理直接産生的資料、與城市交通相關的行業和領域導入的資料,以及來自公衆互動的交通狀況資料構成,主要産

生于交通基礎設施本身、交通系統的運作以及交通業務管理中的各種應用[15]。如線圈、攝像頭等各類交通設施産生的資料;車載 GPS産生的車輛位置資訊資料;氣象、環境、人口、規劃、移動通信等交通相關行業導入的資料;公衆通過微網誌、微信、論壇、廣播電台等提供的與交通狀況相關的文字、圖檔、音視訊等資料。

(6)醫療資料資源

醫療資料資源是醫生對患者開展診療、治療,以及開展某種疾病研究或相關醫療事宜所産生和使用的資料,主要包括臨床醫療資料資源、非臨床醫療資料資源、醫療相關領域資料資源等[16]。如包括患者基本資料、入出轉資料、診斷/治療/處方、臨床筆記等内容的電子病曆資料資源;由 X線檢查、CT、B超、胃鏡腸鏡、血管造影等形成的醫學影像資料資源;轉錄組學資料、蛋白質組學資料、代謝組學資料、癌症基因組學資料、腸道微生物組學資料等生物組學資料資源;文獻典籍資料、藥學資料、醫療事務資料、醫保索賠資料等各類醫療資料資源。

(7)個人資料資源

個人資料資源主要是由人們日常生活中的各種活動和行為産生的資料。随着存儲技術的不斷更新,人們可以在TB級别的固定硬碟、GB級别的U盤或 TB級别的移動硬碟等儲存設備中存儲大量的文檔資料、數位照片、家庭視訊以及收集到的其他資料,這些都是個人資料資源。

1.2.3         資料資源開發利用

現如今,各行各業都在不停地使用資料并産生新的資料,社會的運轉越來越依賴于資料,人類的行為以資料的形式不斷地被記錄在網絡空間中。資料成為一種全新的資源,其重要程度越來越凸顯,在 21 世紀将超過石油、煤炭、礦産等天然資源,成為最重要的人類資源之一。

對資料資源的開發利用構成了目前的大資料熱潮。對資料資源進行開發利用,挖掘其價值,甚至将其轉化成資料資産,逐漸成為人類的新需求。從早期的資料倉

庫和資料挖掘技術的提出,到決策支援系統和商業智能的應用,都是在進行資料資源的開發利用工作。直到大資料的出現,資料資源的開發利用工作從量變發展到了質變:資料開發成為一個新的領域或行業[10]。

資料資源開發利用對一個國家經濟發展、社會治理、人民生活都會産生重大影響。對網絡空間資料資源的占領、開發和利用必将成為未來國家政治戰略競争 之所在。

目前,資料資源的開發利用普遍滞後于網絡基礎設施和應用系統的建設,人們對資料資源保護不力、開發不足、利用不夠,對資料資源的特性和用途不甚了解,缺乏合适的技術對資料資源進行開發利用。

為了提高資料資源的開發利用水準,把握網絡空間的戰略主動,首先要建設可開發的資料資源和資料儲備,并對其做好保護。反傾銷訴訟、鐵礦石談判、匯率問題、節能減排、碳關稅談判等重大國際政治、經濟事務,無一不依靠資料說話,要将網絡空間中的資料開發出來,為國家政治、經濟服務。其次,掌握好資料科學技術。資料資源開發利用是未來産業的制高點,掌握資料科學技術就是掌握未來經濟,資料産業是戰略型新興産業,發展資料産業可以産生巨大的經濟效益和社會效益,使國家從“國民經濟與社會資訊化戰略”轉向“國家大資料 戰略”。