天天看點

大資料在統計中的應用初探

大資料是資訊時代的必然産物,是人們在日常工作、學習、生活中,使用以現代網絡、特别是以網際網路為特征的現代資訊技術和其他各種電子計量裝置而産生的海量資訊。對海量資訊的采集、存儲、分析、整合、控制而得到的資料就是大資料。中央《關于深化統計管理體制改革提高統計資料真實性的意見》中指出,大力推動大資料在政府統計工作中的應用,将電子化行政記錄和各類交易、互動、傳感等大資料作為政府統計基礎資料的重要來源,努力建構現代化新型統計調查體系。

大資料統計應用有什麼意義?還有哪些問題和障礙?如何加快大資料在統計工作中的應用?在此進行探讨交流。

大資料應用廣泛

大資料能夠更加客觀真實地記載經濟社會的發展情況。在現代社會,人與人之間、人與機關之間、機關與機關之間,甚至地區與地區之間、國與國之間發生的交流和交易行為都有可能在計算機等各種電子裝置上留下記錄,由于它們都是電子化的資訊,沒有摻入任何人為的幹擾因素,是以,對這樣的資訊進行發掘、加工、整理而得出的大資料能夠更加客觀真實地反映社會經濟發展情況。同時,實作大資料統計應用也是遏制統計造假、弄虛作假行為的重要途徑。

大資料能夠最大限度地拓展現行統計調查制度所無法涉及到的領域。大資料能輕而易舉地解決正常統計調查無法涉及到的、各種複雜多變的行業和領域的統計,因為大資料不但量大,其涵蓋面也十分廣泛,任何時候、任何地方、任何人、任何機關,隻要發生了互動行為就要留下“痕迹”,而對這些資訊進行加工整理獲得的大資料必然能夠有效解決現行統計和國民經濟核算資料不全的問題。

大資料分析應用已經發揮出了顯著的社會經濟效益。目前,大資料分析應用已經有了實質性的進展,例如,商貿領域通過對商品銷售大資料分析,能夠發現同一種産品在不同地區的銷量、銷售的時間以及購買産品的客戶群,然後作出市場預測,制定出新的訂貨計劃,取得可觀的經濟效益。在金融、保險、交通等行業以及财政、教育等領域,通過大資料分析,能夠發現新的商機或管理模式,并尋找到改進服務的最佳途徑。

大資料如何應用于統計

就目前的情況,要真正實作大資料在統計工作中的應用尚面臨着很多問題與障礙,如口徑不一緻、範圍不相同、标準不統一、程式不規範、資訊不共享等,這些或将成為大資料統計應用的“攔路虎”。在此,筆者提出幾點粗淺的建議。

建立機構,統一管理大資料開發應用工作。大資料就像是一座巨大的“寶藏”,如果不加以開發就無法發揮其作用。但是,如果無序開發,也會使得這筆寶貴的财富得不到有效利用,造成浪費,甚至産生負面效應。是以,要真正實作大資料統計應用,應建立一個專門的管理機構,加強組織上司,統一管理大資料的開發、應用,保障資料資訊安全,在某些領域、某些行業逐漸實作以大資料取代正常統計調查資料。同時,制定周密計劃、明确職責分工、選擇工作路徑、加強日常監管,進而實作對大資料這一寶貴資源的有效利用。

統一标準,實作大資料在統計上的可比性。統計是一門科學,是一項十分嚴謹的工作。是以,統計名額的含義、口徑、範圍、來源管道、計算方法、計量機關等應該統一,隻有這樣才具有可比性。要實作大資料統計應用,提高統計工作的科學性,應該制定統一的标準,如在生産、流通、服務等領域,界定哪些資訊屬于可在統計上應用的大資料,如何将大資料的口徑、範圍調整為正常統計所需的口徑和範圍,如何對大資料的海量資訊進行甄别、篩選,然後挖掘出統計核算所需要的、且正常統計所難以取得的資料。隻有在這些方面統一标準,才能真正實作大資料在統計中的應用。

資源共享,暢通大資料資訊來源的管道。由于目前大部分機關都認為本部門的資料、行政記錄等資訊是商業秘密,因而,出于“保密”等原因,一般不對外提供,即便是政府統計部門需要,一些機關也是顧慮重重。是以,要實作大資料在統計上的應用,必須打破機關之間資訊“壁壘”,真正實作資訊資源共享。隻有這樣,才能夠最大限度地滿足正常統計、尤其是國民經濟核算的資料需求。當然,為防止洩密,有必要制定一個關于大資料開發利用的制度,嚴格規定對外釋出的範圍,保障個體資訊資料的安全。

創造條件,為大資料開發應用鋪平道路。大資料應用離不開現代資訊技術和網絡技術,更離不開大資料發掘、加工、整理和分析的人才。是以,應該大力培養一批大資料應用、尤其是大資料分析方面的人才,為将大資料廣泛應用于政府統計、宏觀管理、企業經營等方面奠定基礎。要鼓勵高校和科研機構有針對性地開發大資料應用軟體,為大資料分析提供幫助。要通過國内培養、國外委培等途徑,培養一批大資料分析師,除開展大資料分析外,還要将大資料分析的理念、思路廣泛應用于宏觀管理和微觀經營之中,發揮出大資料統計應有社會經濟效益。

本文轉自d1net(轉載)

繼續閱讀