天天看點

了解大資料的特點、來源與資料呈現方式

這個作業的要求來自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2620。

1.分析所采用資料的來源有哪些?

(1)交易資料:包括信用卡刷卡資料、網際網路點選資料、“企業資源規劃”(ERP)系統資料、銷售系統資料、客戶關系管理(CRM)系統資料、公司的生産資料等。

(2)移動通信資料:能夠上網的智能手機等移動裝置越來越普遍,移動裝置上的軟體能夠追蹤和溝通無數事件,從運用軟體儲存的交易資料到個人資訊資料或狀态報告事件等。

(3)人為資料:人類社交媒體産生的資料流。

(4)機器和傳感器資料:來自感應器、量表和其他設施的資料、定位/GPS系統資料等。

(4)網際網路上的“開放資料”來源:如政府機構,非營利組織和企業免費提供的資料。

2.大資料的呈現方式有哪些?

(1)面積和尺寸可視化對同一類圖形(例如柱狀、圓環等)的長度、高度或面積加以差別,來清晰的表達不同名額對應的名額值之間的對比。

(2)通過顔色的深淺來表達名額值的強弱和大小,可以一眼看上去整體的看出哪一部分名額的資料值更突出。

(3)圖形可視化在我們設計名額及資料時,使用有對應實際含義的圖形來結合呈現,會使資料圖表更加生動的被展現,更便于了解圖表要表達的主題。

(4)地域空間可視化當名額資料要表達的主題跟地域有關聯時,一般會選擇用地圖為大背景。

(5)概念可視化通過将抽象的名額資料轉換成熟悉的容易感覺的資料時,可以更容易了解圖形要表達的意義。

3.大資料的特點是什麼?對思維方式有何影響?

大資料的特點:資料量大(Volume)、資料類型繁多(Variety)、處理速度快(Velocity)和價值密度低(Value)。

大資料對思維方式的影響:

(1)全樣而非抽樣。科學分析完全可以直接針對全集資料在短時間内迅速得到分析結果而非抽樣分析。

(2)效率而非精确。具有“秒級響應”的特征,要求在幾秒内就迅速給出針對海量資料的實時分析結果,否則就會喪失資料的價值。

(3)相關而非因果。人們追求“相關性”而非“因果性”。

4.設計一個Mad Libs遊戲

代碼和運作結果如圖所示:

name1=input('請輸入一個姓名:')
car=input('請輸入一種交通工具:')
name2=input('請再輸入一個人的姓名:')
adress=input('請輸入一個娛樂場所:')
name3=input('請再輸入一個物品名稱:')

print('{}剛才廣州商學院,騎着{}去接{}一起去市區,在{}撿到了{},于是開心地回家了'.format(name1,car,name2,adress,name3))      
了解大資料的特點、來源與資料呈現方式