天天看點

Kaggle入門項目——Titanic(泰坦尼克之災)

import pandas as pd #資料分析
import numpy as np #科學計算
from pandas import Series,DataFrame

data_train = pd.read_csv("/Users/Hanxiaoyang/Titanic_data/Train.csv")
data_train
           
 https://blog.csdn.net/bbbeoy/article/details/73274931 邏輯回歸應用之Kaggle泰坦尼克之災 (點選檢視) http://link.zhihu.com/?target=http%3A//blog.csdn.net/han_xiaoyang/article/details/49797143 泰坦尼克号問題之背景
  • 就是那個大家都熟悉的『Jack and Rose』的故事,豪華遊艇倒了,大家都驚恐逃生,可是救生艇的數量有限,無法人人都有,副船長發話了『lady and kid first!』,是以是否獲救其實并非随機,而是基于一些背景有rank先後的。
  • 訓練和測試資料是一些乘客的個人資訊以及存活狀況,要嘗試根據它生成合适的模型并預測其他人的存活狀況。

這個項目裡有2個檔案可以供我們分析,train.csv和test.csv,分别存着官方給的訓練和測試資料。

1212



繼續閱讀