天天看点

Kaggle入门项目——Titanic(泰坦尼克之灾)

import pandas as pd #数据分析
import numpy as np #科学计算
from pandas import Series,DataFrame

data_train = pd.read_csv("/Users/Hanxiaoyang/Titanic_data/Train.csv")
data_train
           
 https://blog.csdn.net/bbbeoy/article/details/73274931 逻辑回归应用之Kaggle泰坦尼克之灾 (点击查看) http://link.zhihu.com/?target=http%3A//blog.csdn.net/han_xiaoyang/article/details/49797143 泰坦尼克号问题之背景
  • 就是那个大家都熟悉的『Jack and Rose』的故事,豪华游艇倒了,大家都惊恐逃生,可是救生艇的数量有限,无法人人都有,副船长发话了『lady and kid first!』,所以是否获救其实并非随机,而是基于一些背景有rank先后的。
  • 训练和测试数据是一些乘客的个人信息以及存活状况,要尝试根据它生成合适的模型并预测其他人的存活状况。

这个项目里有2个文件可以供我们分析,train.csv和test.csv,分别存着官方给的训练和测试数据。

1212



继续阅读