天天看点

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

前面我们一共啰嗦了四期:

决策树与随机森林(1)—— 决策树算法数学推导与实例演练 推导决策树的原理。

决策树与随机森林(2)—— 用R种树和画树 用R语言实现决策树的构建和绘图。

决策树与随机森林(3)—— 决策树的剪枝和C4.5算法 聊了决策树的剪枝和明星算法C4.5。

决策树与随机森林(4)—— 决策树C5.0算法 讲解了C4.5的加强版C5.0. 

刀磨好了,可是如何来用呢?这期就来简单解读13篇使用决策树的文章,看一下别人如何在论文中科学使用决策树算法的。

范文1

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文2

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文3

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文4

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文5

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文6

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文7

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
我们简单复现下这篇文章
# 数据处理rm(list = ls())options(stringsAsFactors = F)library(data.table)library(tibble)library(dplyr)library(rpart)library(rpart.plot)library(C50)library(RWeka)pheno 'TCGA-KIRC.GDC_phenotype.tsv',pheno 'submitter_id.samples|stage|histologic',colnames(pheno))]]colnames(pheno) 'ID',pheno ''&pheno$Grade!=pheno$Stage in%c(expr 'TCGA-KIRC.htseq_fpkm.tsv',expr as.numeric(substr(colnames(expr),expr 'ENSG00000228742',rownames(expr)),])%>%colnames(expr) 'SLINKY'expr$SLINKY median(expr$SLINKY),'High','Low')sur 'TCGA-KIRC.survival.tsv',sur$OS 0,data by.x=data data,sur,data as.
           
# ID3算法ID3 printcp(ID3)rpart.plot(ID3,branch=1,type=2, fallen.leaves=T,cex=0.8,extra = 1,main='ID3')
           
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
#CART算法CART printcp(CART)rpart.plot(CART,branch=1,type=2, fallen.leaves=T,cex=0.8,extra = 1,main='CART')
           
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
summary(CART) # 这样直接可以看到CART算法或者ID3算法对所有变量的重要性定量
           
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
# C4.5算法C4.5 data)plot(C4.5,main='C4.5')
           
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
# C5.0算法C5.0 0(OS~.,plot(C5.0,main='C5.0')
           
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
可以发现两个问题: 1.结果不太一样,这可能是数据处理,数据自己提取,软件差异有关 2.C4.5/C5.0 和 ID3/CART有差异,包括C4.5和C5.0算法也有差异,但是四种算法对stage的衡量基本一致

范文8

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文9

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文10

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文11

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文12

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

范文13

c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读
c5.0决策树算法_决策树与随机森林(5)—— 应用决策树算法的13篇文献解读

总结

这些文章的用法基本一致,大多集中在两点: 1. 筛选biomarker,多种算法一齐使用,比如LASSO,SVM,随机森林,决策树等。 2. 构建分类器,比如诊断分类器,预后分类器等

能够用到这类算法的场景有很多,不局限于上述的这些套路,理解原理和熟悉掌握操作才是灵活应用的关键。

后台回复 “4”,即可获得这13篇文章和相应代码文件。