天天看点

《数据科学:R语言实战》一2.3 总结

本节书摘来自异步社区《数据科学:r语言实战》一书中的第2章,第2.3节,作者 【美】dan toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看

本章,我们探讨了确定数据序列的不同模式。通过使用eclat函数查找数据集模式,以便寻找人口中的相似模式。使用traminer查找购物篮中的项目频集。使用apriori规则确定购物篮中的项目关联。使用traminer确定成年人职业转换期的序列,并通过序列数据可用的大量图形特征将其可视化。最后,用seqdist检查序列之间的相似点和不同点。

下一章我们将探讨文本挖掘或基于文本的数据集,而非数值形式或分类属性。

继续阅读