《数据科学：R语言实现》——3.9　排列数据

2021-11-08 13:42:50

本节书摘来自华章出版社《数据科学：r语言实现》一书中的第3章，第3.9节，作者：r for data science cookbook 丘祐玮（david chiu），更多章节内容可以访问云栖社区“华章计算机”公众号查看。

排列可以让我们在某种顺序下观察数据，以便更有效地分析数据。在数据库中，我们可以使用order by语句对指定的列进行数据排序。在r中，我们使用函数order和sort来对数据排序。

准备工作

按照3.3节“转换数据类型”教程，把导入数据的每个属性转换成合适的数据类型。同时按照3.2节“重命名数据变量”中的步骤，命名employees和salaries数据集的列名。

实现步骤

运行原理

r提供了两种排列数据的方法：一个是sort，另一个是order。函数sort返回排序好的向量作为输出。在第1步中，我们设置了一个含有7个整数的整数向量，然后使用函数sort对向量排序，生成一个排序好的输出。经过排序的向量默认是按升序排列的。但是，我们可以把decreasing指定为true改变序列顺序。另外，函数order返回一个排序索引向量作为输出。我们依然可以指定返回的索引是按升序还是按降序排列。

为了在向量中按照升序或者降序排列元素，我们可以使用函数sort。但是，要对某一列的数据排序，我们应该使用函数order。在我们例子中，我们首先拿到了salary属性中各元素的降序索引，然后获取了按照一个排序索引的salaries数据记录。最后，我们找出了按照薪水排列的salaries记录。除了按照一个属性排列数据记录，我们还可以按照多个属性排序记录。我们只需要在函数order中依次放置salary和from_date属性。

更多技能

我们还可以使用plyr中的函数arrange，按照升序的salary和降序的from_date排列薪水数据：

《数据科学：R语言实现》——3.9　排列数据

继续阅读

Oracle索引内部结构研究

MySQL和Lucene索引对比分析1. MySQL索引实现2. Lucene索引实现3. MySQL与Lucence对比参考：

一文搞定 MySQL 索引

MySQL（第五篇）—数据的完整性约束（2）（索引、引用完整性）数据的完整性约束（2）三、索引四、引用完整性

【MySQL索引】MySQL索引分类，90%的开发都不知道一、根据底层数据结构划分二、根据索引字段个数划分三、根据是否是在主键上建立的索引进行划分四、根据数据与索引的存储关联性划分五、其他分类六、总结

JS--------for循环删除数组元素

Python中字符串常见操作总结

Lucence的基本原理

sql执行计划 explain 以及结合索引优化sql

MySQL - order by排序优化

2021-08-08 mysql索引

SQLServer 提升查询速度

详解SQL中几种常用的表连接方式

oracle 中不使用已有的索引解决办法

对first_name创建唯一索引uniq_idx_firstname问题描述Sql语句

记一次因MySQL编码问题导致的慢查询排查

《数据科学：R语言实现》——3.9 排列数据

继续阅读

《数据科学：R语言实现》——3.9　排列数据