天天看点

split 命令

 最近下游一直说我供给的文件存在乱码,下游定位到了具体哪一条。

一个250w的数据量,有一条数据有问题。几百兆的文件用note去搜索。

我使用用notepad++后,发现根本打不开。

于是只能先拆分后用notepad++打开。。。。。再用显示所有字符告诉下游。我们大数据提供的数据没有乱码。

 是不是感觉特别不懂,不着急我们继续分析。

1.使用split命令将100KB的date.file文件分割成大小为10KB的小文件:

2.文件被分割成多个带有字母的后缀文件,如果想用数字后缀可使用-d参数,同时可以使用-a length来指定后缀的长度:

3.为分割后的文件指定文件名的前缀:

4.使用-l选项根据文件的行数来分割文件,例如把文件分割成每个包含1000行的小文件:

 那文件合并呢?

linux命令:

比如 cat 1.wav 2.wav 3.wav > all.wav 就是直接把1.wav 2.wav 3.wav 合并成all.wav

注意1.wav 2.wav 3.wav的顺序  ,all.wav是按照这个顺序合并的。

大多数人都以为是才智成就了科学家,他们错了,是品格。---爱因斯坦

下一篇: HBase Split