最近下游一直说我供给的文件存在乱码,下游定位到了具体哪一条。
一个250w的数据量,有一条数据有问题。几百兆的文件用note去搜索。
我使用用notepad++后,发现根本打不开。
于是只能先拆分后用notepad++打开。。。。。再用显示所有字符告诉下游。我们大数据提供的数据没有乱码。
是不是感觉特别不懂,不着急我们继续分析。
1.使用split命令将100KB的date.file文件分割成大小为10KB的小文件:
2.文件被分割成多个带有字母的后缀文件,如果想用数字后缀可使用-d参数,同时可以使用-a length来指定后缀的长度:
3.为分割后的文件指定文件名的前缀:
4.使用-l选项根据文件的行数来分割文件,例如把文件分割成每个包含1000行的小文件:
那文件合并呢?
linux命令:
比如 cat 1.wav 2.wav 3.wav > all.wav 就是直接把1.wav 2.wav 3.wav 合并成all.wav
注意1.wav 2.wav 3.wav的顺序 ,all.wav是按照这个顺序合并的。
大多数人都以为是才智成就了科学家,他们错了,是品格。---爱因斯坦