天天看点

sed和tr基本用法

sed:(Stream Editor)流编辑器。它是行编辑器,处理纯ASCII码文本,实现逐行进行处理文本。

sed编辑特性

它并不直接处理文本文件本身,处理文件时逐行读取,把符合模式条件的行读取到内存空间中,而后在内存中完成编辑,并且把编辑的结果输出到屏幕上。内存空间又称为模式空间。处理文本是做模式过滤,符合模式条件文本进行处理,不符合的不予处理。sed还有一种叫保留空间,属于高级功能。

sed默认不编辑原文件,仅对模式空间中的数据做处理,处理完成后,将模式空间中的内容打印至屏幕

(全屏编辑器:vi)

sed语法格式

sed [options] 'AddressCommand' file1 file2 ...

注意:地址和编辑命令之间不需要加空格

选项:
        -n:静默模式,只把经过sed命令处理的行输出到屏幕
        -i: 将修改直接写入原文件,而不是输出到屏幕
        -e SCRIPT -e SCRIPT:可以同时执行多个脚本(sed的地址和编辑命令称为脚本)
        -f 脚本文件名: 从sed脚本中读入sed操作
        -r: 表示使用扩展正则表达式
           

地址(Address)界定表示方法

  1. StartLine,EndLine 起始行和结束行用逗号隔开,
例:1,100表示从第一行到第100行
$ :表示最后一行
$-1:表示倒数第二行
           
  1. /RegExp/ 使用正则表达式来指定模式,用双斜杠将模式包含在内,这里的模式就是正则表达式。
例:/^root/ 匹配所处理文件中所有以root开头的行
           
  1. /pattern1/,/pattern2/ 模式1,模式2

    这种方式表示从第一次被模式1匹配的行开始,至第一次由模式2匹配的行结束,这中间的所有行

  2. LineNumber 指定行号,精确匹配某行
  3. StartLine,+N

    从startline开始,向后的N行。

命令(Command)

d: 删除符合条件的行

p: 显示符合条件的行

a \string: 在指定的行后面追加新行,内容为“string(字符串)”,字符串中间如果有空格,需要用双引号包含

\n: 可以用于换行
i \string: 在指定的行前面添加新行,内容为string

r FILE(文件名): 将指定的文件的内容添加至符合条件的行处
例:sed '3r /etc/issue' /etc/fstab

w FILE(文件名):将指定范围内的内容另存至指定的文件中
例:sed '/^#/w a.txt' anaconda-ks.cfg

s/pattern/string/: 查找并替换,默认只替换每行中第一次被模式匹配到的字符串,格式:“行范围s/旧字符/新字符/”
加修饰符:
s/pattern/string/修饰符:
           

修饰符

g:全局替换
i: 查找时忽略字符大小写
例:df -h | sed 's/\//#/g'
//将全文的"/"替换为“#”
注:s命令后的分割符不仅限于“/”,可以换为3个#号或3个@符号,只要是3个同样的符号即可
例:[root@cgy12 ~]# df -h | sed 's$/$#$g'
    Filesystem      Size  Used Avail Use% Mounted on
    #dev#sda3       8.7G  3.8G  4.5G  47% #
    tmpfs           295M     0  295M   0% #dev#shm
    #dev#sda1       194M   34M  151M  19% #boot
           

后项引用

\{\},\1,\2
&:引用模式匹配到的整个字符串
    l..e : like-->liker
           love-->lover
例:[root@cgy15 ~]# sed 's/l..e/&r/' test.txt 
    hello liker
    hello lover
    //匹配以l开头,e结尾,中间任意两个字符的字符串;将匹配到的字符串后面加上r

或者还可以这样:
例:[root@cgy15 ~]# sed 's%\(l..e\)%\1r%' test.txt 
    hello liker
    hello lover

将做如下修改:
    like-->Like
    love-->Love
例:[root@cgy15 ~]# sed 's#l\(..e\)#L\1#' test.txt 
    hello Like
    hello Love

           

tr命令的用法

[root@cgy15 ~]# tr --help
用法:tr [选项]... SET1 [SET2]
从标准输入中替换、缩减和/或删除字符,并将结果写到标准输出。

  -c, -C, --complement      首先补足SET1
  -d, --delete          删除匹配SET1 的内容,并不作替换
  -s, --squeeze-repeats 如果匹配于SET1 的字符在输入序列中存在连续的
                重复,在替换时会被统一缩为一个字符的长度
  -t, --truncate-set1       先将SET1 的长度截为和SET2 相等
      --help        显示此帮助信息并退出
      --version     显示版本信息并退出


SET 是一组字符串,一般都可按照字面含义理解。解析序列如下:

  \NNN  八进制值为NNN 的字符(1 至3 个数位)
  \\        反斜杠
  \a        终端鸣响
  \b        退格
  \f        换页
  \n        换行
  \r        回车
  \t        水平制表符
  \v        垂直制表符
  字符1-字符2   从字符1 到字符2 的升序递增过程中经历的所有字符
  [字符*] 在SET2 中适用,指定字符会被连续复制直到吻合设置1 的长度
  [字符*次数]   对字符执行指定次数的复制,若次数以 0 开头则被视为八进制数
  [:alnum:] 所有的字母和数字
  [:alpha:] 所有的字母
  [:blank:] 所有呈水平排列的空白字符
  [:cntrl:] 所有的控制字符
  [:digit:] 所有的数字
  [:graph:] 所有的可打印字符,不包括空格
  [:lower:] 所有的小写字母
  [:print:] 所有的可打印字符,包括空格
  [:punct:] 所有的标点字符
  [:space:] 所有呈水平或垂直排列的空白字符
  [:upper:] 所有的大写字母
  [:xdigit:]    所有的十六进制数
  [=字符=]    所有和指定字符相等的字符