sed是一个行编辑器,通常一次只处理一行数据,默认不编辑原文件,而是把原来的数据复制一份到内存中执行编辑操作,可以对行进行删除,增加,替换,选取等特×××。
工具原理:
sed读取文件的内容放到内存中,我们通常称作为模式空间,sed会通过正则表达式匹配模式空间中符合条件的行,匹配到的行会进行编辑操作,有可能会输出到频幕上,这得看你的编辑操作了,原本读取到的行默认会输出到频幕上,你可以不让它输出,sed会一直从第一行读取到最后一行。
sed还有段空间,被称为保持空间,当你读取行文件到模式空间,模式空间会把读取到的行文件保存到保持空间,我们还可以实现模式空间和保持空间的对换编辑。
sed指令:
sed的正则表达式元字符
元字符
功能
示例
示例的匹配对象
^
行首定位符
/^love/
匹配所有以love开头的行
$
行尾定位符
/love$/
匹配所有以love结尾的行
.
匹配除换行符外的单个字符
/l..e/
匹配包含字母l后跟两个任意字符在跟字母e的行
*
匹配零个或多个前导字符
/*love/
匹配在零个或多个空格紧跟着模式love的行
[]
匹配指定字符组内的任一字符
/[ll]ove/
匹配包含love和love的行
[^]
匹配不在指定字符组内的任一字符
/[^a-km-z]ove/
匹配包含ove,但ove之前的那个字符不在a至k或m至z之间的行
\(..\)
保存已匹配的字符
s/\(love\)able/\1er/
标记元字符之间的模式,并将其保存为标签1,之后可以用好\1来引用它。最多可定义9个标签,从左边开始编号,最左边的是第一个。在这个示例中,loe被保存在寄存器1里,之后被替换串引用,结果loveable被替换为lover。
&
保存查找串以便在替换串中引用
s/love/**&**/
符号&代表查找串。字符串love将替换前后各加了两个星号的引用,即love变成**love**
\<
词首定位符
/\<love/
匹配包含以love开头的单词的行
\>
词尾定位符
/love/>/
匹配包含以love结尾的单词的行
x\{m\}
连续m个x
/o\{5\}/
分别匹配出现连续5个字母o、至少5个连续的o、或5-10个连续的o的行
x\{m,\}
至少m个x
/o\{5,\}/
x\{m,n\}
至少m个但不超过n个x
/o\{5,10\}/
常用选项:
-n:不输出模式空间中的内容至屏幕;
-e :多点编辑;
-f /path/to/sed_script_file:指定sed脚本
注意:sed脚本后边不能有空格
-r, --regexp-extended:支持使用扩展正则表达式;
-i[suffix], --in-place[=suffix]:编辑的结果保存到原文件中
地址定界:
(1) 空地址:默认是对全文进行处理;
(2) 单地址:
#:指定行;
/pattern/:被此模式所匹配到的每一行;
(3) 地址范围
#,#:匹配两者之间的内容带其本身
#,+#:匹配从本行往后的#行
#,/pat1/:匹配本行到匹配到的字符的行
/pat1/,/pat2/:匹配两字符串之间的内容,包括本身
$:最后一行;
(4) 步进:~
1~2:所有奇数行
2~2:所有偶数行
编辑命令:
d:删除;
上面删除第一行
p:显示模式空间中的内容;
显示第一行
a \text:在行后面追加文本“text”,支持使用\n实现多行追加;
i \text:在行前面插入文本“text”,支持使用\n实现多行插入;
c \text:把匹配到的行替换为此处指定的文本“text”;
w /path/to/somefile:保存模式空间匹配到的行至指定的文件中;
r /path/from/somefile:读取指定文件的内容至当前文件被模式匹配到的行后面;文件合并;
=:为模式匹配到的行打印行号;
!:条件取反;
地址定界!编辑命令;
s///:查找替换,其分隔符可自行指定,常用的有s@@@, s###等;
替换标记:
g:全局替换;
w /path/to/somefile:将替换成功的结果保存至指定文件中;
p:显示替换成功的行;