Linux Sed命令详解

Category: 技术学习 | Tags: sed, linux, 正则表达式 | Source: Markdown ----------> Back to Wiki

概述

sedstream editor的简称,也就是流编辑器。它一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,称为"pattern space",接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。

语法

命令格式

sed [option] 'command' input_file

常用选项

常用命令

替换选项

标志选项

示例

a命令

i命令

a命令类似,只不过在匹配的行前面插入字符串行,不举例了。

c命令

d命令

p命令

s命令

基本正则表达式

BRE元字符表
元字符 说明
* *前面的正则表达式匹配的结果重复任意次(含0次)。
\+ 与星号(*)相同,只是至少重复1次,GNU的扩展功能。
\? 与星号(*)相同,只是最多重复1次,GNU的扩展功能。
\{i\} 与星号(*)相同,只是重复指定的i次。
\{i,j\} 与星号(*)相同,只是重复ij次。
\{i, \} 与星号(*)相同,只是至少重复i次。
\(regexp\) regexp看作一个整体,用于后向引用,与\digit配合使用。
. 匹配任意单个字符。
^ 匹配模版空间开始处的NULL字符串。
$ 匹配的是模版空间结束处的NULL字符串。
[list] 匹配方括号中的字符列表中的任意一个。
[^list] 否定匹配方括号中的字符列表中的任意一个。
regexp1\|regexp2 用在相邻的正则表达式之间,表示匹配这些正则表达式中任一个都可以。匹配是从左向右开始的,一旦匹配成功就停止匹配。
regexp1regexp2 匹配regexp1regexp2的连接结果。
\digit 匹配正则表达式前半部分定义的后向引用的第digit个子表达式。digit19的数字, 1为从左开始。
\n 匹配换行符。
\meta 将元字符meta转换成普通字符,以便匹配该字符本身,有$*.[\^

扩展正则表达式

扩展正则表达式除了以下元字符与基本正则表达式不同外,其余相似。

BREERE元字符对应表
基本正则表达式 扩展正则表达式
\? ?
\+ +
\| |
\{ \} { }
\( \) ( )

常用转义字符

转义字符表
转义字符 说明
\a 匹配一个BEL字符。
\f 匹配一个换页字符。
\n 匹配一个换行字符。
\r 匹配一个回车字符。
\t 匹配一个水平Tab字符。
\v 匹配一个垂直Tab字符。
\cX 匹配Control+XX是任意字符。
\dXXX 匹配一个ASCII码是十进制XXX的字符。
\oXXX 匹配一个ASCII码是八进制XXX的字符。
\xXX 匹配一个ASCII码是十六进制XX的字符。
\w 匹配任意一个单词字符(字母、数字和下划线)。
\W 匹配任意一个非单词字符。
\b 匹配一个单词的边界符:字符的左边是一个单词字符,并且右边是一个非单词字符,反之亦然。
\B 匹配除单词边界符外所有字符:字符的左边和右边同时是单词字符或非单词字符。