当前位置 博文首页 > 详解Sed命令的用法与正则表达式元字符

    详解Sed命令的用法与正则表达式元字符

    作者:看!!灰机 时间:2021-02-17 15:36

    sed命令用法

    sed是一种流编辑器,它是文本处理中非常有用的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为『模式空间』(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等。

    1.简介

    sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。

    sed编辑器逐行处理文件(或输入),并将结果发送到屏幕。具体过程如下:首先sed把当前正在处理的行保存在一个临时缓存区中(也称为模式空间),然后处理临时缓冲区中的行,完成后把该行发送到屏幕上。sed每处理完一行就将其从临时缓冲区删除,然后将下一行读入,进行
    处理和显示。处理完输入文件的最后一行后,sed便结束运行。sed把每一行都存在临时缓冲区中,对这个副本进行编辑,所以不会修改原文件。

    2.定址

    定址用于决定对哪些行进行编辑。地址的形式可以是数字、正则表达式、或二者的结合。如果没有指定地址,sed将处理输入文件的所有行。

    地址是一个数字,则表示行号;是“$"符号,则表示最后一行。例如:sed -n '$p' /etc/issue 

    3.命令与选项

    sed命令告诉sed如何处理由地址指定的各输入行,如果没有指定地址则处理所有的输入行。

    3.1 sed命令

    a\

    在当前行后添加一行或多行。多行时除最后一行外,每行末尾需用“\”续行    -a,只是显示,如果要真的更改文本,就要sed -i.bak ''   这样就会出来一个带bak格式的文件,这个文件是源文件

    [root@entos74 app]#cat -n passwd.txt | sed '10,20a\       11 adadadadadada '

    c\

    用此符号后的新文本替换当前行中的文本。多行时除最后一行外,每行末尾需用"\"续行

    cat -n passwd.txt | sed '10c\XXXXXXXXXXXXXXXXXX'

      i\
        在当前行之前插入文本。多行时除最后一行外,每行末尾需用"\"续行
        cat -n passwd.txt | sed '10i\XXXXXXXXXXXXXXXXXX'
      d
      删除行  :ss -ntl |sed '1d'       删除第一行
      h
      把模式空间里的内容复制到暂存缓冲区  
      H
      把模式空间里的内容追加到暂存缓冲区
      g
      把暂存缓冲区里的内容复制到模式空间,覆盖原有的内容
      G
      把暂存缓冲区的内容追加到模式空间里,追加在原有内容的后面
      p
     打印当前模式空间内容,追加到默认输出之后
      n
      读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理
      q
      结束或退出sed
      r
      从文件中读取输入行
      !
      对所选行以外的所有行应用命令
      s
      用一个字符串替换另一个
      g
      在行内进行全局替换:cat -n passwd.txt | sed 's@/bin/bash$@ /sbin/nologin@g'
      w
      将所选的行写入文件:sed '/^lixiaozi/w /app/lixiaozi.txt' passwd.txt
      x
      交换暂存缓冲区与模式空间的内容
      y
      将字符替换为另一字符(不能对正则表达式使用y命令) 

    3.2 sed选项

      选项
      功能
      -e
      进行多项编辑,即对输入行应用多条sed命令时使用
      -n
      取消默认的输出
      -f
      指定sed脚本的文件名

    4.退出状态

    sed不向grep一样,不管是否找到指定的模式,它的退出状态都是0。只有当命令存在语法错误时,sed的退出状态才不是0。

    5.正则表达式元字符

      与grep一样,sed也支持特殊元字符,来进行模式查找、替换。不同的是,sed使用的正则表达式是括在斜杠线"/"之间的模式。

    如果要把正则表达式分隔符"/"改为另一个字符,比如o,只要在这个字符前加一个反斜线,在字符后跟上正则表达式,再跟上这个字符即可。例如:sed -n '\o^Myop' datafile
        元字符
      功能
      示例
      ^
      行首定位符
      /^my/   匹配所有以my开头的行
      $
      行尾定位符
      /my$/   匹配所有以my结尾的行
      .
      匹配除换行符以外的单个字符
      /m..y/   匹配包含字母m,后跟两个任意字符,再跟字母y的行
      *
      匹配零个或多个前导字符
      /my*/   匹配包含字母m,后跟零个或多个y字母的行
      []
      匹配指定字符组内的任一字符
      /[Mm]y/   匹配包含My或my的行
      [^]
      匹配不在指定字符组内的任一字符
      /[^Mm]y/   匹配包含y,但y之前的那个字符不是M或m的行
      \(..\)
      保存已匹配的字符
      1,20s/\(you\)self/\1r/   标记元字符之间的模式,并将其保存为标签1,之后可以使用\1来引用它。最多可以定义9个标签,从左边开始编号,最左边的是第一个。此例中,对第1到第20行进行处理,you被保存为标签1,如果发现youself,则替换为your。
      &
      保存查找串以便在替换串中引用
      s/my/**&**/    符号&代表查找串。my将被替换为**my**
      \<
      词首定位符
      /\<my/   匹配包含以my开头的单词的行
      \>
      词尾定位符
      /my\>/   匹配包含以my结尾的单词的行
      x\{m\}
      连续m个x
      /9\{5\}/ 匹配包含连续5个9的行
      x\{m,\}
      至少m个x
      /9\{5,\}/   匹配包含至少连续5个9的行
      x\{m,n\}
      至少m个,但不超过n个x
      /9\{5,7\}/   匹配包含连续5到7个9的行

    6.范例 

    6.1 p命令

    命令p用于显示模式空间的内容。默认情况下,sed把输入行打印在屏幕上,选项-n用于取消默认的打印操作。当选项-n和命令p同时出现时,sed可打印选定的内容。 

    sed '/my/p' datafile
    #默认情况下,sed把所有输入行都打印在标准输出上。如果某行匹配模式my,p命令将把该行另外打印一遍。
    [root@entos74 ~]#sed -n '3p' filelist.txt
    只打印第三行
    只显示指定行范围的文件内容,例如:
    #  只查看文件的第20行到第30行,并且带上行号
    cat -n /etc/passwd | sed  -n '20,30p' 

    6.2 d命令

    命令d用于删除输入行。sed先将输入行从文件复制到模式空间里,然后对该行执行sed命令,最后将模式空间里的内容显示在屏幕上。如果发出的是命令d,当前模式空间里的输入行会被删除,不被显示。

    sed '$d' datafile
    #删除最后一行,其余的都被显示
    cat -n passwd.txt | sed '/mail/,25d'
    #删除包含"mail"的行到第25行的内容
    地址是逗号分隔的,那么需要处理的地址是这两行之间的范围(包括这两行在内)。范围可以用数字、正则表达式、或二者的组合表示。例如:
    sed '2,5d' datafile
    #删除第二到第五行
    sed '/My/,/You/d' datafile
    #删除包含"My"的行到包含"You"的行之间的行

    6.3 s命令

    sed 's/^My/You/g' datafile
    #命令末端的g表示在行内进行全局替换,也就是说如果某行出现多个My,所有的My都被替换为You。 

    6.4 e选项

    -e是编辑命令,用于sed执行多个编辑任务的情况下。在下一行开始编辑前,所有的编辑动作将应用到模式缓冲区中的行上。

    sed -e '1,10d' -e 's/My/Your/g' datafile

    #选项-e用于进行多重编辑。第一重编辑删除第1-3行。第二重编辑将出现的所有My替换为Your。因为是逐行进行这两项编辑(即这两个命令都在模式空间的当前行上执行),所以编辑命令的顺序会影响结果。

    6.5 w命令

    sed -n '/hrwang/w me.txt' datafile 

    6.6 a\ 命令

    a\ 命令是追加命令,追加将添加新文本到文件中当前行(即读入模式缓冲区中的行)的后面。所追加的文本行位于sed命令的下方另起一行。如果要追加的内容超过一行,则每一行都必须以反斜线结束,最后一行除外。最后一行将以引号和文件名结束。

    sed '/^hrwang/a\
    >hrwang and mjfan are husband\
    >and wife' datafile
    #如果在datafile文件中发现匹配以hrwang开头的行,则在该行下面追加hrwang and mjfan are husband and wife 

    6.7 i\ 命令

    i\ 命令是在当前行的前面插入新的文本。 

    6.8 c\ 命令

    sed使用该命令将已有文本修改成新的文本。 

    6.9 n命令

    sed使用该命令获取输入文件的下一行,并将其读入到模式缓冲区中,任何sed命令都将应用到匹配行紧接着的下一行上。

    sed '/hrwang/{n;s/My/Your/;}' datafile

    总结

    以上所述是小编给大家介绍的详解Sed命令的用法与正则表达式元字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站长博客网站的支持!

    js
    下一篇:没有了