当前位置 博文首页 > 一天一个shell命令 linux文本内容操作系列-cut命令详解

    一天一个shell命令 linux文本内容操作系列-cut命令详解

    作者:admin 时间:2021-07-05 17:44

    说明:

    cut 按列切分文件,你可以指定分隔每列的定界符。在cut的术语中,每列都是一个字段,就是有时候说第一列,可能表述称第一个字段。

    实战:

    假设有文件data.txt,格式如下

    NO    Name    Mark    Percent
     1    Sarath    45    90
     2    Alex    49    98
     3    Anu    45    90

    分隔符(定界符)为Tab 制表符

    如果我要取得第二列,所有人的名称,有什么好的办法吗?此时cut该大显身手了。

    1. 取得2,3列 即name,和mark

    $cut –f 2,3 data.txt

    2. 取得除第3列以外所有列

    $cut –f3 –complement data.txt

    3. 采取其他定界符,可以用-d改变。

    复制代码 代码如下:

     假设data_comma.txt:

    NO,Name,Mark,Percent
     1,Sarath,45,90
     2,Alex,49,98
     3,Anu,45,90

    则:
    $cut –f2 -d"," data_comma.txt

    解读—help

    用法:cut [选项]... [文件]...
    从每个文件中输出指定部分到标准输出。

    长选项必须使用的参数对于短选项时也是必需使用的。
      -b, --bytes=列表            只选中指定的这些字节
      -c, --characters=列表       只选中指定的这些字符
      -d, --delimiter=分界符      使用指定分界符代替制表符作为区域分界
      -f, --fields=列表           只选中指定的这些域;并打印所有不包含分界符的
                    行,除非-s 选项被指定
      -n                (忽略)
           --complement            补全选中的字节、字符或域
      -s, --only-delimited        不打印没有包含分界符的行
          --output-delimiter=字符串    使用指定的字符串作为输出分界符,默认采用输入
                    的分界符
          --help                  显示此帮助信息并退出
          --version               显示版本信息并退出

    仅使用f -b, -c 或-f 中的一个。每一个列表都是专门为一个类别作出的,或者您可以用逗号隔
    开要同时显示的不同类别。您的输入顺序将作为读取顺序,每个仅能输入一次。
     每种参数格式表示范围如下:
        N    从第1 个开始数的第N 个字节、字符或域
        N-    从第N 个开始到所在行结束的所有字符、字节或域
        N-M    从第N 个开始到第M 个之间(包括第M 个)的所有字符、字节或域
        -M    从第1 个开始到第M 个之间(包括第M 个)的所有字符、字节或域

    当没有文件参数,或者文件不存在时,从标准输入读取

    解读:

    1.取得某一列的字符或者字节 可以用-c, -b等

    2.可以取得某个范围

    1和2综合例子:

    有文件range_data.txt,内容如下

    复制代码 代码如下:

    abcdefghijklmnopqrstuvwxyz
     abcdefghijklmnopqrstuvwxyz
     abcdefghijklmnopqrstuvwxyz
     abcdefghijklmnopqrstuvwxyz

    运行:$cut range_data.txt -c-2

    打印字符1-2列

    再复杂一点:

    $cut range_data.txt -c1-3,6-9 --output-delimiter ","

    打印1-3行,6-9行,并且用逗号分隔。

    命令比较简单,主要还是借鉴书籍《linux shell脚本攻略》,从附件中会看到一排格式很差的字母,尝试用-s过滤掉他。

    jsjbwy