当前位置 博文首页 > Linux shell编程中IO和条件及循环处理的细节问题讨论

    Linux shell编程中IO和条件及循环处理的细节问题讨论

    作者:P_Chou 时间:2021-07-08 18:48

    > 與 < 差在哪?
    谈到I/O redirection,不妨先让我们认识一下File Descriptor(FD)。程序的运算,在大部份情况下都是进行数据(data)的处理,这些数据从哪读进?又,送出到哪里呢?这就是File descriptor(FD)的功用了。

    在shell程序中,最常使用的FD大概有三个,分别为:

    • 0: Standard Input(STDIN)
    • 1: Standard Output(STDOUT)
    • 2: Standard Error Output(STDERR)

    在标准情况下,这些FD分别跟如下设备(device)关联:

    • stdin(0):keyboard
    • stdout(1):monitor
    • stderr(2):monitor

    我们可以用如下下命令测试一下:

    $ mail -s test root
    this is a test mail.
    please skip.
    

    ^d(同时按crtl跟d键)
    很明显,mail程序所读进的数据,就是从stdin也就是keyboard读进的。不过,不见得每个程序的stdin都跟mail一样从keyboard读进,因为程序作者可以从档案参数读进stdin,如:

    $ cat /etc/passwd
    

    但,要是cat之后没有档案参数则又如何呢?哦,请您自己玩玩看啰….^_^

    $ cat
    

    (请留意数据输出到哪里去了,最后别忘了按^d离开…)至于stdout与stderr,嗯…然后,让我们继续看stderr好了。

    事实上,stderr没甚么难理解的:说穿了就是“错误信息”要往哪边送而已…比方说,若读进的档案参数是不存在的,那我们在monitor上就看到了:

    $ ls no.such.file
    ls: no.such.file: No such file or directory
    

    若,一个命令同时产生stdout与stderr呢?那还不简单,都送到monitor来就好了:

    $ touch my.file
    $ ls my.file no.such.file
    ls: no.such.file: No such file or directory
    my.file
    

    okay,至此,关于FD及其名称、还有相关联的设备,相信你已经没问题了吧?那好,接下来让我们看看如何改变这些FD的预设数据信道,我们可用<来改变读进的数据信道(stdin),使之从指定的档案读进。我们可用>来改变送出的数据信道(stdout,stderr),使之输出到指定的档案。比方说:

    $ cat < my.file
    

    就是从my.file读进数据

    $ mail -s test root < /etc/passwd
    

    则是从/etc/passwd读进…

    这样一来,stdin将不再是从keyboard读进,而是从档案读进了…严格来说,<符号之前需要指定一个FD的(之间不能有空白),但因为0是<的预设值,因此<与0<是一样的!okay,这个好理解吧?

    那,要是用两个<<又是啥呢?这是所谓的HERE Document,它可以让我们输入一段文本,直到读到<<后指定的字串。比方说:

    $ cat <<FINISH
    first line here
    second line there
    third line nowhere
    FINISH
    

    这样的话,cat会读进3行句子,而无需从keyboard读进数据且要等^d结束输入。

    okay,又到讲古时间~~~当你搞懂了0<原来就是改变stdin的数据输入信道之后,相信要理解如下两个redirection就不难了:1> 2> 。前者是改变stdout的数据输出信道,后者是改变stderr的数据输出信道。两者都是将原本要送出到monitor的数据转向输出到指定档案去。

    由于1是>的预设值,因此,1>与>是相同的,都是改变stdout。用上次的ls例子来说明一下好了:

    $ ls my.file no.such.file 1>file.out
    ls: no.such.file: No such file or directory
    

    这样monitor就只剩下stderr而已。因为stdout给写进file.out去了。

    $ ls my.file no.such.file 2>file.err
    my.file
    

    这样monitor就只剩下stdout,因为stderr写进了file.err。

    $ ls my.file no.such.file 1>file.out 2>file.err
    

    这样monitor就啥也没有,因为stdout与stderr都给转到档案去了…

    呵~~~看来要理解>一点也不难啦﹗是不?没骗你吧?^_^ 不过,有些地方还是要注意一下的。
    首先,是同时写入的问题。比方如下这个例子:

    $ ls my.file no.such.file 1>file.both 2>file.both
    

    假如stdout(1)与stderr(2)都同时在写入file.both的话,则是采取“覆盖”方式:后来写入的覆盖前面的。让我们假设一个stdout与stderr同时写入file.out的情形好了:

    • 首先stdout写入10个字元
    • 然后stderr写入6个字元

    那么,这时候原本stdout输出的10个字元就被stderr覆盖掉了。那,如何解决呢?所谓山不转路转、路不转人转嘛,我们可以换一个思维:将stderr导进stdout或将stdout导进sterr,而不是大家在抢同一份档案,不就行了﹗bingo﹗就是这样啦:

    • 2>&1就是将stderr并进stdout作输出
    • 1>&2或>&2就是将stdout并进stderr作输出

    于是,前面的错误操作可以改为:

    $ ls my.file no.such.file 1>file.both 2>&1
    


    $ ls my.file no.such.file 2>file.both >&2
    

    在Linux档案系统里,有个设备档位于/dev/null。许多人都问过我那是甚么玩意儿?我跟你说好了:那就是“空”啦﹗没错﹗空空如也的空就是null了….请问施主是否忽然有所顿误了呢?然则恭喜了~~~ ^_^ 这个null在I/O Redirection中可有用得很呢:

    • 若将FD1跟FD2转到/dev/null去,就可将stdout与stderr弄不见掉。
    • 若将FD0接到/dev/null来,那就是读进nothing。

    比方说,当我们在执行一个程序时,画面会同时送出stdout跟stderr,

    假如你不想看到stderr(也不想存到档案去),那可以:

    $ ls my.file no.such.file 2>/dev/null
    my.file
    

    若要相反:只想看到stderr呢?还不简单﹗将stdout弄到null就行:

    $ ls my.file no.such.file >/dev/null
    ls: no.such.file: No such file or directory
    

    那接下来,假如单纯只跑程序,不想看到任何输出结果呢?哦,这里留了一手上次节目没讲的法子,专门赠予有缘人﹗…^_^ 除了用>/dev/null 2>&1之外,你还可以如此:

    $ ls my.file no.such.file &>/dev/null
    

    (提示:将&>换成>&也行啦~~!)

    okay?讲完佛,接下来,再让我们看看如下情况:

    $ echo "1" > file.out
    $ cat file.out
    1
    $ echo "2" > file.out
    $ cat file.out
    2
    

    看来,我们在重导stdout或stderr进一份档案时,似乎永远只获得最后一次导入的结果。那,之前的内容呢?呵~~~要解决这个问提很简单啦,将>换成>>就好:

    $ echo "3" >> file.out
    $ cat file.out
    2
    3
    

    如此一来,被重导的目标档案之内容并不会失去,而新的内容则一直增加在最后面去。easy?呵…^_^

    但,只要你再一次用回单一的>来重导的话,那么,旧的内容还是会被“洗”掉的﹗这时,你要如何避免呢?----备份﹗yes,我听到了﹗不过….还有更好的吗?既然与施主这么有缘份,老纳就送你一个锦囊妙法吧:

    $ set -o noclobber
    $ echo "4" > file.out
    -bash: file: cannot overwrite existing file
    

    那,要如何取消这个“限制”呢?哦,将set -o换成set +o就行:

    $ set +o noclobber
    $ echo "5" > file.out
    $ cat file.out
    5
    

    再问:那…有办法不取消而又“临时”盖写目标档案吗?哦,佛曰:不可告也﹗啊~开玩笑的、开玩笑的啦~ ^_^唉,早就料到人心是不足的了﹗

    $ set -o noclobber
    $ echo "6" >| file.out
    $ cat file.out
    6
    

    留意到没有:在>后面再加个“|”就好(注意:>与|之间不能有空白哦)… 呼…(深呼吸吐纳一下吧)~~~ ^_^再来还有一个难题要你去参透的呢:

    $ echo "some text here" > file
    $ cat < file
    some text here
    $ cat < file > file.bak
    $ cat < file.bak
    some text here
    $ cat < file > file
    $ cat < file
    

    嗯?!注意到没有?!!----怎么最后那个cat命令看到的file竟是空的?﹗why?why?why?当当当~上课啰~ ^_^
    前面提到:$ cat < file > file 之后原本有内容的档案结果却被洗掉了﹗要理解这一现像其实不难,这只是priority的问题而已:

    在IO Redirection中,stdout与stderr的管道会先准备好,才会从stdin读进数据。也就是说,在上例中,> file会先将file清空,然后才读进< file,但这时候档案已经被清空了,因此就变成读不进任何数据了…哦~原来如此~~ ^_^

    那…如下两例又如何呢?

    $ cat <> file
    $ cat < file >> file
    

    嗯…同学们,这两个答案就当练习题啰,下节课之前请交作业﹗好了,I/O Redirection也快讲完了,sorry,因为我也只知道这么多而已啦~嘻 ^_^ 不过,还有一样东东是一定要讲的,各位观众(请自行配乐~!#@!$%):----就是pipe line也!

    谈到pipe line,我相信不少人都不会陌生:我们在很多command line上常看到的“|”符号就是pipe line了。不过,究竟pipe line是甚么东东呢?别急别急…先查一下英汉字典,看看pipe是甚么意思?没错﹗它就是“水管”的意思…那么,你能想像一下水管是怎么一根接着一根的吗?又,每根水管之间的input跟output又如何呢?嗯??灵光一闪:原来pipe line的I/O跟水管的I/O是一模一样的:上一个命令的stdout接到下一个命令的stdin去了!的确如此…不管在command line上你使用了多少个pipe line,前后两个command的I/O都是彼此连接的﹗(恭喜:你终于开窍了﹗^_^)

    不过…然而…但是……stderr呢?好问题﹗不过也容易理解:若水管漏水怎么办?也就是说:在pipe line之间,前一个命令的stderr是不会接进下一命令的stdin的,其输出,若不用2>导到file去的话,它还是送到摄像头上面来﹗这点请你在pipe line运用上务必要注意的。那,或许你又会问:有办法将stderr也喂进下一个命令的stdin去吗?(贪得无厌的家伙﹗)方法当然是有,而且你早已学过了﹗^_^ 我提示一下就好:请问你如何将stderr合并进stdout一同输出呢?若你答不出来,下课之后再来问我吧…(如果你脸皮真够厚的话…)

    或许,你仍意尤未尽﹗或许,你曾经碰到过下面的问题:

    在cm1 | cm2 | cm3…这段pipe line中,若要将cm2的结果存到某一档案呢?

    若你写成cm1 | cm2 > file | cm3的话,那你肯定会发现cm3的stdin是空的﹗(当然啦,你都将水管接到别的水池了﹗)聪明的你或许会如此解决:cm1 | cm2 > file; cm3 < file 是的,你的确可以这样做,但最大的坏处是:这样一来,file I/O会变双倍﹗在command执行的整个过程中,file I/O是最常见的最大性能杀手。凡是有经验的shell操作者,都会尽量避免或降低file I/O的频率。那,上面问题还有更好方法吗?有的,那就是tee命令了。

    所谓tee命令是在不影响原本I/O的情况下,将stdout复制一份到档案去。因此,上面的命令行可以如此打:

    cm1 | cm2 | tee file | cm3
    

    在预设上,tee会改写目标档案,若你要改为增加内容的话,那可用-a参数达成。
    基本上,pipe line的应用在shell操作上是非常广泛的,尤其是在text filtering方面,
    凡举cat,more,head,tail,wc,expand,tr,grep,sed,awk,…等等文字处理工具,搭配起pipe line来使用,你会惊觉command line原来是活得如此精彩的﹗常让人有“众里寻他千百度,蓦然回首,那人却在灯火阑珊处﹗”之感…^_^

    你要 if 還是 case 呢?
    放了一个愉快的春节假期,人也变得懒懒散散的…只是,答应了大家的作业,还是要坚持完成就是了~~~

    还记得我们在第10章所介绍的return value吗?是的,接下来介绍的内容与之有关,若你的记忆也被假期的欢乐时光所抵消掉的话,那,建议您还是先回去温习温习再回来…

    若你记得return value,我想你也应该记得了&&与||是甚么意思吧?用这两个符号再配搭command group的话,我们可让shell script变得更加聪明哦。比方说:

    comd1 && {
      comd2
      comd3
      :
    } || {
      comd4
      comd5
    }
    

    意思是说:假如comd1的return value为true的话,然则执行comd2与comd3,否则执行comd4与comd5。

    事实上,我们在写shell script的时候,经常需要用到这样那样的条件以作出不同的处理动作。
    用&&与||的确可以达成条件执行的效果,然而,从“人类语言”上来理解,却不是那么直观。
    更多时候,我们还是喜欢用if….then…else…这样的keyword来表达条件执行。在bash shell中,我们可以如此修改上一段代码:

    if comd1
    then
      comd2
      comd3
    else
      comd4
      comd5
    fi
    

    这也是我们在shell script中最常用到的if判断式:只要if后面的command line返回true的return value(我们最常用test命令来送出return value),然则就执行then后面的命令,否则执行else后的命令;fi则是用来结束判断式的keyword。

    在if判断式中,else部份可以不用,但then是必需的。(若then后不想跑任何command,可用:这个null command代替)。当然,then或else后面,也可以再使用更进一层的条件判断式,这在shell script设计上很常见。

    若有多项条件需要“依序”进行判断的话,那我们则可使用elif这样的keyword:

    if comd1; then
      comd2
    elif comd3; then
      comd4
    else
      comd5
    fi
    

    意思是说:若comd1为true,然则执行comd2;否则再测试comd3,然则执行comd4;倘若comd1与comd3均不成立,那就执行comd5。

    if判断式的例子很常见,你可从很多shell script中看得到,我这里就不再举例子了…接下来要为大家介绍的是case判断式。

    虽然if判断式已可应付大部份的条件执行了,然而,在某些场合中,却不够灵活,尤其是在string式样的判断上,比方如下:

    QQ() {
      echo -n "Do you want to continue?(Yes/No):"
      read YN
      if [ "$YN" = Y -o "$YN" = y -o "$YN" = "Yes" -o "$YN" = "yes" -o "$YN" = "YES" ]
      then
        QQ
      else
        exit 0
      fi
    }
    QQ
    

    从例中,我们看得出来,最麻烦的部份是在于判断YN的值可能有好几种式样。聪明的你或许会如此修改:

    if echo "$YN" | grep -q '^[Yy]\([Ee][Ss]\)*$'
    

    也就是用Regular Expression来简化代码。(我们有机会再来介绍RE)只是…是否有其它更方便的方法呢?有的,就是用case判断式即可:

    QQ() {
      echo -n "Do you want to continue?(Yes/No):"
      read YN
      case "$YN" in
        [Yy]|[Yy][Ee][Ss])
          QQ
          ;;
        *)
          exit 0
          ;;
      esac
    }
    QQ
    

    我们常用case的判断式来判断某一变量在不同的值(通常是string)时作出不同的处理,比方说,判断script参数以执行不同的命令。若你有兴趣、且用Linux系统的话,不妨挖一挖/etc/init.d/*里那堆script中的case用法。如下就是一例:

    case "$1" in
      start)
        start
        ;;
      stop)
        stop
        ;;
      status)
        rhstatus
        ;;
      restart|reload)
        restart
        ;;
      condrestart)
        [ -f /var/lock/subsys/syslog ] && restart || :
        ;;
      *)
        echo $"Usage: $0 {start|stop|status|restart|condrestart}"
        exit 1
      esac
    

    (若你对positional parameter的印像已经模糊了,请重看第9章吧。)okay,十三问还剩一问而已,过几天再来搞定之….^_^

    for what?while与until差在哪?

    最后要介绍的是shell script设计中常见的“循环”(loop)。所谓的loop就是script中的一段在一定条件下反复执行的代码。bash shell中常用的loop有如下三种:for while until

    for loop是从一个清单列表中读进变量值,并“依次”的循环执行do到done之间的命令行。例:

    for var in one two three four five
    do
      echo -----------
      echo '$var is '$var
      echo
    done
    

    上例的执行结果将会是:

    for会定义一个叫var的变量,其值依次是one two three four five。
    因为有5个变量值,因此do与done之间的命令行会被循环执行5次。
    每次循环均用echo产生三行句子。而第二行中不在hard quote之内的$var会依次被替换为one two three four five。
    当最后一个变量值处理完毕,循环结束。
    我们不难看出,在for loop中,变量值的多寡,决定循环的次数。然而,变量在循环中是否使用则不一定,得视设计需求而定。倘若for loop没有使用in这个keyword来指定变量值清单的话,其值将从$@(或$*)中继承:

    for var; do
    …
    done
    

    (若你忘记了positional parameter,请温习第9章…)

    for loop用于处理“清单”(list)项目非常方便,其清单除了可明确指定或从positional parameter取得之外,也可从变量替换或命令替换取得…(再一次提醒:别忘了命令行的“重组”特性!)

    然而,对于一些“累计变化”的项目(如整数加减),for亦能处理:

    for ((i=1;i<=10;i++))
    do
      echo "num is $i"
    done
    

    除了for loop,上面的例子我们也可改用while loop来做到:

    num=1
    while [ "$num" -le 10 ]; do
      echo "num is $num"
      num=$(($num + 1))
    done
    

    while loop的原理与for loop稍有不同:它不是逐次处理清单中的变量值,而是取决于while后面的命令行之return value:

    若为ture,则执行do与done之间的命令,然后重新判断while后的return value。
    若为false,则不再执行do与done之间的命令而结束循环。
    分析上例:

    • 在while之前,定义变量num=1。
    • 然后测试(test)$num是否小于或等于10。
    • 结果为true,于是执行echo并将num的值加一。
    • 再作第二轮测试,此时num的值为1+1=2,依然小于或等于10,因此为true,继续循环。
    • 直到num为10+1=11时,测试才会失败…于是结束循环。

    我们不难发现:若while的测试结果永远为true的话,那循环将一直永久执行下去:

    while : ;do
      echo looping…
    done
    

    上例的:是bash的null command,不做任何动作,除了送回true的return value。因此这个循环不会结束,称作死循环。死循环的产生有可能是故意设计的(如跑daemon),也可能是设计错误。若要结束死循环,可透过signal来终止(如按下ctrl-c)。(关于process与signal,等日后有机会再补充,十三问暂时略过。)

    一旦你能够理解while loop的话,那,就能理解until loop:

    与while相反,until是在return value为false时进入循环,否则结束。
    因此,前面的例子我们也可以轻松的用until来写:

    num=1
    until [ ! "$num" -le 10 ]; do
      echo "num is $num"
      num=$(($num + 1))
    done
    

    或是:

    num=1
    until [ "$num" -gt 10 ]; do
      echo "num is $num"
      num=$(($num + 1))
    done
    

    okay,关于bash的三个常用的loop暂时介绍到这里。在结束本章之前,再跟大家补充两个与loop有关的命令:break continue

    这两个命令常用在复合式循环里,也就是在do…done之间又有更进一层的loop,当然,用在单一循环中也未尝不可啦…^_^

    break是用来打断循环,也就是“强迫结束”循环。若break后面指定一个数值n的话,则“从里向外”打断第n个循环,预设值为break 1,也就是打断当前的循环。
    在使用break时需要注意的是,它与return及exit是不同的:

    • break是结束loop
    • return是结束function
    • exit是结束script/shell

    而continue则与break相反:强迫进入下一次循环动作。若你理解不来的话,那你可简单的看成:在continue到done之间的句子略过而返回循环顶端…与break相同的是:continue后面也可指定一个数值n,以决定继续哪一层(从里向外计算)的循环,预设值为continue 1,也就是继续当前的循环。

    jsjbwy