仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 750|回复: 10
打印 上一主题 下一主题

[其他Linux] Linux编程:管道与Unix哲学仓酷云

[复制链接]
因胸联盟 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-1-18 11:18:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
尽我能力帮助他人,在帮助他人的同时你会深刻巩固知识。
0x00媒介

比来看到一篇文章关于Unix管道的,讲的十分透辟,以是此次仍然做一个复杂的翻译息争读~原文地点请戳这里
上面正式入手下手~
管道(Pipelines)是古代软件工程中一个十分有效架构模子,最早利用在Unix体系中,有句话是这么说的
假如说Unix是盘算机文化中最巨大的创造,那末,Unix下的Pipe管道就是跟从Unix所带来的另外一个巨大的创造
管道所要办理的成绩,仍是软件计划中陈词滥调的计划方针——高内聚,低耦合。它以一种“链式模子”来串接分歧的程序大概分歧的组件,让它们构成一条直线的事情流。如许给定一个完全的输出,经由各个组件的前后协同处置,失掉独一的终极输入。
假如你常常利用Unix的话,必定对管道标记|不生疏。那末,我们来看看上面这个例子
  1. cat/usr/share/dict/words|#Readinthesystemsdictionary.greppurple|#Findwordscontainingpurpleawk{printlength($1),$1}|#Countthelettersineachwordsort-n|#Sortlines("${length}${word}")tail-n1|#Takethelastlineoftheinputcut-d""-f2|#Takethesecondpartofeachlinecowsay-ftux#PuttheresultingwordintoTuxsmouth
复制代码
用bash运转下面的命令,终极会前往一只心爱的Linux小企鹅,并告知你字典中包括purple最长的一个单词,看起来是上面这个模样
  1. _____________<unimpurpled>-------------.--.|o_o||:_/|//(||)/__/`___)=(___/
复制代码
0x01实行流程

下面看似复杂的命令却实行了一个十分庞大的流程,当我们按下回车键时,上面的步骤顺次实行

  • shell会当即创立7个历程
  • 每一个历程的尺度输出(stdin)和尺度输入(stdout)将被重定向到shell的外部缓存中(在我的呆板上每一个如许的缓存巨细为512字节,你能够用ulimit-a命令来检察你本人呆板上这个缓存的巨细)
  • 源历程cat入手下手从文件中读取内容并输入到stdout。这个数据流畅过第一个管道进进到第一个缓存中,并且很快就会抵达缓存容量的下限。一旦抵达这个下限,cat就会被它本人的write(2)所堵塞。这是管道的长处之一:cat的实行历程隐式的受管道数据处置的才能的把持。(有点相似协程的观点,这里每个历程都充任了一个“协程”)
  • 接上去第一个过滤历程grep挪用read(2)从它的stdin管道中读取数据。当grep历程刚被创立的时分,这个管道是空的(cat历程的输入数据还没有传输过去),以是grep历程会被堵塞,直到有新数据到来。这里我们再一次看到了基于数据处置才能隐式实行把持。grep从读取的数据的每行中举行婚配,并将婚配的单词输入到grep历程的stdout中,一样经由过程管道传送给下一个历程
  • awk历程的实行历程与grep相似。没无数据的时分awk历程将被堵塞,有新数据到来的时分,awk对数据举行处置并输入到stdout中
  • sort与之前两个历程稍有分歧。由于sort触及到排序,必需在完全的数据上实行。sort会把每次从shell缓存中读取的数据保留在磁盘上的一个缓存空间中。当sort的stdin封闭时(意味着没有更多新数据了),sort会举行排序操纵,并输入到stdout
  • tail与sort相似,也是必要在完全的数据上实行。不外tail不必要占用太多的缓存空间,由于tail只体贴输出的最初一行数据
  • cut又相称于一个过滤器,与grep和awk相似。
  • cowsay一样一向守候输出,盘算输出的长度,并用ASCII码字符绘制出措辞的Linux企鹅
使用管道来实行这个义务十分复杂,一个没有编程基本的人都能够轻松完成。每一个步骤所用到的数据都经由了上一个义务的过滤,以后数据集在每步城市改动。正如Unix哲学所倡议的
Doonething,Doitwell
为了更直不雅的展现这个历程,我们把上述步骤画在一张图上

0x02功能和庞大度

管道的另外一个长处就是它生成的高功能。我们对下面的命令稍作修正以察看个中每个过滤器组件的内存和CPU占用率
  1. /usr/bin/time-lcat/usr/share/dict/words2>cat.time.txt|/usr/bin/time-lgreppurple2>grep.time.txt|/usr/bin/time-lawk{printlength($1),$1}2>awk.time.txt|/usr/bin/time-lsort-n2>sort.time.txt|/usr/bin/time-ltail-n12>tail.time.txt|/usr/bin/time-lcut-d""-f22>cut.time.txt|/usr/bin/time-lcowsay-ftux2>cowsay.time.txt
复制代码
(注重:假如你利用的是Linux,可使用-v选项完成一样的效果。2>something.time.txt会将stderr重定向到文件中)
在运转完上述命令后,经由过程检察输入文件内里的相干信息,我们能够画出上面几张图



  • 个中内存占用最年夜的过滤器是cowsay,占用了2,830,336字节,由于它是用Perl完成的(在我的呆板上仅启动Perl的注释器就要占用1,126,400字节的内存),内存占用最小的是tail,只占用了389,120字节
  • 只管我们的源文件(/usr/share/dict/words)有2.4MB,可是年夜部分的过滤器都没有占用年夜于源文件1/5的内存,这得益于我们之前所提到的:管道只保留它所能处置的最年夜数据量,一旦凌驾这个值,相干历程将被堵塞,直到下一级历程将数据取走并清空缓存。这个特征决意了管道是一个十分节俭内存空间的轻量级办理计划,不管处置多年夜的文件,管道占用的都是一块恒定的内存空间
  • 注重到前两个历程cat和grep有大批志愿高低文切换(voluntarycontextswitches),这次要是由IO堵塞引发的(究竟缓存巨细只要512字节)。cat从磁盘上读取文件时必需将高低文切换到操纵体系,然后将读取的内容输入到stdout,grep从管道读取数据时一样要举行高低文切换。而ack、sort、tail、cut并没有太多高低文切换的缘故原由在于它们处置的数据量要小的多,grep已替它们过滤了大批数据,实践交由ack处置的数据只要12行,任何一个缓存都能够装下这些数据
  • cowsay有很多非志愿高低文切换(involuntarycontextswitches),不外这并非它所处置的数据太多引发的。后面提到了cowsay是用Perl完成的,效力与其他比拟是较低的,因而这里较多的非志愿高低文切换是历程工夫片(timequantum)耗尽引发的
我们只是展现了一个复杂的例子,不外假想一下,假如个中某些历程实行的是庞大的盘算义务,那末它们将主动在多处置器上并行实行。这么来看的话管道的上风十分分明~
0x03非常

回忆一下管道的长处,省内存、省CPU工夫,基于数据处置才能的隐式实行把持,便利快速……既然管道有云云多的长处,为何没有在实践中年夜范围使用呢?
缘故原由在于非常处置,假如管道的某其中间环节出了成绩,那末全部管道就完全挂失落了。
我们对方才谁人例子稍作修正,到场一个本人用python完成的fail.py程序,它把stdin的内容间接输入到stdout中往,可是它有50%的几率发生非常
  1. cat/usr/share/dict/words|#Readinthesystemsdictionary.greppurple|#Findwordscontainingpurpleawk{printlength($1),$1}|#Countthelettersineachwordsort-n|#Sortlines("${length}${word}")pythonfail.py|#PlayRussianRoulettewithourdata!tail-n1|#Takethelastlineoftheinputcut-d""-f2|#Takethesecondpartofeachlinecowsay-ftux#PuttheresultingwordintoTuxsmouth
复制代码
fail.py的源码
  1. importsysimportrandomwhileTrue:ifrandom.choice([True,False]):sys.exit(1)line=sys.stdin.readline()ifnotline:breaksys.stdout.write(line)sys.stdout.flush()
复制代码
那末我们来看看非常发生时会产生甚么事变。当fail.py在读取stdin之前就加入时,它的stdin和stdout管道就封闭了,这相称于把全部管道切成了两半,接上去就会发生一系列连锁反响

  • sort历程会吸收到一个SIGPIPE旌旗灯号关照它的stdout管道被封闭了。此时sort能够选择当即处置这个SIGPIPE大概从头实验write(2),可是此时挪用write(2)只能前往-1,由于stdout管道已被封闭。以是sort没法一般输入,只以选择加入,并封闭它的stdin管道,这又会招致sort之前的历程顺次封闭加入(固然历程并不是碰到SIGPIPE大概写毛病就必需加入,可是这个例子中非常是由历程的输入管道被封闭引发的,以是除加入没有其他举措)
  • tail历程一样收到一个SIGPIPE旌旗灯号关照它的stdin管道被封闭,此时tail能够选择处置这个SIGPIPE旌旗灯号大概疏忽这个旌旗灯号,可是不管如何,它下一次挪用read(2)时将会前往毛病,并且没法与一般的流停止辨别开来(由于一样都是没有新的数据了),因而tail会以为这是一般的流停止标记,会在现无数据基本长进行操纵,并将了局输入到stdout
  • cut一样不会发觉有非常产生,会在tail供应的数据上一般实行
  • cowsay会输入在python产生非常之前的数据会合含purple且最长的单词
了局是甚么呢?
  1. __________<repurple>----------.--.|o_o||:_/|//(||)/__/`___)=(___/
复制代码
企鹅说的不再是unimpurpled,而酿成了repurple,这个了局是毛病的!固然个中一个过滤器产生了非常,我们仍是失掉了局了,只不外是一个毛病的了局,可是更糟的事变是当我们检察管道的前往码时,失掉了如许的了局
  1. bash-3.2$echo$?0
复制代码
bash显现管道准确实行了,这是因为bash把最初一个历程的前往码看成全部管道的形态码前往给我们。假如要检察管道中每个历程的前往码,要利用到一个很罕用到的$PIPESTATUS变量
  1. bash-3.2$echo${PIPESTATUS
  2. [*]}00001000
复制代码
这个数组保留了管道中每个历程的前往码,只要从这里我们才干发明管道中的一个过滤器产生了非常
这就是传统的Unix管道一个十分年夜的弱点,假如想在管道处置数据时探测非常必要用到带外数据(out-of-band)旌旗灯号来检测非常,并将动静发到其他历程(假如你的过滤器有不止一个输出管道这长短常好完成的,但假如你利用的仅仅是Unix管道就对照坚苦了)
0x04管道的其他用处

看完了下面的先容,你大概会有上面的成绩
管道在实际中怎样利用呢?
可否在我的webapp中利用管道呢?
<p>这些对管道来讲都不是成绩,只需你的义务能够
如果你想在以后的生涯中在软件行业工作的话,学习linux是一项基本技能,所以打从你打算学习linux那天起,放弃windows吧!因为它除了能给你带来片刻的娱乐,别无其他;
飘飘悠悠 该用户已被删除
沙发
发表于 2015-1-20 19:57:00 | 只看该作者
对我们学习操作系统有很大的帮助,加深我们对OS的理解。?
愤怒的大鸟 该用户已被删除
板凳
发表于 2015-1-29 19:25:10 | 只看该作者
对于英语不是很好的读者红旗 Linux、中标Linux这些中文版本比较适合。现在一些Linux网站有一些Linux版本的免费下载,这里要说的是并不适合Linux初学者。
爱飞 该用户已被删除
地板
发表于 2015-2-6 03:33:03 | 只看该作者
随着Linux应用的扩展,出现了不少Linux社区。有一些非常优秀的社区往往是Linux高手的舞台,如果在探讨高级技巧的论坛张贴非常初级的问题经常会没有结果。
蒙在股里 该用户已被删除
5#
发表于 2015-2-7 08:05:55 | 只看该作者
永中office 2004增强版安装只需要默认安装即可使用并操作大多与win系统雷同,打印机的配置和管理,记录光盘等。
第二个灵魂 该用户已被删除
6#
发表于 2015-2-10 23:24:14 | 只看该作者
Linux高手更具有鼓励新手的文化精神。如何在Linux社区获得帮助,需要说明的是你要有周全的思考,准备好你的问题,不要草率的发问。
海妖 该用户已被删除
7#
发表于 2015-2-22 09:52:35 | 只看该作者
下面看看一个让人无法回答的问题:“救命各位高手,向你们请教一些问题:如何在Linux下配制HTTP、FTP、Samba、DNS、DHCP、Sendmail服务器,谢谢”这样的问题。
分手快乐 该用户已被删除
8#
发表于 2015-2-27 04:41:01 | 只看该作者
生成新的unispimsp.ksc。”另外得到回复后如果问题解决,向帮助过你的人发个说明,让他们知道问题是怎样解决的。
活着的死人 该用户已被删除
9#
发表于 2015-2-28 04:06:23 | 只看该作者
然我们对Linux的学习首先是通过对它的产生,发展,到今天仍然在不断完善开始的。
小女巫 该用户已被删除
10#
发表于 2015-3-7 13:22:19 | 只看该作者
尽我能力帮助他人,在帮助他人的同时你会深刻巩固知识。
小妖女 该用户已被删除
11#
发表于 2015-3-25 12:17:04 | 只看该作者
和私有操作系统不同,各个Linux的发行版本的技术支持时间都较短,这对于Linux初学者是往往不够的。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-24 01:59

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表