仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 668|回复: 8
打印 上一主题 下一主题

[CentOS(社区)] 带来一篇运维工程师的职责和远景

[复制链接]
简单生活 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-1-14 20:47:22 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
如果您觉得本篇CentOSLinux教程讲得好,请记得点击右边漂浮的分享程序,把好文章分享给你的好朋友们!运维工程师的职责和远景

运维中症结技巧点剖解:1大批高并发网站的设计计划;2高靠得住、高可伸缩性收集架构设计;3网站平安成绩,若何防止被黑?4南北互联成绩,静态CDN处理计划;5海量数据存储架构

1、甚么是年夜型网站运维?

起首明白一下,全文所讲的”运维“是指:年夜型网站运维,与其它运维的差别照样蛮年夜的;然后我们再对年夜型网站与小型网站停止规模界说,此界说重要从运维庞杂性角度斟酌,如网站标准、著名度、办事器量级、pv量等斟酌,其它身分不是重点;是以,我们先界说办事器范围年夜于1000台,pv天天至多上亿(至多国际排名前10),如sina、百度、QQ,51.com等等;其它小型网站能够没有真正意义上的运维工程师,这与网站标准不敷和本钱身分有关,更多的是聚集收集、体系、开辟任务于一身的“复合性人才网job.vhao.net”,就若有些公司把一些合同推销都归入了运维职责规模,还有如IDC收集计划也归入运维职责。所以,异常主要必定须要明白:运维对其它联系关系工种必需异常懂得熟习:收集、体系、体系开辟、存储,平安,DB等;我在这里所讲的运维工程师就是指专职运维工程师。

我们再来讲说普通产物的“出身”流程:

1、起首公司治理层给出指点思惟,PM定位市场需求(或copy成熟运用)停止调研、剖析、终究给出具体设计。

2、架构师依据产物设计的需求,如pv巨细预估、办事器范围、运用架构等身分完成收集计划,架构设计等(根本上对收集更改不年夜,除非年夜项目)

3、开辟工程师将设计code完成出来、测试工程师对运用停止测试。

4、好,到运维工程师出马了,起首明白一点不是说前三步就与运维任务有关了,恰好相反,前三步与运维关系很年夜:运用的后期架构设计、软/硬件资本评价请求推销、运用设计机能隐患及评价、IDC、办事机能平安调优、办事器体系级优化(与特定运用有关)等都需运维全程介入,并主导全部运用上线项目;运维工程师担任产物办事器上架预备任务,办事器体系装置、收集、IP、通用对象集装置。运维工程师还须要对上线的运用体系架构能否公道、能否具有可扩大性、及平安隐患等身分担任,并负责最初将产物(法式)、收集、体系三者停止拼接并最优化的组合在一路,终究完成产物上线供给用户应用,并周而复使:需求->开辟(进级)->测试->上线(机能、平安成绩等之前预估外的成绩随之渐渐就全出来了)在这里提一点:网站开辟形式与传统软件开辟完整纷歧样,网站一天开辟上线1~5个进级版本是屡见不鲜,用户体验为王嘛,假如某个线上成绩像M$须要1年处理,用户早跑光了;运用上线后,运维任务才刚开端,详细任务能够包含:进级版本上线任务、办事监控、运用状况统计、平常办事状况巡检、突发毛病处置、办事平常变革调剂、集群治理、办事机能评价优化、数据库治理优化、跟着运用PV增减停止运用架构的伸缩、平安、运维开辟任务:

a、尽可能将平常机械性手工任务经由过程对象完成(如办事监控、运用状况统计、办事上线等等),进步效力。

b、处理实际中办事存在的成绩,如高靠得住性、可扩大性成绩等。

c、年夜范围集群治理对象的开辟,如1万台机械若何在1分钟内完成暗码修正、或运转指定义务?2000台办事器若何疾速装置操作体系?各散布式IDC、存储集群中数PT级的数据若何疾速的存储、同享、剖析?等一系列挑衅都需运维工程师的尽力。

在此解释一下其它合营工种情形,在全部项目中,前端运用关于收集/体系工程师来讲是黑匣子,同时开辟工程师职责只是担任完成运用的功效性开辟,并对运用本身机能、平安性等运用自己担任,它不担任或关怀收集/体系架构方面事宜,固然软/硬件推销人员等事业部其它同事也不会关怀这些成绩,各司其职,但项目标焦点是运维工程师~!一切其它部分的桥梁。

下面说了许多,我想人人应当对运维有一些概念了,在此打个比喻吧,假如我们是一辆高速行驶在高速公路上的汽车,那运维工程师就是司机兼维修工,这个司机不简略,有时须要在高速行驶过程当中换轮胎、并依据路径情形换档位、当汽车速度愈来愈快,汽车自己不克不及知足高速度时对汽车机能调优或零件进级、高速行进中处理汽车毛病及机能成绩、时辰存眷后方平安成绩,并先知先觉的采用躲避手腕。这就是运维任务~!

最初说一下运维工程师的职责:”确保线上稳固“,看似简略,但实属不轻易,运维工程师必需在诸多晦气身分中停止衡量:新产物形式对现有架构及技巧的冲击、产物高频度的进级带来的线上BUG隐患、运维主动化治理承度不高招致的工资掉误、IT行业寻求的高效力招致流程履行上的缺掉、用户增涨带来的机能及架构上的压力、IT行业宽松的技巧治理文明、立异风险、互联网平安性成绩等身分,都邑是网站稳固的年夜敌,运维工程师必需把控好这最初一关,需详细高度的义务感、准绳性及调和才能,假如能做到各身分的最好均衡,那就是一位优良的运维工程师了。

别的在此聊点题外话,我在这里看到有许多人要sina、QQ、百度,51.com等聊自已的运维方面的经历,其实这关于它们有点免为其难:

a、各公司自已收集架构、范围、或多或少还算是公司的焦点机密,要保密,别的,关于人人所熟知的通用软件、架构,因为许多公司会依据自已现实营业须要,同时由于原版机能、平安性、已知bug、功效等缘由,停止过二次开辟(如apache,php,mysql),操作体系内核也会依据分歧营业类型停止定制的,如某些运用属于运算型、某些是高IO型、或年夜存储年夜内存型。依据这些特色停止内核优化定制,如sina就在memcache长进行过二次开辟,弄出了一个MemcacheDB,详细做得若何我们不谈,但开源了,是值得夸奖的,国际公司关于开源根本上是讨取,没有进献;别的,办事器也不是人人所熟知的型号,依据营业特色,年夜部分都是找DELL/HP/ibm停止过定制;别的,在散布式贮存方面都有自已处理计划,要不就是应用现成开源hadoop等处理计划,或自已开辟。但90%都是自创谷歌GFS的思惟:散布式存储、盘算、年夜表。

b、各公司营业偏向纷歧样,会招致运维形式或办法都纷歧样,如51.com和百度运维确定差别很年夜,由于他们营业形式决议了其架构、办事度量级、IDC散布、收集构造、通用技巧都邑纷歧样,主打消息门户的sina与主打sns的51.com运维形式差别就异常年夜,乃至职责都不年夜一样;但有一点,通用技巧及年夜致架构上都迥然不同,人人不要太神化,更多的公司只是玩垒积木的游戏而已,没甚么技巧含量。

c、如下面所讲,今朝年夜型网站运维还处于少小时代理念和经历都比拟零碎,没有成熟的常识系统,能够详细甚么是运维,人人都要先思考一番,或压根没想过,真正评论辩论也只是运维任务的冰山一角,局限于详细技巧细节,或某某有名网站年夜的框架,真正运维系统化器械没有,这或许是今朝网上运维相干材料比拟少的原故吧。或许也是国际运维人员比拟难招,比拟牛的运维工程师比拟少见的缘由之一吧。

2、运维任务师须要甚么样的技巧及本质

做为一位运维工程师须要甚么样的技巧及本质呢,起首说说技巧吧,如人人下面所看到,运维是一个集多IT工种技巧与一身的岗亭,对体系->收集->存储->协定->需求->开辟->测试->平安等各环节都须要懂得一些,但关于某些环节需熟习乃至精晓,如体系(根本操作体系的熟习应用,*nix,windows..)、协定、体系开辟(平常很主要的任务是主动运维化相干开辟、年夜范围集群对象开辟、治理)、通用运用(如lvs、ha、webserver、db、中央件、存储等)、收集,IDC拓朴架构;

技巧方面总结以下几点:

1、开辟才能,这点异常主要,由于运维对象都须要自已开辟,开辟说话:c/c++(必备个中之一)、perl、python、php(个中之一)、shell(awk,sed,expect….等),须要有过现实开辟经历,不然任务会异常苦楚。

2、通用运用方面须要懂得:操作体系(今朝国际重要是linux、bsd)、webserver相干(nginx,apahe,php,lighttpd,java。。。)、数据库(mysql,oralce)、其它杂七八拉的东东。。。体系优化,高可靠性。。。这些只是加分项,不需必备,可以边任务边渐渐学,这些器械都不难。固然在运维中,有些是有分工着重点纷歧样。

3、体系、收集、平安,存储,CDN,DB等须要相当懂得,晓得其相干道理。

小我本质方面:

1、沟通才能、团队协作:运维任务跨部分、跨工种任务许多,需擅长沟通、而且团队协作才能要强;这应当是古代企业的根本本质请求了,不多说。

2、任务中需胆大心小:胆小能力立异、不走平常路,特殊关于运维这类新的工种,更需立异能力增进成长;心细,运维工程师是网站admin,最高线上权限者,一不当心就会遗憾毕生或打入十八层天堂。

3、自动性、履行力、精神兴旺、抗压才能强:因为IT行业的特征,变更快;常常筹划赶不上变更,运维任务就更凸起了,好比国际各年夜公司办事器常常是全国各地,哪里廉价性价比高,就那往搬,停止年夜范围办事迁徙(牵扯的办事器成百上千台),这是一个异常头痛的成绩;常常时光异常紧急,如限1周内完成,这类情形下,运维工程师的自动性及履行力就有很高的请求了:筹划、计划、办事无缝迁徙、机械搬家上架、情况预备、平安评价、性能评价、基建、各联系关系部分扯皮,7X24小紧迫变乱呼应等。

4、其它就是一些根本本质了:脑筋要灵光、逻辑思想才能强、为人谦逊庄重、亲和力、乐于助人、有年夜局不雅。

5、最初一点,做网站运维须要有摸索立异精力,经由过程立异型思想处理实际中的成绩,由于这是一个处于少小的职业(国外也一样,但比国际起步早点),没有成熟系统或办法论可以自创,只能靠人人自已探索尽力。

3、如何才算是一个及格的运维工程师

1、包管办事到达请求的线上尺度,如99.9%;包管线上稳固,这是运维工程师的根本责职地点。

2、赓续的晋升运用的靠得住性与硬朗性、机能优化、平安晋升;这方面异常考验自动性和立异思想。

3、网站各层面监控、统计的笼罩度,软件、硬件、运转状况,能监控的都须要监控统计,防止监控逝世角、并能及时懂得运用的运转情形。

4、经由过程立异思想处理运维效力成绩;今朝各公司年夜部分运维重要任务照样依附人工操作干涉,须要尽量的束缚双手。

5、运维常识的积聚与沉淀、文档的完整性,运维是一个经历性异常强的岗亭,好的经历与圈套都需积聚上去,防止反复性范错。

6、筹划性和履行力;任务有筹划,筹划后设法主意想法到达目的,不找托言。

7、主动化运维;能对平常机械化任务停止提炼、设计并开辟成对象、体系,能让体系主动完成的尽可能依附体系;让人人更多的时光用于思虑、立异思想、做自已爱好的工作。

以上只是技巧上的一些层面,固然小我认识也是很主要的。

4、运维职业的怅惘、近况与成长远景

运维岗亭不像其它岗亭,如研发工程师、测试工程师等,有异常明白的职责定位及职业计划,比拟有职业认同感与造诣感;而运维任务能够给人的感到是哪方面都了解一些,但又都比上专职工程师更精晓、感到日常平凡被存眷度比拟低(除非线上涌现毛病),渐渐的人人就会怅惘,对职业成长发生迷惑,为何会有这类景象呢?除了职业自己特色外,重要照样由于对运维懂得不深刻、做得不深刻招致;其实这个成绩其它岗亭也会涌现,但我发明运维更典范,更轻易涌现这个问题;

针对这个成绩我谈一下网站运维的近况及成长远景(也在思虑中,能够不太深刻周全,也请人人示正弥补)

运维近况:


1、处于刚起步的低级阶段,各年夜公司有此专职,但看重或主要水平不高,可替换性强;小公司更多是由其它岗亭来统筹做这一块任务,没有专职,也弗成能做得深入。

2、技巧条理比拟低;重要处于技巧摸索、积聚阶段,没有型成系统化的理念、技巧。

3、膂力休息偏年夜;这个成绩重要与第二点有关系,许多工作照样依附人力停止,没有完成好的提练,关于年夜范围集群没有成熟的主动化治理办法,在此解释一下,年夜范围集群与运维任务是互相关注的假如只是百十来台机械,那就没有运维太年夜的生计空间了。

4、优良运维人才网job.vhao.net的极端缺少;今朝各年夜公司根本上都靠自已造就,这个近况招致行业内运维人才网job.vhao.net的活动性异常低,异常多好的技巧都局限在各年夜公司外部,如谷歌50万台机械迷信的治理,或许国际互联公司top10的一些运维经历,这些经历长短常有价值的器械并决议了一个公司的焦点竞争力;这些成绩进而招致业内先辈运维技巧的流畅、贯穿、与借签,并终究将限制了运维成长。

5、许多优良的运维经历都控制在年夜公司手中;这不在于公司的技巧实力,而在于年夜公司的技巧范围、海量PV、硬件范围足够年夜,如百度恐怖的流量、51.com海量数据~~~~这些身分决议了他们碰到的成绩都是其它中/小公司还没有碰到的,或行将碰到。但年夜公司能够已有很好的处理计划或体系。


成长远景:

1、从行业角度来看,跟着中国互联网的高速成长(今朝中国网平易近已跃升为全球第一)、网站范围愈来愈来年夜、架构愈来愈庞杂;对专职网站运维工程师、网站架构师的请求会愈来愈急切,特殊是对有经历的优良运维人才网job.vhao.net需求量年夜,并且是越老越值钱;今朝国内根本上都是选择卒业生造就(限于年夜公司),造就本钱高,并且没有经历人才网job.vhao.net参加会招致公司技巧更新迟缓、影响公司的技巧成长;固然,卒业生也有利益:白纸一张,可塑性强,比拟认同并轻易融入企业文明。

2、从小我角度,运维工程师技巧含量及请求会愈来愈高,同时也是对公司运用、架构最懂得最熟习的人、愈来愈获得看重。

3、网站运维将成为一个融会多学科(收集、体系、开辟、平安、运用架构、存储等)的综合性技巧岗亭,给人人供给一个很好的小我才能与技巧广度的成长空间。

4、运维任务的相干经历将会变得异常主要,并且也将成为小我的焦点竞争力,具有很好的各层面成绩的处理才能及计划供给、全局思虑才能等。

5、专长施展和兴致的造就;因为运维岗亭所接触的常识面异常辽阔,更轻易造就或施展出小我某些方面的专长或喜好,如内核、收集、开辟、数据库等方面,可以做得异常深刻精晓、成为这方面的专家。

6、假如真要今后不想做运维了,转到其它岗亭也比拟轻易,不会有太年夜的局限性。固然了,你得真正居心去做。

7、技巧成长偏向:网站/体系架构师。

5、运维症结技巧点剖解

1、年夜范围集群治理成绩

起首我们先要明白集群的概念,集群不是泛指各功效办事器的总合,而是指为了到达某一目标或功效的办事器、硬盘资本的整合(机械数年夜于两台),关于运用来讲它就是一个全体,今朝惯例集群可分为:高可用性集群(HA),负载平衡集群(如lvs),散布式储、盘算存储集群(DFS,如谷歌gfs,yahoohadoop),特定运用集群(某一特定功效办事器组合、如db、cache层等),今朝互联网行业重要基于这四品种型;关于前两品种似,假如营业简略、运用上post操作比拟少,可以简略的采取四层交流机处理(如f5),到达办事高可用/担任平衡的感化,关于资本重要的公司也有一些开源处理方法如lvs+ha,异常灵巧;关于后两种,那就考验公司技巧实力及运用特色了,第三种DFS重要运用于海量数据运用上,如邮件、搜刮等运用,特殊是搜刮请求就更高了,除简略海量存储,还包含数据发掘、用户行动剖析;如谷歌、yahoo就可以保留剖析近一年的用户记载数据,而百度应当少于30天、soguo就更少了。。。这些关于搜刮预备性、及用户体验是至关主要的。

接上去,我们再谈谈若何迷信的治理集群,有以下症结几点:

I、监控

重要包含毛病监控和机能、流量、负载等状况监控,这些监控关系到集群的安康运转,及潜伏成绩的实时发明与干涉;

a、办事毛病、状况监控:重要是对办事器本身、下层运用、联系关系办事数据交互监控;例如针对前端webserver,我们就能够有许多品种型的监控,包含运用端口状况监控,便于实时发明办事器或运用自己能否crash、经由过程icmp包探测办事器安康状况,更下层能够还包含运用各频道营业的监控,经常使用办法是采取面业特点码停止断定,或对重点页面停止签名,以网站被黑改动(报警、并主动恢复被改动数据)等等,这些只是一部分,还有N多监控方法,依运用特色而定,还有一些成绩需处理,如集群过年夜,若何高机能的停止监控也是一个实际成绩。

b、其它就是集群状况类的监控或统计,为我们公道治理调优集群供给数据参考、包含办事瓶颈、机能成绩、异常流量、进击等成绩。

II、毛病治理

a、硬件毛病成绩;关于成百上千或上万机械的N多集群,办事器逝世机、硬件毛病几率长短常年夜的,简直时时刻刻都有办事硬件成绩,逝世机、硬盘破坏、电源、内存、交流机。针对这类情形,我们在设计网站架构时须要充足斟酌到这些成绩,并将其视为常态;更多的依附运用的冗余机制来躲避这类风险,但给体系工程师足够裕如的处置时光。(如谷歌不是号称同时逝世800台机械,办事不会遭到任何影响吗);这就是考验运维工程师及网站架构师功效的处所了,好的设计能达到谷歌所描写自恢复才能,如gfs,蹩脚的设计那就是一台办事器的逝世机能够会形成年夜面积办事的连锁毛病反应,直接对用户谢绝呼应。

b、运用毛病成绩;多是某一bug被触发、或某一机能阀值被超出、进击等情形纷歧而定,但主要的一点,是要有对这些成绩的预防性办法,不克不及想固然,它不会出成绩,如真出成绩了,若何应对?这须要运维工程师日常平凡做足工夫,包含应急呼应速度、毛病处置的迷信性、备用计划的有用等。

III、主动化

主动化:简而言之,就是将我们平常手动停止的一些任务经由过程对象,体系主动来完成,束缚我们的双手及死板的反复性休息,例如:没有对象前,我们装置体系须要一台一台裸机装置,如2000台,能够须要10人/10天,弄烂N张光盘,人力本钱更年夜。。。而如今经由过程主动化对象,只需几个简略敕令就可以弄定、还有如机械人类法式,主动完成以往天天人工干涉的任务,使其主动完成、报告请示成果,并具有必定的专家体系才能,能做一些简略的是/非断定、优化选择等。。。这些利益异常显著不再多说。。。应当说,主动化运维是运维工程师职业化的一个寻求,利已利公,固然这是一个异常艰难的义务:赓续变革的营业、不标准化的运用设计、开辟形式、收集架构变革、IDC变革、标准更改等身分,都能够会对现有主动化体系发生影响,所以须要模块化、接口化、变因参数化等因此,主动化相干任务,是运维工程师的焦点重点任务之一,也是价值的表现。



如果您觉得本篇CentOSLinux教程讲得好,请记得点击右边漂浮的分享程序,把好文章分享给你的小伙伴们!
愤怒的大鸟 该用户已被删除
沙发
发表于 2015-1-16 22:56:23 | 只看该作者

带来一篇运维工程师的职责和远景

安装一个新的软件时先看README,再看INSTALL然后看FAQ,最后才动手安装,这样遇到问题就知道为什么。如果Linux说明文档不看,结果出了问题再去论坛来找答案反而浪费时间。
灵魂腐蚀 该用户已被删除
板凳
发表于 2015-1-24 11:35:28 | 只看该作者
虽然大家都比较喜欢漂亮的mm,但是在学 linux 的过程中,还是要多和“男人”接触一下:P 遇到问题的时候,出来看说和上网查之外,就是要多用 linux 下的 man 命令找找帮助。
透明 该用户已被删除
地板
发表于 2015-2-1 10:59:46 | 只看该作者
一定要学好命令,shell是命令语言,命令解释程序及程序设计语言的统称,shell也负责用户和操作系统之间的沟通。
再现理想 该用户已被删除
5#
发表于 2015-2-7 07:45:28 | 只看该作者
其中不乏很多IT精英的心血。我们学透以后更可以做成自己的OS!?
不帅 该用户已被删除
6#
发表于 2015-2-21 19:20:40 | 只看该作者
Linux?最大的优点在于其作为服务器的强大功能,同时支持多种应用程序及开发工具,所以Linux操作系统有着广泛的应用空间。
活着的死人 该用户已被删除
7#
发表于 2015-3-6 23:09:55 | 只看该作者
其次,Linux简单易学,因为我们初学者只是学的基础部分,Linux的结构体系非常清晰,再加上老师循序渐进的教学以及耐心的讲解,使我们理解起来很快,短期内就基本掌握了操作和运行模式。
小妖女 该用户已被删除
8#
发表于 2015-3-13 23:09:36 | 只看该作者
我感觉linux的学习,学习编程~!~!就去学习C语言编程!!
柔情似水 该用户已被删除
9#
发表于 2015-3-20 23:27:37 | 只看该作者
学习Linux,应该怎样学,主要学些什么,一位Linux热心学习者,一段学习Linux的风云经验,历时十二个小时的思考总结,近十位网络Linux学习者权威肯定,为您学习Linux指明方向。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-12-24 01:45

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表