仓酷云

标题: 来谈谈:运维工程师在办事器上扫除成绩的头五分钟 [打印本页]

作者: 小妖女    时间: 2015-1-14 21:13
标题: 来谈谈:运维工程师在办事器上扫除成绩的头五分钟
小知识:Linux主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。
我们团队为上一家公司承当运维、优化和扩大事情的时分,我们碰着了各类分歧范围的功能很差的体系和基本设备(年夜型体系占多数,好比CNN大概天下银行的体系)。如果再遇上修复工夫紧、奇葩的手艺平台、短少信息和文档,基础上这历程城市凄惨到让我们留下深入的影象。
碰到办事器妨碍,成绩呈现的缘故原由很少能够一下就想到。我们基础上城市从以下步骤动手:

1、尽量弄分明成绩的来龙去脉

不要一会儿就扎到办事器后面,你必要先弄分明对这台办事器有几已知的情形,另有妨碍的详细情形。否则你极可能就是在有的放矢。
必需弄分明的成绩有:

最初两个是最便利的信息来历,不外别抱太年夜但愿,基础上它们都不会有。只能再持续探索了。




2、有谁在?

1

2

$w
$last



用这两个下令看看都有谁在线,有哪些用户会见过。这不是甚么关头步骤,不外最好别在其他用户正干活的时分来调试体系。有道是一山不容二虎嘛。(necookinthekitchenisenough.)

3、之前产生了甚么?
1

$history



检察一下之前办事器上实行过的下令。看一下老是没错的,加上后面看的谁登录过的信息,应当有点用。别的作为admin要注重,不要使用本人的权限往侵占他人的隐私哦。
到这里先提示一下,等会你大概会必要更新HISTTIMEFORMAT情况变量来显现这些下令被实行的工夫。对要否则光看到一堆不晓得啥时分实行的下令,一样会使人抓狂的。

4、如今在运转的历程是啥?

1

2

$pstree-a
$psaux



这都是检察现有历程的。psaux的了局对照混乱,pstree-a的了局对照复杂了然,能够看到正在运转的历程及相干用户。

5、监听的收集办事
1

2

3

$netstat-ntlp
$netstat-nulp
$netstat-nxlp



我一样平常都分隔运转这三个下令,不想一会儿看到列出一年夜堆一切的办事。netstat-nalp倒也能够。不外我毫不会用numeric选项(不才一点浅陋的意见:IP地点看起来更便利)。
找到一切正在运转的办事,反省它们是不是应当运转。检察各个监听端口。在netstat显现的办事列表中的PID和psaux历程列表中的是一样的。
假如办事器上有好几个Java大概Erlang甚么的历程在同时运转,可以按PID分离找到每一个历程就很主要了。
一般我们倡议每台办事器上运转的办事少一点,需要时能够增添办事器。假如你看到一台办事器上有三四十个监听端口开着,那仍是做个纪录,转头有空的时分清算一下,从头构造一下办事器。

6、CPU和内存

1

2

3

4

$free-m
$uptime
$top
$htop



注重以下成绩:


7、硬件

1

2

3

$lspci
$dmidecode
$ethtool



有良多办事器仍是***机形态,能够看一下:


8、IO功能

1

2

3

4

$iostat-kx2
$vmstat210
$mpstat210
$dstat--top-io--top-bio



这些下令关于调试后端功能十分有效。


9、挂载点和文件体系

1

2

3

4

5

6

7

$mount
$cat/etc/fstab
$vgs
$pvs
$lvs
$df-h
$lsof+D//*bewarenottokillyourbox*/





10、内核、中止和收集

1

2

3

4

5

$sysctl-a|grep...
$cat/proc/interrupts
$cat/proc/net/ip_conntrack/*maytakesometimeonbusyservers*/
$netstat
$ss-s




你还能够看一下LinuxTCPtuning懂得收集功能调优的一些要点。

11、体系日记和内核动静

1

2

3

4

$dmesg
$less/var/log/messages
$less/var/log/secure
$less/var/log/auth





12、准时义务

1

2

$ls/etc/cron*+cat
$foruserin$(cat/etc/passwd|cut-f1-d:);docrontab-l-u$user;done





十3、使用体系日记

这里边可剖析的器材就多了,不外生怕你作为运维职员是没工夫往细心研讨它的。存眷那些分明的成绩,好比在一个典范的LAMP(Linux+Apache+Mysql+Perl)使用情况里:


结论

经由这5分钟以后,你应当对以下情形对照分明了:


你乃至有大概找到真实的妨碍泉源。就算还没有找到,弄分明了下面这些情形以后,你如今也具有了深挖下往的前提。持续勉力吧!
小知识:CentOS并不是第一个提供商业支持的RHEL克隆版,其他企业例如Oracle也提供了基于RedHat的自己的企业Linux发布版。
作者: 海妖    时间: 2015-1-17 08:09
这也正是有别的OS得以存在的原因,每个系统都有其自身的优点。?
作者: 活着的死人    时间: 2015-1-22 18:45
学习Linux系统在服务中的配置方法及使用方法。Linux在服务器中应用相当广,应对常用的apache,samba,ftp等服务器基本配置清楚了解。[重点,应巩固学习]
作者: 因胸联盟    时间: 2015-1-31 14:25
永中office 2004增强版安装只需要默认安装即可使用并操作大多与win系统雷同,打印机的配置和管理,记录光盘等。
作者: 再现理想    时间: 2015-2-18 18:52
Linux的成功就在于用最少的资源最短的时间实现了所有功能,这也是符合人类进化的,相信以后节能问题会日益突出。
作者: 若天明    时间: 2015-3-6 10:28
可以说自己收获很大,基本上完成了老师布置的任务,对于拔高的题目没有去做,因为我了解我的水平,没有时间和精力去做。?
作者: 山那边是海    时间: 2015-3-13 00:30
可以说自己收获很大,基本上完成了老师布置的任务,对于拔高的题目没有去做,因为我了解我的水平,没有时间和精力去做。?
作者: 若相依    时间: 2015-3-20 08:32
我们自学,就这个循环的过程中,我们学习了基本操作,用vi,shell,模拟内存的分配过程等一些OS管理。




欢迎光临 仓酷云 (http://ckuyun.com/) Powered by Discuz! X3.2