|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
如果您觉得本篇CentOSLinux教程讲得好,请记得点击右边漂浮的分享程序,把好文章分享给你的好朋友们!比来在review一些基本监控项,发明有局部基本的监控缺掉,好比diskusage,networkcard相干的监控。
由于呆板的设置分歧,不太好设置一个一致的模板,不外在新版本的zabbix中有个功效Low-leveldiscovery,能够依据主机的设置主动天生必要的监控,只必要传进宏变量便可。
好比监控每一个网卡的出流量net.if.out[{#IFNAME}],监控网卡的speedos.get[NetworkCardSpeed,{#IFNAME}]
有些情形下网卡会从1000M酿成100M,因而增加了相干的trigger:
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}<1000
这里有两个细节的成绩:
1)新版本的networkcardspeed的item是os.get[NetworkCardSpeed,***x],在网卡的speed为unknown时,其了局是0。
zabbix_get-s127.0.0.1-kos.get[NetworkCardSpeed,eth2]
0
为了扫除这类情形,变动trigger为以下划定规矩:
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}<1000&
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}#0
能够经由过程以下sql检察speed为100M的呆板:
select
distinct(a.host),c.ip,b.name,b.lastvaluefromhostsa,itemsb,
inte***cecwherea.hostid=c.hostidanda.hostid=b.hostidand
b.key_likeos.get[NetworkCardSpeed%andb.lastvalue=1000;
2)关于bonding
因为datanode的shuffle阶段必要大批的收集操纵,很简单呈现网卡瓶颈,因而datanode一样平常会做网卡的bonding,经常使用的形式是6,依据道理来看outgoing和incoming的流量大抵应当是不异的,但实践情形下看到,outgoing的流量通常为对照均匀,而incoming的流量相差很年夜,上面是一个sar的了局:
14时24分28秒IFACErxpck/stxpck/srxbyt/stxbyt/srxcmp/stxcmp/srxmcst/s
14时24分29秒eth06.9328139.60473.2741837599.010.000.006.93
14时24分29秒eth129448.5131732.671929669.3147286517.820.000.006.93
14时24分29秒bond029455.4559872.281930142.5789124116.830.000.0013.86
别的,假如一个网卡由1000M变成100M也不会呈现短板效应(之前一向觉得会呈现短板效应),而是依据speed的情形来做流量分发,speed年夜的流量年夜,speed小的流量小。
别的注重bonding设置中miimon参数的寄义,它是检测的server到switch的直连链路成绩,假如switch的下层链路出成绩是不会work的。互换机链路的ha就必要思索以太通道等手艺了。。
欢迎大家来到仓酷云论坛! |
|