Posts Tagged ‘Ganglia monitor XML’

Ganglia的XML解析出错

November 18th, 2009

在使用Ganglia的过程中,发现偶尔会发生如下错误,大约每天几次,无规律可循。

Nov 13 10:01:48 labmonitor /usr/local/ganglia/sbin/

gmetad[24866]: Process XML (BJQA1): XML_ParseBuffer() error at line 1078: not well-formed (invalid token)
一旦出现这个错误,就会导致gmetad进程死掉,web程序不能再读取到相关xml数据,僵死在哪儿,当然图片也就不能正常生成,导致图片变的断断续续的,重启gmetad后可恢复。不知道是啥原因,问了官方maillist也没给出解决方案,于是自己搞了个Workaround办法。。。如下:
[root@labmonitor ~]# crontab -l
* * * * * /bin/sh /root/bin/gmetad_restart.sh >/dev/null 2>&1
[root@labmonitor ~]# cat /root/bin/gmetad_restart.sh
#!/bin/sh

if tail -1 /var/log/messages | grep ‘not well-formed’ ; then
/sbin/service gmetad restart
echo `date ` gmetad restart >> /var/log/messages
fi

临时解决了这个问题,继续期待官方的Solution!