在使用Ganglia的过程中,发现偶尔会发生如下错误,大约每天几次,无规律可循。
Nov 13 10:01:48 labmonitor /usr/local/ganglia/sbin/
gmetad[24866]: Process XML (BJQA1): XML_ParseBuffer() error at line 1078: not well-formed (invalid token)
一旦出现这个错误,就会导致gmetad进程死掉,web程序不能再读取到相关xml数据,僵死在哪儿,当然图片也就不能正常生成,导致图片变的断断续续的,重启gmetad后可恢复。不知道是啥原因,问了官方maillist也没给出解决方案,于是自己搞了个Workaround办法。。。如下:
[root@labmonitor ~]# crontab -l
* * * * * /bin/sh /root/bin/gmetad_restart.sh >/dev/null 2>&1
[root@labmonitor ~]# cat /root/bin/gmetad_restart.sh
#!/bin/sh
* * * * * /bin/sh /root/bin/gmetad_restart.sh >/dev/null 2>&1
[root@labmonitor ~]# cat /root/bin/gmetad_restart.sh
#!/bin/sh
if tail -1 /var/log/messages | grep ‘not well-formed’ ; then
/sbin/service gmetad restart
echo `date ` gmetad restart >> /var/log/messages
fi
临时解决了这个问题,继续期待官方的Solution!
这是标准的M$ 服务不稳定处置哪!
应该想办法先对非良构的XML 进行处理哪..
不然,数据丢失…
是的,我已在官方maillist询问,但是作者没有给出明确答复,等待3.1.5release中。。。。
我又来支持博主了。呵呵。