问题描述:
有一台server(称为A)作为memcache服务器开放了11211端口,但是另一台server(称为B)无法调用A的memcache,显示无法连接。
排查:
先在B上用telnet 尝试连接连接A的11211端口,超时。
换用另外的机器来telnet A 的11211端口,正常。
用B去telnet另一台机器的开放端口,也正常。
用B telnet A的其他端口,例如 22,也不正常。
用A telnet B的开放端口,也正常。
所以,看来问题成了只有B telnet A的时候有问题。
后来想到在A上抓包看看,分别用B telnet A 和 用另一台能telnet通A的机器telnet A,观察两者在A上抓包的结果,发现结果果然不一样
B telnet A 时:
其他机器telnet A时:
可以看到B的telnet请求已经到达了A,但是A没有像正常情况下给予B相应,所以B就会显示超时。
虽然知道了问题出在哪,可是还是没思路,最后怀疑到内核的网络相关配置,即 /etc/sysctl.conf 的先关配置,对比了一下B和其他机子的该文件,发现B的配置里少了几行配置
然后在B的/etc/sysctl.conf里加上了这些配置,sysctl -p使生效,再尝试telnet A,竟然成功了。
说了这么多,虽然问题解决了,但是以本人当前的技能水平,还是不能精确的知道是哪个配置项起到了关键的作用,故而还是有点小郁闷。
还得博学啊!