问题描述:

    有一台server(称为A)作为memcache服务器开放了11211端口,但是另一台server(称为B)无法调用A的memcache,显示无法连接。

排查:

  1. 先在B上用telnet 尝试连接连接A的11211端口,超时。

  2. 换用另外的机器来telnet A 的11211端口,正常。

  3. 用B去telnet另一台机器的开放端口,也正常。

  4. 用B telnet A的其他端口,例如 22,也不正常。

  5. 用A telnet B的开放端口,也正常。

所以,看来问题成了只有B telnet A的时候有问题。

后来想到在A上抓包看看,分别用B telnet A 和 用另一台能telnet通A的机器telnet A,观察两者在A上抓包的结果,发现结果果然不一样

B telnet A 时:

其他机器telnet A时:

可以看到B的telnet请求已经到达了A,但是A没有像正常情况下给予B相应,所以B就会显示超时。

虽然知道了问题出在哪,可是还是没思路,最后怀疑到内核的网络相关配置,即   /etc/sysctl.conf 的先关配置,对比了一下B和其他机子的该文件,发现B的配置里少了几行配置

然后在B的/etc/sysctl.conf里加上了这些配置,sysctl -p使生效,再尝试telnet A,竟然成功了。

说了这么多,虽然问题解决了,但是以本人当前的技能水平,还是不能精确的知道是哪个配置项起到了关键的作用,故而还是有点小郁闷。

还得博学啊!