-- 追記(8/27)
やっぱ直ってなかった。
症状
- sshしてると10秒~5分の間で、なんかセッションが切断される。
- 切断された時は、新しくsshのセッションを開こうとしても接続に失敗する。
- winscpを使っている分には、切断を挟んでいても気付かない。
- サーバ側のログにはクライアントがタイムアウトしたと出ている。
- クライアント側では、「Network Error: Software caused connection abort」とログが出る。
(↑このエラーは、Windowsが吐く一般的なNWエラーらしく、あんまり手掛かりにならなさそう?)
参照:10.14 ‘Network error: Software caused connection abort’ - ブログアクセスなど負荷のかかる動作をさせると高確率で切れる。
やったこと
直感的に、ログ出力の変更とか関係ない気もするが、不思議とmysqlのログを追加することでblogアクセスによる切断が生じなくなったので、因果はともかくとしてメモっておく。
- とにかく/var/logに出ているエラーを消す。
- bind9のv6を動作させなくする。
/etc/bind/named.conf.options
にlisten-on-v6 {none;};
では不十分で、/etc/default/bind9
を書き換え。- OPTIONS="-u bind" + OPTIONS="-u bind -4"
- sambaのprinter_cups関連の設定を無効化。
+ load printers = no + printing = bsd + printcap name = /dev/null
どれが欠けてもエラーは継続。
- bind9のv6を動作させなくする。
- sshまわりの設定修正
- sshdの設定を多少変更 (ClientAliveInterval を少し伸ばした)
- sshクライアントからkeepaliveを発出
- ログを単独出力
- SyslogFacility AUTH + SyslogFacility LOCAL5
- auth,authpriv.*;(hogehoge) /var/log/auth.log + auth,authpriv.*;(hogehoge);local5.* /var/log/auth.log + local5.* /var/log/sshd.log
- slowlog の出力
-- 追記ここまで
自宅の debian マシンのネットワーク接続が、突然不安定になった。
syslog や、他のログを見ていても原因はよく分からなかったが、dmesg などで NIC の firmware が見付からないというエラーが出ていた。
r8169 0000:03:00.0: firmware: agent aborted loading rtl_nic/rtl8168e-2.fw (not found?)
みたいな感じ。
ファームウェアの名前からベンダを調べて、上記の場合は Realtek なので、
# aptitude search firmware # ← firmware のパッケージを探す # aptitude install firmware-realtek
と単純に実行するだけで、なんとなく解決したっぽいので良しとする。