BlueOnyx-5108r で運用中のサーバが7月に入って急に下記ログを吐くようになった。
OSがCentOS 6.2ベースなので、共通項目かも。
[root@XXXXXXXX /]# tail -1000000 /var/log/messages|grep BUG
Jul 1 09:04:39 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 247s! [ksoftirqd/0:4]
Jul 1 09:07:38 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 148s! [ksoftirqd/0:4]
Jul 1 09:15:02 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 86s! [ksoftirqd/0:4]
Jul 1 09:20:27 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 119s! [ksoftirqd/0:4]
Jul 1 09:21:10 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 183s! [ksoftirqd/0:4]
Jul 1 09:25:04 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 85s! [ksoftirqd/0:4]
Jul 1 09:27:09 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 132s! [ksoftirqd/0:4]
Jul 1 09:30:06 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 86s! [ksoftirqd/0:4]
Jul 1 09:33:01 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 89s! [ksoftirqd/0:4]
Jul 1 09:40:24 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 153s! [ksoftirqd/0:4]
Jul 1 09:45:05 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 261s! [ksoftirqd/0:4]
Jul 1 09:48:57 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 175s! [ksoftirqd/0:4]
Jul 1 09:55:03 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 184s! [ksoftirqd/0:4]
Jul 1 09:56:43 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 158s! [ksoftirqd/0:4]
Jul 1 09:56:57 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 93s! [ksoftirqd/0:4]
Jul 1 10:03:05 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 175s! [ksoftirqd/0:4]
Jul 1 10:13:06 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 91s! [ksoftirqd/0:4]
Jul 1 10:17:28 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 171s! [ksoftirqd/0:4]
Jul 1 10:20:04 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 244s! [ksoftirqd/0:4]
Jul 1 10:20:24 XXXXXXXX kernel: BUG: soft lockup - CPU#0 stuck for 145s! [ksoftirqd/0:4]
とくにシステムが落ちるとかそういった不具合は出ていないようです。
一瞬、うるう秒の問題か?っとも思ったのですが。
ググってみたが、特に有力な情報は今のところ得られていないが、ソフト割り込みにかかわるもののようです。
とりあえず、
[root@XXXXXXXX /]# uname -a
Linux XXXXXXXX.kinet.ne.jp 2.6.32-220.7.1.el6.x86_64 #1 SMP Wed Mar 7 00:52:02 GMT 2012 x86_64 x86_64 x86_64 GNU/Linux
なのですが、カーネルのアップデートが出ていたようなので、アップデートしてみることにした。
が、アップデートして確認してみると、
[root@XXXXXXXX ~]# uname -a
Linux XXXXXXXX.kinet.ne.jp 2.6.32-220.7.1.el6.x86_64 #1 SMP Wed Mar 7 00:52:02 GMT 2012 x86_64 x86_64 x86_64 GNU/Linux
変わってねーwww
あれ、たしかアップデートが入っていたような気がしたのですが(笑)。
他がアップデートされたので、様子を見てみます(笑)。