Windows Server 2012

Windows Update後にWindows Server2012 R2が再起動を繰り返す不具合の対応

2015年4月14日

windows2012-reboot-trobule-sam

先日、弊社で行っていたWindows Storage Server 2012 R2 のセットアップ中にクリティカルな障害が発生しました。Windows update後にサーバーが起動しなくなるという、リスクの高い障害なので、調査した内容と対応について記載します。Windows Updateを適用したことが原因で、サーバーが起動しなくなるというのは、Windows NTや2000なら、良くあることの一つして、それ程、話題にはならないと思いますが、今回は最新のOSであるWindows Server 2012 R2で発生した問題だった為、トラブルシュートに時間が掛かりました。

まさか、この2015年にパッチが原因でOSが起動しなくなるということはないだろうと、高を括っていましたが、当方の認識の甘さを悔やむしかありません。同じ現象で、無駄な時間を浪費しないように、ナリッジとして、本問題の詳細を残しておくことにしました。同様の現象でお悩みの方は参考にしていただければ幸いです。

スポンサーリンク

1. 障害の内容

障害が発生するタイミングは、2012 R2インストール後にWindows Updateを実行した時。もう少し詳細に状況を調査・確認すると、Windows Updateの初回では発生せず、2回目の以降の実行で障害が発生するようです。
発生する問題はWindows Update実行後に、サーバが起動シーケンスで再起動を繰り返します。セーフモードでも同様で、再起動を繰り返してしまうため、一度発生すると修復が困難です。問題となったOSはStorage Server 2012 R2ですが、通常の2012 R2やWindows 8.1でも発生します。今回は、この障害について内容と対策を記載していきます。

1-1. 発生するタイミングの詳細

もう少し調査をしてみると、2回目の実行で適用される Windows Server2012 R2 Update (KB2919355) が引き金になっているようです。このパッチは累積的なパッチで、回避することが出来ず、適用が必須となります。
KB2919355を適用するまでは、再起動を行っても問題ありませんが、適用後に再起動を繰り返すようになります。
毎回、再起動を繰り返すわけではなく、5回に1回程度は正常に起動してくることもあります。

1-2. 障害の対象

以前から、Windows Server2012は何度かセットアップを行っていましたが、このような問題が発生することはなく起動に問題が無かったことから、全ての機器で発生する障害ではないようです。

2. 障害への対策

KB2919355は累積的なパッチであるため、適用が必須となり、適用しない場合、これ以降の修正パッチを適用することができません。
これ以降にも複数の修正パッチがリリースされており、なんとしても適用する必要があるので関連する情報をマイクロソフトのKBから探していたところ、以下のKBが見つかりました。

KB2966870 8.1 の Windows または Windows Server 2012 の R2 2919355 の更新プログラム ロールアップをインストールした後に再起動の問題を修正します。
https://support.microsoft.com/ja-jp/kb/2966870

本KBによると、Windows Server2012 R2 Update (KB2919355) を適用後に、一部のSASストレージコントローラーが起動するOSが再起動のループを繰り返してしまうとのこと。

2-1. 不具合の発生するストレージコントローラー

具体的には

  • Dell H200 PERC コントローラー
  • オンボードの SAS2004 ロックの LSI コントローラーの IBM x 240
  • LSI 2308 のオンボード コントローラー
  • 9211 4i の LSI コントローラー
  • 9211 8i を LSI コントローラー
  • LSI の SAS 9211
  • X10SL7 F の supermicro のマザーボード

といったコントローラーが合致してしまうようです。
回避するためには、上記のKB2966870からパッチをダウンロードして、KB2919355適用前にKB2966870を適用する必要があります。
既に再起動を繰り返しているサーバについては、回避策が二つ、マイクロソフトより提示されていますが、方法2はやや手順が複雑そうですので、方法1の「何度か再起動を行い、起動したタイミングでパッチを適用する」で復旧しない場合は、バックアップなどから
リストアするか、OSを再インストールしたほうが早そうな気がします。

2-2. 対応の詳細

本問題ですが、弊社ではHP storeeasy 1440/1540 の2台で確認しています。
HP storeeasyはWindows Storage Server2012 R2がセットアップ済みのNAS製品ですが、本現象が発生し、再起動を繰り返しリストアが必要となりました。
リストア後、KB2966870を適用し、KB2919355を適用する形にしたところ、本問題は回避できました。

スポンサーリンク

3. パッチ適用の問題

マイクロソフトのパッチで、このような問題が発生するのは久しぶりです。
WindowsNTや2000の時代には、パッチ適用に関する問題が多くあったように記憶しています。
Windows Server 2012で修正パッチによる不具合が起こるとは予想していませんでしたが、パッチ適用はリスクが伴うことを再認識しました。
セキュリティとのトレードオフですが、パッチは適用しておくことが安全な運用を行う前提となります。

エンジニアへのご相談

システムの新規導入や入れ替えに

記事をお読みいただいてシステムの新規導入や入れ替えを相談したい、また記事中のインストールや設定がうまくいかない場合のお問い合わせはフォームからご連絡下さい。レムシステムではオープンソースを含むシステムを導入した実績が豊富にあります。課題解決から導入、サポートまでレムシステムにお任せ下さい。

お問い合わせをいただいた先への営業活動などは行なっておりませんので、疑問点や不安な部分については、お気軽にお問い合わせください。

エンジニアへのご相談

  • この記事を書いた人
  • 最新記事

小村定

SIerでIT系インフラの設計と構築を経験したのちに独立、「レムシステム株式会社」を設立する。インフラ系エンジニア歴20年の経験を活かしてITに関わる課題解決や効率化に取り組む日々を送っている。

Copyright© レムシステム エンジニアブログ , 2019 All Rights Reserved.