2019.07.10

UnhealthyなAmazon WorkSpacesを探し出せ!

Amazon WorkSpacesへ接続できず、Unhealthyと応答されてことはありませんか?
Unhealthyの状態になる理由は様々ありますが、自分のデスクトップが立ち上がらず、業務ができずに困ってしまいますよね。
利用者から「業務に影響できるからなんとかして」と、管理者へ連絡が届くこともしばしば...。そこで、業務への影響を最小化するために、管理者で、Amazon WorkSpacesのUnhealthyステータスはないか確認して、Unhealthyを見つけたら、先に手を打つようなことができないか検討を始めました。

検討をはじめたきっかけ

Amazon WorkSpacesを運用していると、Cドライブの空き容量不足などの理由から、ステータスがUnhealthyの(異常状態となりつながらない)Amazon WorkSpacesが存在している時があります。当社では「Amazon WorkSpacesが使えない=業務ができない」状況となるため、管理者はいち早くUnhealty状態のAmazon WorkSpacesを見つけて復旧を行うことが求められます。

以前は利用者の申告があってから対応を行っていましたが、このやり方だと業務が停止してしまう時間が長くなってしまうことから、少しでも早く対応できないかと検討を始めました。
その結果、管理者が状態の把握を迅速に行うことができればよりスムーズに復旧対応できると考え、「UnhealthyのAmazon WorkSpacesを探し出せ」プログラムを開発しました。

AWS環境構成と処理内容

プログラムは、CloudWatchEventで定期的に実行されるLambdaから実行します。Describe WorkSpacesをコールして全Amazon WorkSpacesのステータスを取得し、State値をチェックします。N回連続でUnhealthyを検知した場合、SMSで管理者にメール通知を行います。

処置ダイアグラムを表した画像

実際にやってみて

UnhealthyのAmazon WorkSpacesを管理者がいち早く検知できるようになり、利用者からの申告前に対応の準備ができるようになり、業務への影響を最小限になるようなプロアクティブな運用が出来るようになってきています。

本来ならステータスがUnhealthyの場合は無条件にAmazon WorkSpacesを再起動するようにすれば良いと考えていましたが、Unhealthyを引き起こす理由の1つに「Windows Updateを実施中で応答しない場合」なども含まれます。Windows Updateの実施中に再起動すると、Amazon WorkSpacesが立ち上がってこなくなるなどのリスクもあることを鑑み、今回は無条件に再起動はしないで、Unhealthyステータスが長く続いた場合に通知するように留めました。

今後は、自動化をさらに進め、Windows Update対応の場合を除きステータスがUnhealthyの場合、自動的に再起動するような対応を組み込んでいこうと考えています。

関連サービス

おすすめ記事

導入のお問い合わせはこちら

AWSやAmazon WorkSpacesの導入から接続回線、運用・保守まで何でもお任せください。

お問い合わせ

TOPへ戻る