
— この記事はAWS公式からの情報をChatGPTで読みやすく生成しました。 —
詳細はこちらから

📡 AWS障害発生自動検知ツール
AWSの障害発生を自動検知し、メール・Slackへ通知する軽量モニタリングツールを開発しました。▼ 配布サイト🔗障害発生時に画像のようなメールを受信しますここでは、基本情報や設定方法などについて紹介します。バージョン更新記録バージョン更新日...
障害概要
AWSの米国(バージニア北部)リージョンにおいて、複数のサービスに影響を及ぼす障害が発生しています。
影響範囲
- サービス:EC2、RDS、ECS、Glue、Lambdaなど
- リージョン:米国(バージニア北部)(コード: us-east-1)
現在の対応状況
AWSでは、us-east-1リージョンにおける新規EC2インスタンスの起動を完全に復旧するための対応を続けています。特定のアベイラビリティゾーン(AZ)を指定しないEC2インスタンスの起動を推奨しており、これによりEC2は適切なAZを選択する柔軟性を持つことが可能です。このEC2の障害は、RDS、ECS、Glueなどのサービスにも影響を及ぼしています。また、Auto Scaling Groupsが複数のAZを使用するように設定することも推奨されており、これによりAuto ScalingがEC2インスタンスの起動を自動で管理できるようになります。
さらに、AWSはSQSのイベントソースマッピングにおけるLambdaのポーリング遅延を回復するための追加の緩和策を進めています。LambdaのSQSポーリング機能に依存するAWSの機能、例えば組織のポリシー更新なども処理時間が延びています。次の更新は日本時間で午後9時30分に提供される予定です。
コメント