ECS×EFS: 片方向SGでコンテナが起動しない事象の再現と解消

Jan 11, 2026· wan0ri· Category: Tech

TL;DR

EFS は各 AZ に「マウントターゲット（ENI ）」を持つ。
- 例: ap-northeast-1a/1c にそれぞれ固定プライベート IP を持つ ENI が存在。
ECS タスクは、配置された AZ に近い EFS マウントターゲットへ NFS で接続する。
- つまり、1a に居れば 1a の ENI、1c に居れば 1c の ENI へ向かうのが基本動作。
今回の原因は「コンテナ側 SG のアウトバウンドが片側の IP/CIDR のみ許可」だったこと。別 AZ の ENI への 2049/TCP がブロックされ、マウント失敗。
- デプロイ時に「許可されていない側の AZ/IP」への経路になり、NFS 接続不可 → タスク起動失敗。
対策は「SG のアウトバウンドに“抜けていた側のサブネット CIDR”を追加」し、両 AZ のマウントターゲット到達を許可。

概要

参画先で、ECS にデプロイしたコンテナが「EFS に接続できない」エラーで起動に失敗しました。
この記事では、

なぜ発生したのか
対策内容
自分の AWS アカウントでの再現と検証

をまとめ、個人環境で事象が実現可能な状態にします。

なぜ起きたのか？

EFS の構造

EFS はリージョン冗長だが、VPC 内では各 AZ に 1 つの「マウントターゲット（ENI）」を作成し、固定プライベート IP が割り当てられる。
クライアント（ECS タスク等）は通常、自分が動作する AZ のマウントターゲットに接続（最短経路・低レイテンシ）。

DNS の解決と接続先の選択

fs-XXXX.efs.ap-northeast-1.amazonaws.com のような EFS の DNS を引くと、同一 AZ の ENI の IP に解決される（同一 AZ 優先）。
したがって、タスクの配置 AZ によって接続先 IP が変わるのは正常挙動。

SG アウトバウンドの制約が“AZ またぎ”を阻害

送信側 SG のアウトバウンドを片側の CIDR（または IP）だけに絞ったため、別 AZ のマウントターゲット IP への 2049/TCP が拒否。
ECS は指定サブネット群のいずれかにタスクを起動するため、「許可していない側」に出たタスクのマウント処理が失敗した。

正しい設計／ベストプラクティス

1. SG は stateful を活かす

EFS 側 SG はインバウンド 2049/TCP の送信元に「ECS タスクの SG」を指定する。
ECS 側 SG はアウトバウンドを広めに（例: 0.0.0.0/0 の 2049/TCP）して、AZ/IP 変動に強くする。
片側 IP のピンポイント許可は避ける。

2. CIDR で絞るなら“両 AZ 分を必ず許可”

両方のサブネット CIDR をアウトバウンドに含め、どちら AZ でも到達可能にする。

3. EFS の SG は“参照ベース”で許可

EFS 側のインバウンドに「ソース SG（= ECS タスクの SG）」を指定し、IP/CIDR 管理を不要化。
送信側では SG 参照が使えないため、ECS 側 SG は適切に広げる。

4. NACL を過度に絞りすぎない

NACL を厳しくしすぎると、SG が正しくても通信は失敗する。VPC レイヤの整合性を取る。

5. タスク配置方針とネットワーク設計の整合

特定 AZ 固定は高可用性が下がる。HA を優先するなら AZ 横断で許可が成立する設計にする。

同様の事象が発生しやすい AWS サービス

「複数 AZ にエンドポイント（ENI/IP）があり、クライアントが同一 AZ を優先して接続する」タイプは同様のハマり方をしがち。片側 AZ や一部 IP のみ許可は危険。

Amazon EFS（今回）

各 AZ のマウントターゲット ENI に NFS(2049/TCP) で接続（AZ ごとに到達先 IP が異なる）。

Amazon RDS（特に Multi-AZ / フェイルオーバー）

クライアントは RDS のエンドポイント（DNS）へ接続するが、裏側 IP はフェイルオーバーや再配置で変わりうる。
特定 IP 固定は切替に弱いため、CIDR/SG 参照ベースが望ましい。

Network Load Balancer（NLB）/ Gateway Load Balancer（GWLB）

内部 NLB は各 AZ に ENI（IP）を持つ。AZ により指す IP が変わるため、特定 IP のみ許可だと接続不可に。

Interface 型 VPC Endpoint（PrivateLink）

各 AZ にエンドポイント ENI ができ、その IP へ接続。片側 AZ のみ許可だと別 AZ のタスクは到達不可になり得る。

Amazon OpenSearch Service / ElastiCache / Redshift など

クラスター/ノードごとに ENI/IP が存在し、AZ 配置で接続先が変わる/増える。IP 固定許可は運用負荷・切替リスクを高めるため、SG 参照や CIDR ベースが安全。

Application Load Balancer（ALB）

ALB は各 AZ にロードバランサーノードを持ち、IP が変動。ターゲット側は「ソースを ALB の SG 参照」で許可するのがベスト。IP 固定許可は非推奨。

実践的な再発防止策（チェックリスト）

1. EFS

EFS 側 SG: Inbound 2049/TCP Source = 「ECS タスクの SG」
ECS 側 SG: Outbound 2049/TCP Destination = 0.0.0.0/0（または両 AZ のサブネット CIDR）
NACL: 双方向で 2049/TCP を許可（過度に絞らない）

2. 共通原則

アウトバウンド宛先を「特定 IP 固定」にしない（AZ/フェイルオーバーに弱い）
SG の「SG 参照（ソース SG 指定）」を活用し、IP 管理をなくす
DNS 名の背後 IP は変わりうる前提で設計（RDS/ALB/NLB/VPC Endpoint 等）

3. 運用設計

新規 AZ 追加やサブネット増設に合わせて SG ルールの棚卸しを定期実施
監視（CloudWatch Logs / VPC Flow Logs）で拒否イベントを即検知
IaC（Terraform/CloudFormation）で SG 設定を標準化し、「片側のみ許可」の事故を防止

今回の止血対応は**「ECS タスクの SG に対し両サブネットを許可」**。
今後はエンドユーザーと設計方針をすり合わせる前提です。

自アカウントでの検証

同様の事象を自分の AWS アカウントで再現・改善しました。

検証リポジトリ：

github.com

github.com/wan0ri/ecs-validate

検証の詳細（issue 深掘り）

以下の issue に再現ログと時系列をまとめています：