Windows Serverコンテナのブレイクアウト方法とその対策

3 min read

概要

Windowsコンテナのリバースエンジニアリングに関する前回の投稿ではWindows Serverコンテナの内部実装について概説しました。Windows Serverコンテナについて詳しく調査した後、これらのコンテナ内でコードを実行することは、ホスト上で管理コードを実行するくらいに危険だと考える必要があることがわかりました。これらのコンテナはサンドボックス用に設計されておらず、簡単にエスケープできることが判明したからです。Microsoftは弊社と共同で調査にあたり、コンテナセキュリティの限界について完全に把握しました。この投稿の目的は、このコンテナの実行による危険性に対する認識を高めることにあります。

この問題を具体的に示すため、筆者が最近発見したWindowsコンテナにおけるコンテナエスケープ方法を提示します。この方法を使うと、コンテナ内部で実行されているプロセスからホストにファイルを書き込むことができるようになります。この方法はホスト上でRCE(リモートコード実行)を実現する目的で利用されうります。Kubernetes環境では、このエクスプロイトを利用して簡単にノード間の拡散が行われます。言い換えれば、Windows Serverコンテナ内部で実行される単一のアプリケーションインスタンスの侵害に成功した攻撃者は、コンテナの境界を難なく突き破り、同じマシン上の他のアプリケーションにアクセスできるというわけです。Kubernetesの場合、攻撃者は他のマシンにもアクセスできる可能性があります。つまり、たった1つのエンドポイントインスタンスを突破した攻撃者が、本番環境のワークロード全体にアクセスできてしまうということです。

この問題は、Windows Serverコンテナの使用を許可しているクラウドプロバイダのユーザーに影響すると考えられ、そこにはWindowsを使用するMicrosoft AKS (Azure Kubernetes Service) のすべてのユーザーが含まれます。パロアルトネットワークスのお客様は、Prisma™ Cloudによってこの脅威から保護されます。

Windows Serverコンテナ

前回の投稿で詳しくお伝えしたように、MicrosoftはWindowsベースのコンテナを実行するために2つのソリューションを開発しました。1つ目のソリューションは、Hyper-Vテクノロジに基づいて各コンテナを仮想マシン(VM)の内側で実行するものです。2つ目のオプションはWindows Serverコンテナで、サイロオブジェクトなどのWindowsカーネル機能を信頼してコンテナを設定するものです。後者のソリューションは、従来のLinuxのコンテナ実装と似ています。つまり、相互を隔離する論理メカニズムによって同じカーネル上で実行されるプロセスです。

一部のユーザーはHyper-VコンテナではなくWindows Serverコンテナを利用しています。そうする理由は、1つのVM内部で各コンテナを実行するとパフォーマンス上のコストがかかるためです。Microsoftもこれについて次のようにドキュメントに記載しています。

The additional isolation provided by Hyper-V containers is achieved in large part by a Hypver-Visor layer of isolation between the container and the container host. This affects container density as, unlike Windows Server Containers, less sharing of system files and binaries can occur, resulting in an overall larger storage and memory footprint. In addition there is the expected additional overhead in some network, storage io, and CPU paths.

HYPER-V コンテナーによって提供される追加の分離は、主にコンテナーとコンテナーホストの間の分離のハイパーバイザーレイヤーによって実現されます。これは、Windows Server コンテナーとは異なり、システムファイルとバイナリの共有が少なくなる可能性があるため、コンテナー密度に影響し、ストレージとメモリの使用量が全体的に大きくなります。さらに、一部のネットワーク、ストレージ IO、 CPU のパスでは、追加のオーバーヘッドが予想されます。※ 出典 https://docs.microsoft.com/ja-jp/windows-server/administration/performance-tuning/role/windows-server-container/

調査を進めるなかで筆者は「Windows Serverコンテナのセキュリティについてはもっとうまくドキュメント化できるはずだ」と考えました。Hyper-Vコンテナを使用する方が安全であることを示す参考資料はありますが、Windowsコンテナがブレイクアウトに陥りやすいことを明確に示したドキュメントの記述は見つけられませんでした。そこでMicrosoftに問い合わせたところ、同社のガイダンスでは、ホスト上で管理者として実行したくないものはWindows Serverコンテナ上で実行しないようユーザーに推奨していました。また同社は次のようにも指摘していました。

Windows Server Containers are meant for enterprise multi-tenancy. They provide a high degree of isolation between workloads, but are not meant to protect against hostile workloads. Hyper-V containers are our solution for hostile multi-tenancy.

Windows Serverコンテナはエンタープライズマルチテナンシーでの利用が想定されています。ワークロード間で高度な隔離を実現しますが、敵対的なワークロードに対する防御は想定されていません。敵対的なマルチテナンシーに対する当社のソリューションはHyper-Vコンテナとなります。

そこで以下のセクションでは、Windowsシンボリックリンクのカーネルインターナルなど、この問題の詳細について説明します。なお、以前の投稿で説明したサイロなどのWindowsコンテナインターナルの一部の知識があれば、ここで提示する手法が理解しやすいでしょう。

コンテナエスケープ

コンテナ内部からWindowsシンボリックリンクを解決するには、説明している文書のないフラグを使用します。このフラグでシンボリックリンクをホストマシンのルートディレクトリに解決するとうい行為は、要するにコンテナのファイルシステムの外側にアクセスするという行為です。このフラグをコンテナプロセスで有効にするには特別な権限が必要ですが、筆者は、デフォルトのコンテナプロセスからこの権限を昇格させる方法を見つけました。これがコンテナエスケープにつながる可能性があります。

以下のセクションでは、筆者がその方法を発見したいきさつを振り返り、なぜエスケープが可能になるのかについて詳細に説明します。

シンボリックリンク

Windowsのシンボリックリンクについてきちんと説明したドキュメントは多くはありませんがWindows NT以降は多少存在します。まずWindows NTが「オブジェクトマネージャーシンボリックリンク」、「レジストリキーシンボリックリンク」という2種類のシンボリックリンクとともに登場しました。ただしこれらはファイル関連のシンボリックリンクではなく、Microsoftがオペレーティングシステムの内部をたまたまそのように実装することにした、というにすぎませんでした。Windows 2000になってようやくファイルシステムシンボリックリンクが登場しましたが、それもファイルレベルのシンボリックリンクではなく、ディレクトリリダイレクトとしてのみ機能するものでした。完全にファイルレベルのシンボリックリンクが登場したのはWindows Vistaが初めてでした。

本稿では、オブジェクトマネージャーシンボリックリンクのみを取り上げます。他のものは範疇外ととなりますので本稿では割愛します。

オブジェクトマネージャーシンボリックリンク

Windowsを使用していれば、気付かないうちに使用しているのがこのシンボリックリンクでしょう。Cドライブ文字などのようなものは、実はオブジェクトマネージャーシンボリックリンクを使用して実装されています。中身を見てみると、誰かがC:\にアクセスすると、オブジェクトマネージャーがその呼び出しを実際にマウントされているデバイスにリダイレクトします。

図1: C:が単なるシンボリックリンクであることを示すWinObj。C:はシンボリックリンクのリストに含まれている — 図1: C:が単なるシンボリックリンクであることを示すWinObj

オブジェクトマネージャーはファイルだけでなく、レジストリやセマフォをはじめとする多くの名前付きオブジェクトも処理します。ユーザーがC:\secret.txtにアクセスしようとすると、その呼び出しは\??\C:\secret.txtというパスを使用してカーネル関数NtCreateFileに到達します。このパスは、カーネルが操作方法を認知しているNTパスです。実際のシステムコールが実行される前に、ユーザーモードのWindows APIによってこのパスが変換されます。このパス変換が行われる理由は\??\部分にあります。これが、ルートディレクトリマネージャーでカーネルを正しいディレクトリに向かわせます。たとえば、ディレクトリはC:シンボリックリンクのターゲットを保持します。

最終的には、ObpLookupObjectNameが呼び出されます。ObpLookupObjectNameの仕事は、名前から実際のオブジェクトに解決することです。この関数は別のカーネル関数ObpParseSymbolicLinkExを使用して、そのターゲットへのシンボリックリンクとなるパス部分を解析します。

パスのすべての部分がシンボリックリンクになるかどうかチェックされます。このチェックはObpParseSymbolicLinkExによって実行されます。オブジェクトマネージャーはリーフノード(末端のノード)が見つかるまでこの処理を繰り返します。リーフノードとは、オブジェクトマネージャーではそれ以上解析できなくなったものを指します。パスの一部がシンボリックリンクである場合、この関数はSTATUS_REPARSEまたはSTATUS_REPARSE_OBJECTを返し、パスの関連部分をシンボリックリンクのターゲットに変更します。

ルートディレクトリオブジェクトの詳細

オブジェクトマネージャーのルートディレクトリオブジェクトは、すべてのアプリケーション可視性のある名前付きオブジェクト(ファイルやレジストリキーなど)を含むフォルダのようなものです。このメカニズムにより、アプリケーションはそれぞれの間でこれらのオブジェクトを作成したりアクセスしたりできます。

重要な部分

コンテナ内部からファイルにアクセスするときには、カスタムルートディレクトリオブジェクトの下ですべてが解析されます。C:が解析される場合には、クローンのC:シンボリックリンクに対して解析されます。このためホストのファイルシステムではなく、仮想マウントされたデバイスを指すことになります。

シンボリックリンクとコンテナ

筆者は、コンテナ内部からシンボリックリンクのルックアッププロセスを追うことにしました。コンテナ内部のプロセスが、C:\secret.txtというターゲットファイルを使用してCreateFileを呼び出します。先に説明したように、このパスはカーネルに到着する前に\??\C:\secret.txtに変換されます。コンテナのカスタムルートディレクトリオブジェクトの下で、システムは??にアクセスします。これはGLOBAL??を参照するものです。システムはGLOBAL??ディレクトリの下でシンボリックリンクC:を検索し、実際にそうしたシンボリックリンクを見つけます。この時点で、このパスは上記のシンボリックリンクのターゲットに解析されます。この場合は\Device\VhdHardDisk{a36fab63-7f29-4e03-897e-62a6f003674f}\secret.txtです。次にカーネルが当該のVhdHardDisk{…}デバイスを開くわけですが、ホストのルートディレクトリオブジェクト内のDeviceフォルダの下でこのデバイスを検索するのではなく、コンテナのカスタムルートディレクトリオブジェクトの下でこのデバイスを検索し、コンテナのファイルシステムの仮想デバイスを見つけます。

しかし何か間違っています。\Silos\1588\の下でDeviceを参照したときに、筆者は実際のデバイスを指すVhdHardDisk{…}という名前のオブジェクトが見つかることを期待していましたが、見つかったのは\Device\VhdHardDisk{…}を指す同じ名前のシンボリックリンクでした。何が起こったのでしょうか。どうすればWindowsは実際のデバイスに到達するのでしょうか。この時点で筆者は、シンボリックリンクルックアップサブジェクトの調査を開始し、セキュリティ研究者のAlex Ionescu (CrowdStrike)とJames Forshaw (Google Project Zero)がRecon 2018で述べた「グローバル」シンボリックリンクを示すフラグの存在を、彼らのスライドのある1行に見つけました。さらに、このフラグがチェックされる場所を見つけるため、関連する関数をさかのぼって確認していきました。

最終的にObpLookupObjectName内で有望そうな分岐を見つけました。

レジスタediはObpParseSymbolicLinkExの戻り値を保持するので、筆者はこの値である368hを検索し、これがSTATUS_REPARSE_GLOBALを表していることをつきとめました。つまり、ObpParseSymbolicLinkExがSTATUS_REPARSE_GLOBALを返すと、オブジェクトマネージャーはサイロのルートディレクトリには向かわず、通常のルートディレクトリオブジェクトであるObpRootDirectoryObjectの下のファイルをオープンするのです。

問題点

この時点で、筆者はこの動作を理解したと確信しました。グローバルシンボリックリンクを作成するには、システムプロセスのみが持つ何らかの特別な権限が必要なのだと考えました。コンテナの作成時に、作成プロセスはこれらの特別な権限を持っているので、コンテナが使用するためのグローバルシンボリックリンクを作成できるものの、コンテナ内部のプロセスはこれを実行できません。この作成プロセスはグローバルシンボリックリンクのポイント先を制御し、それはVhdHardDiskのような一部の特別なデバイスにアクセスするためだけに使用されるので、実際には問題が発生しないのです。ところが、これは部分的にしか正しくないことがわかりました。

本当の問題

筆者は、カーネルコードでSTATUS_REPARSE_GLOBALを表す368hという値を検索し始めました。IDAおよびWinDbgを少し操作した後、最終的に筆者は関数ObpParseSymbolicLinkExに行き着き、それによって、シンボリックリンクオブジェクト内の関連フラグがオフセット28h (Object + 0x28)にあることを見つけました。筆者は、新しいシンボリックリンクを作成する関数であるNtCreateSymbolicLinkObjectにブレークポイントを設置し、次にDockerを使用して新しいコンテナを作成しました。これによって、コンテナに新しいシンボリックリンクを作成するたびに、多くのブレークが発生するようになりました。これにより実際に\Silos\1588\Device\VhdHardDisk{a36fab63-7f29-4e03-897e-62a6f003674f}オブジェクトを作成することができました。

注意: これは、グローバルシンボリックリンクのように振る舞うシンボリックリンクオブジェクトでした。最終的には、シンボリックリンクオブジェクト上のアクセスブレークポイントはオフセット28hに設置されました。成功です! シンボリックリンクの作成後すぐに、筆者がブレークポイントを設置した場所で別の関数がメモリを変更しようとしました。それはNtSetInformationSymbolicLinkという関数でした。この関数はシンボリックリンクを処理して、関連オブジェクトを開き、内部の要素を変更しているようでした。

幸運にも、これはntdll内で同じ名前のラッパー関数も取得していたため、ユーザーモードから簡単に呼び出すことができました。筆者はこの関数のリバースエンジニアリング(コード分析)を行い、その中でTcb権限をチェックするコード部分を見つけました。TcbはTrusted Computing Baseのことで、その権限説明は「オペレーティングシステムの一部として機能する」となっています。

筆者は、どういう条件下でSTATUS_REPARSE_GLOBALが返されるのかと、シンボリックリンクをグローバルに変更するためにNtSetInformationSymbolicLinkが必要とする正確なパラメータを把握できるところまで、ObpParseSymbolicLinkExをさかのぼりました。攻撃者がエクスプロイトを作成しにくくなるように、この投稿ではこれらのパラメータをあえて省略します。

エクスプロイトプラン

Tcb権限によってこのグローバルフラグを有効にできる可能性と、それによるコンテナエスケープの可能性がわかったところで、コンテナのファイルシステムをエスケープするために次のようなプランを考えてみました。

ホストのC:ドライブに対するシンボリックリンクを作成します。
Tcb権限を取得します。
上記のシンボリックリンクをグローバルにします。
ホストのファイルシステム上のファイルにアクセスします。

唯一このプランに欠けているのがステップ2の実行方法です。そう、コンテナ内にはTcb権限がないのです。つまり、筆者のコンテナプロセスはデフォルトではTcb権限を持っていません。ただし、WindowsコンテナにはCExecSvcという名前の特殊なプロセスがあります。このプロセスは、ホストとコンテナ間の通信をはじめとするコンテナ実行の多くの側面を担っているものです。これはTcb権限も持っているので、CExecSvcを介してコンテナプロセスがコードを実行できれば、それはTcb権限による実行ということになり、上記プランの展開が可能になります。

図5: CExecSvcがSeTcbPrivilegeを持つことを示すProcessHacker

実行

筆者はCExecSvcに対してシンプルなDLLインジェクションを行うことにしました。これは攻撃ロジックに含まれているものです。これはうまく機能して、筆者はすぐにホストのファイルシステムへのアクセス権を得ることができました。CExecSvcはシステムプロセスなので、他のシステムプロセスが持つのとまったく同じように、ホストファイルシステム全体への完全な無制限のアクセス権を得たのです。

Azure Kubernetes Service (AKS)

Azure Kubernetes Service (AKS)はマネージドコンテナオーケストレーションサービスで、オープンソースのKubernetesシステムに基づいており、Microsoft Azure Public Cloudで使用可能です。AKSを使用すると、Dockerコンテナやコンテナベースのアプリケーションを、コンテナホストのクラスタ全体にデプロイし、スケーリングして管理できるようになります。

AKSはポッドごとにWindows Serverコンテナを使用しているので、Windowsノードを持つKubernetesクラスタの1つ1つがこのエスケープに対して脆弱であると言えます。

それだけでなく、攻撃者がWindowsノードのいずれかへのアクセス権を得てしまえば、残りのクラスタへの拡散は容易です。

次の画像は、残りのクラスタを制御するために必要なものすべてを含むWindowsノードを示しています。ここに表示されているのは、コンテナ(この場合にはポッド)からホスト(この場合はノード)へのアクセスを何とか行った後の状況です。

表示されたWindowsノードには、攻撃者が残りのKubernetesクラスタを制御するために必要なすべてのものが含まれています。 — 図6: Windowsノード内部で必要なものすべて

ここからは、kubectlを使用するだけで残りのクラスタを制御できます。

結論

本稿では、権限を昇格してWindows Serverコンテナをエスケープするための方法をひととおり俯瞰してきました。ユーザーは、セキュリティ境界をコンテナ化に依存するような内容についてはWindows ServerコンテナのかわりにHyper-Vコンテナの使用を推奨するMicrosoftのガイダンスに従う必要があります。Windows Serverコンテナで実行されるプロセスはどれも、ホスト上の管理者と同じ権限を備えていると想定しておく必要があります。セキュリティ保護の必要なアプリケーションをWindows Serverコンテナで実行するのであれば、Hyper-Vコンテナに移動させることをお勧めします。

この調査にあたって貴重なアドバイスをくださったAlex Ionescu氏とJames Forshaw氏に感謝します。ありがとうございました。

パロアルトネットワークスのPrisma™ Cloudは、お客様のコンテナを侵害から守ります。Prisma Cloudコンピューティングは、ユーザーが既知の署名済みイメージのみを実行するように制限できるTrusted Imagesという名前のコンプライアンス機能も提供しています。この機能を使用することで、悪意のあるイメージの実行が阻止され、お客様は攻撃対象領域をさらに縮小することができます。

Windows Serverコンテナのブレイクアウト方法とその対策

概要

Windows Serverコンテナ

コンテナエスケープ