Indirect Prompt Injectionが実攻撃で観測、AIエージェントが金銭詐欺・破壊指示の踏み台に

2026年4月27日

登場人物紹介

チップス
どんぐり大学卒、一般企業の情報システム部で働く若手エンジニア。
入社1〜3年目らしい悩みを抱えつつ、日々の運用やセキュリティ対応に奮闘中。慌てんぼうだが素直で吸収力が高く、ボスに鍛えられながら着実に成長している。

ボス
セキュリティ、インフラ、運用の修羅場をくぐってきた歴戦のエンジニア。サイバーセキュリティラボの所長でボスと呼ばれている。
現場視点と経営視点の両方から、本当に使えるセキュリティとキャリア戦略を叩き込む。口は悪いが面倒見はよく、若手育成と実践的な情報発信に力を注いでいる。

「ウェブページに隠した命令で、本当にAIエージェントを操れるの？」
「うちのCopilotやClaude利用、無防備のままでは？」

チップス

ボス、AIエージェントが勝手にAPIキーを漏らしたって本当でしゅか…？

ボス

うむ、Indirect Prompt Injectionが研究と実害の両面で確認されている。
権限の大きいエージェントほど、被害がそのまま事業リスクになる構図だ。

Help Net SecurityやSecurityWeekは2026年4月にかけて、Indirect Prompt Injection（IPI）の実攻撃事例を相次いで報じています。
本記事では仕組み、観測されている被害、企業が取るべき対策を整理します。

ウェブやコメントに仕込んだ命令でAIエージェントを乗っ取る攻撃が実環境で観測
支払い処理・APIキー窃取・ファイル削除など現実の被害につながる指示が確認
Claude Code・Gemini CLI・GitHub Copilot Agentに影響、ベンダー側はパッチ済み

AIエージェントは「賢い社員」ではなく、与えられた文字列をすべて命令として読む特性があります。
業務利用が広がる前にこの記事で攻撃面を理解しておきましょう。

オススメ案件

新着案件をもっと見る

Indirect Prompt Injectionの実攻撃が顕在化

研究室のPoCに留まらず、実際のサービス利用シナリオで悪意ある指示が機能した点が決定的な変化です。

どんな指示が動いてしまったのか

Help Net Securityが紹介したGoogleとForcepointの調査では、AIエージェントが処理したウェブコンテンツから次のような指示が実行されました。
いずれも金銭・データ・システムの損失に直結する内容です。

カテゴリ	確認された具体例
金銭詐欺	PayPalの送金手順、Stripe経由の偽寄付ページ誘導
SEO・トラフィック操作	検索エンジン挙動の改ざんと誘導
機密窃取	APIキーや資格情報の抽出指示
破壊行為	ユーザー端末のファイル全削除を試行

主要AIエージェントが軒並み影響を受けた

SecurityWeekによると、研究者がGitHubのPRタイトルに細工した命令を埋め込んだだけで、Anthropic Claude Code Security Review、Google Gemini CLI、GitHub Copilot Agentが自身のAPIキーをコメントとして投稿する事象が再現されました。
Anthropicは内部的にCVSS 9.4 Critical相当と評価しています。