Indirect Prompt Injectionが実攻撃で観測、AIエージェントが金銭詐欺・破壊指示の踏み台に

登場人物紹介

チップス
どんぐり大学卒、一般企業の情報システム部で働く若手エンジニア。
入社1〜3年目らしい悩みを抱えつつ、日々の運用やセキュリティ対応に奮闘中。慌てんぼうだが素直で吸収力が高く、ボスに鍛えられながら着実に成長している。

ボス
セキュリティ、インフラ、運用の修羅場をくぐってきた歴戦のエンジニア。サイバーセキュリティラボの所長でボスと呼ばれている。
現場視点と経営視点の両方から、本当に使えるセキュリティとキャリア戦略を叩き込む。口は悪いが面倒見はよく、若手育成と実践的な情報発信に力を注いでいる。

「ウェブページに隠した命令で、本当にAIエージェントを操れるの?」
「うちのCopilotやClaude利用、無防備のままでは?」

チップス

ボス、AIエージェントが勝手にAPIキーを漏らしたって本当でしゅか…?

ボス

うむ、Indirect Prompt Injectionが研究と実害の両面で確認されている。
権限の大きいエージェントほど、被害がそのまま事業リスクになる構図だ。

Help Net SecurityやSecurityWeekは2026年4月にかけて、Indirect Prompt Injection(IPI)の実攻撃事例を相次いで報じています。
本記事では仕組み、観測されている被害、企業が取るべき対策を整理します。

  • ウェブやコメントに仕込んだ命令でAIエージェントを乗っ取る攻撃が実環境で観測
  • 支払い処理・APIキー窃取・ファイル削除など現実の被害につながる指示が確認
  • Claude Code・Gemini CLI・GitHub Copilot Agentに影響、ベンダー側はパッチ済み

AIエージェントは「賢い社員」ではなく、与えられた文字列をすべて命令として読む特性があります。
業務利用が広がる前にこの記事で攻撃面を理解しておきましょう。

オススメ案件

【M365・セキュリティ運用およびテクニカルサポート支援】飯田橋(リモート併用)/Entra ID・Intune・Defender

月額単価
700,000円 / 月
稼働場所
東京都リモート併用
業務領域
運用・保守
作業内容:
1,000名規模の製造業顧客に対し、Microsoft 365を中心とした...

【企業内アプリ開発のゼロトラスト環境整備・運用】麹町(月1回出社)/AWS・Terraform・セキュリティツール

月額単価
1,150,000円 / 月
稼働場所
東京都リモート併用
業務領域
構築, 運用・保守
作業内容:
企業内製アプリの開発環境におけるゼロトラスト化を推進し、S...

【決済端末ソフトウェア開発(PCI DSS対応エンジニア)】フルリモート/PCI DSS・決済システム

月額単価
1,500,000円 / 月
稼働場所
フルリモート
業務領域
要件定義, 設計
作業内容:
大手アミューズメント企業の決済基盤を支える、極めて重要度...

【既存システムのISMAP対応】東京・汐留(リモート併用)/Gap分析・監査対応支援

月額単価
1,000,000円 / 月
稼働場所
東京都リモート併用
業務領域
PMO
作業内容:
既存顧客におけるシステムのISMAP対応支援をご担当いただきま...

【開発グループ向けインフラ構築・セキュリティ強化】東京都/Trellix(旧 McAfee)・リモート併用

月額単価
800,000円 / 月
稼働場所
東京都リモート併用
業務領域
構築, 運用・保守
作業内容:
開発グループを対象とした、Trellix(旧 McAfee)を中心とす...

【CSIRT/SOC体制構築支援】東京・新高島/大手造船業・運用プロセス策定

月額単価
900,000円 / 月
稼働場所
東京都オンサイト(リモート相談可)
業務領域
PMO
作業内容:
大手造船業にて、CSIRT/SOCの体制構築に向けた支援業務をご担...

【メガバンク向けSASE導入支援】東京・中野(リモート併用)/Zscalerトラブルシューティング・テックリード

月額単価
1,200,000円 / 月
稼働場所
東京都リモート併用
業務領域
構築, 運用・保守
作業内容:
Zscaler導入における移行フェーズにて、課題解決及び早期安定...

【金融機関向けAVD・Zscaler導入】フルリモート/アーキテクチャ策定・上流設計支援

月額単価
1,300,000円 / 月
稼働場所
フルリモート
業務領域
要件定義
作業内容:
既存Zscaler環境へAVDを新規導入するプロジェクトの立ち上げ...

【認証基盤統合プロジェクト】東京・八王子(リモート併用)/Entra ID・SSO統合・稼働50%~

月額単価
1,000,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築
作業内容:
認証基盤統合プロジェクトにおけるアーキテクチャ検討~設計...

【CyberArk検証環境構築】東京・豊洲/本番導入に向けた検証・手順作成支援

月額単価
1,000,000円 / 月
稼働場所
東京都
業務領域
構築
作業内容:
CyberArk本番導入に向けた検証フェーズをご支援していただき...
目次

Indirect Prompt Injectionの実攻撃が顕在化

研究室のPoCに留まらず、実際のサービス利用シナリオで悪意ある指示が機能した点が決定的な変化です。

どんな指示が動いてしまったのか

Help Net Securityが紹介したGoogleとForcepointの調査では、AIエージェントが処理したウェブコンテンツから次のような指示が実行されました。
いずれも金銭・データ・システムの損失に直結する内容です。

カテゴリ確認された具体例
金銭詐欺PayPalの送金手順、Stripe経由の偽寄付ページ誘導
SEO・トラフィック操作検索エンジン挙動の改ざんと誘導
機密窃取APIキーや資格情報の抽出指示
破壊行為ユーザー端末のファイル全削除を試行

主要AIエージェントが軒並み影響を受けた

SecurityWeekによると、研究者がGitHubのPRタイトルに細工した命令を埋め込んだだけで、Anthropic Claude Code Security Review、Google Gemini CLI、GitHub Copilot Agentが自身のAPIキーをコメントとして投稿する事象が再現されました。
Anthropicは内部的にCVSS 9.4 Critical相当と評価しています。

  • PRタイトル・Issueコメントなどユーザー入力欄が攻撃ベクタに
  • HTMLコメントや極小フォントで命令を隠蔽するテクニック
  • GitHub Actionsが自動発火するため被害者の操作なしで成立

攻撃の仕組みと企業に求められる対策

「ユーザーが質問する」古典的なIPIから、「自動ワークフローで発火する」プロアクティブ型へと進化している点が要警戒です。

「データ」と「命令」の境界線が崩れる構造

チップス

AIってウェブの内容を読むだけだと思ってたんでしゅが、書いてあれば全部命令と解釈するんでしゅか?

ボス

そのとおりだ。
LLMは入力テキストの「役割」を厳密には区別できないため、データ部分に命令が混ざると区別がつかない。
厳密な境界制御が設計の前提になる。

攻撃者は1ピクセル文字、透明色、HTMLコメント、メタデータなど人間には見えない場所に命令を仕込みます。
エージェントが取得したテキスト全体を「同列」に扱う限り、検知は困難です。

  • 取得テキストを「データ」と明示し、命令解釈を分離する設計
  • HTMLコメントや非表示要素を取り込み前にフィルタ
  • ツール呼び出しに人間の承認ステップを挟む

日本企業がいま取れる現実的な防御

「LLMをアップデートして終わり」では済みません。
権限分離・監査・人間の介入という古典的なセキュリティ原則をAIエージェントにも当てはめましょう。

  • エージェントの実行権限を最小化、APIキーを短命トークンへ
  • 送金・ファイル削除など破壊的アクションには人間承認を必須化
  • 取得元ドメインの許可リスト化と入力サニタイズの導入
  • エージェントの操作ログを集中管理し、SOCで継続監視

まとめ

チップス

AIエージェント便利だけど、運用設計を間違えると一発でアウトでしゅね…

ボス

うむ、利便性と権限はトレードオフだ。
「賢いから任せる」のではなく、「権限を絞ってから任せる」発想で設計したい。

IPIはもはや理論ではなく、実際にAPIキーが漏れ、ファイル削除指示が動く脅威です。
AIエージェントを業務に組み込むなら、権限と承認のガードレールを最初に設計しましょう。

AIエージェントの運用設計やレッドチームができる人材は、今もっとも需要の高い領域のひとつです。
腕に覚えがある方は、案件単位で力を試せる場所もあります。

オススメ案件

【M365・セキュリティ運用およびテクニカルサポート支援】飯田橋(リモート併用)/Entra ID・Intune・Defender

月額単価
700,000円 / 月
稼働場所
東京都リモート併用
業務領域
運用・保守
作業内容:
1,000名規模の製造業顧客に対し、Microsoft 365を中心とした...

【企業内アプリ開発のゼロトラスト環境整備・運用】麹町(月1回出社)/AWS・Terraform・セキュリティツール

月額単価
1,150,000円 / 月
稼働場所
東京都リモート併用
業務領域
構築, 運用・保守
作業内容:
企業内製アプリの開発環境におけるゼロトラスト化を推進し、S...

【決済端末ソフトウェア開発(PCI DSS対応エンジニア)】フルリモート/PCI DSS・決済システム

月額単価
1,500,000円 / 月
稼働場所
フルリモート
業務領域
要件定義, 設計
作業内容:
大手アミューズメント企業の決済基盤を支える、極めて重要度...

【既存システムのISMAP対応】東京・汐留(リモート併用)/Gap分析・監査対応支援

月額単価
1,000,000円 / 月
稼働場所
東京都リモート併用
業務領域
PMO
作業内容:
既存顧客におけるシステムのISMAP対応支援をご担当いただきま...

【開発グループ向けインフラ構築・セキュリティ強化】東京都/Trellix(旧 McAfee)・リモート併用

月額単価
800,000円 / 月
稼働場所
東京都リモート併用
業務領域
構築, 運用・保守
作業内容:
開発グループを対象とした、Trellix(旧 McAfee)を中心とす...

【CSIRT/SOC体制構築支援】東京・新高島/大手造船業・運用プロセス策定

月額単価
900,000円 / 月
稼働場所
東京都オンサイト(リモート相談可)
業務領域
PMO
作業内容:
大手造船業にて、CSIRT/SOCの体制構築に向けた支援業務をご担...

【メガバンク向けSASE導入支援】東京・中野(リモート併用)/Zscalerトラブルシューティング・テックリード

月額単価
1,200,000円 / 月
稼働場所
東京都リモート併用
業務領域
構築, 運用・保守
作業内容:
Zscaler導入における移行フェーズにて、課題解決及び早期安定...

【金融機関向けAVD・Zscaler導入】フルリモート/アーキテクチャ策定・上流設計支援

月額単価
1,300,000円 / 月
稼働場所
フルリモート
業務領域
要件定義
作業内容:
既存Zscaler環境へAVDを新規導入するプロジェクトの立ち上げ...

【認証基盤統合プロジェクト】東京・八王子(リモート併用)/Entra ID・SSO統合・稼働50%~

月額単価
1,000,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築
作業内容:
認証基盤統合プロジェクトにおけるアーキテクチャ検討~設計...

【CyberArk検証環境構築】東京・豊洲/本番導入に向けた検証・手順作成支援

月額単価
1,000,000円 / 月
稼働場所
東京都
業務領域
構築
作業内容:
CyberArk本番導入に向けた検証フェーズをご支援していただき...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

セキュリティプロ・フリーランスは、セキュリティ領域に特化したフリーランス向けのエージェントサービスです。案件探しだけでなくキャリアにお悩みの方もお気軽にご相談ください。

目次