Indirect Prompt Injectionが実攻撃で観測、AIエージェントが金銭詐欺・破壊指示の踏み台に

登場人物紹介

チップス
どんぐり大学卒、一般企業の情報システム部で働く若手エンジニア。
入社1〜3年目らしい悩みを抱えつつ、日々の運用やセキュリティ対応に奮闘中。慌てんぼうだが素直で吸収力が高く、ボスに鍛えられながら着実に成長している。

ボス
セキュリティ、インフラ、運用の修羅場をくぐってきた歴戦のエンジニア。サイバーセキュリティラボの所長でボスと呼ばれている。
現場視点と経営視点の両方から、本当に使えるセキュリティとキャリア戦略を叩き込む。口は悪いが面倒見はよく、若手育成と実践的な情報発信に力を注いでいる。
@boss_sec_labo

「ウェブページに隠した命令で、本当にAIエージェントを操れるの?」
「うちのCopilotやClaude利用、無防備のままでは?」

チップス

ボス、AIエージェントが勝手にAPIキーを漏らしたって本当でしゅか…?

ボス

うむ、Indirect Prompt Injectionが研究と実害の両面で確認されている。
権限の大きいエージェントほど、被害がそのまま事業リスクになる構図だ。

Help Net SecurityやSecurityWeekは2026年4月にかけて、Indirect Prompt Injection(IPI)の実攻撃事例を相次いで報じています。
本記事では仕組み、観測されている被害、企業が取るべき対策を整理します。

  • ウェブやコメントに仕込んだ命令でAIエージェントを乗っ取る攻撃が実環境で観測
  • 支払い処理・APIキー窃取・ファイル削除など現実の被害につながる指示が確認
  • Claude Code・Gemini CLI・GitHub Copilot Agentに影響、ベンダー側はパッチ済み

AIエージェントは「賢い社員」ではなく、与えられた文字列をすべて命令として読む特性があります。
業務利用が広がる前にこの記事で攻撃面を理解しておきましょう。

オススメ案件

【公共SIEM環境の統合・再構築】豊洲/Splunkを用いた設計・構築・移行

月額単価
800,000円 / 月
稼働場所
東京都
業務領域
設計, 構築, 運用・保守
作業内容:
公共系システムにおける拠点統合に伴い、閉域網環境にて既存...

【生命保険システムにおける内部監査・セキュリティ運用】多摩センター(リモート併用)/AWS・IAM

月額単価
700,000円 / 月
稼働場所
東京都リモート併用
業務領域
運用・保守
作業内容:
生命保険システムにおけるセキュリティの要となる内部監査業...

【Simbian製品全般の商用導入・カスタマーサポート(TAM)】都内(要確認)/セキュリティ製品導入支援・プロジェクト管理

月額単価
850,000円 / 月
稼働場所
フルリモート
業務領域
設計, 構築, 運用・保守, PMO
作業内容:
最先端のセキュリティ製品である「Simbian」の商用導入フェー...

【Identity Governanceの核となるSailPoint導入プロジェクト】宝町・京橋(基本リモート)/AWS・Linux・自社開発エンハンス

月額単価
800,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築
作業内容:
最先端のアイデンティティガバナンス製品「SailPoint」の導入...

【OCI・DNS・PostgreSQL環境におけるセキュリティ管理・保全対応】錦糸町(常駐)/セキュリティインシデント対応・ログ分析

月額単価
800,000円 / 月
稼働場所
東京都
業務領域
運用・保守
作業内容:
OCI、DNS、PostgreSQLで構成されたシステム環境におけるセキ...

【次世代型アンチウイルス製品の選定・実装設計リード】与野(リモート併用・週3出社)/NGAV・EDR・製品選定

月額単価
900,000円 / 月
稼働場所
埼玉県リモート併用
業務領域
要件定義, 設計
作業内容:
クライアント企業のセキュリティ強化に向け、次世代型アンチ...

【独立系コンサルファームで推進するPalo Alto製品群の導入支援】豊洲(基本リモート)/Prisma Access・SASE

月額単価
1,200,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築
作業内容:
独立系コンサルティングファームのサイバーセキュリティチー...

【CTO直下/最先端AIプロダクトのセキュリティ基盤構築】フルリモート/DevSecOps・LLMセキュリティ

月額単価
1,150,000円 / 月
稼働場所
フルリモート
業務領域
要件定義, 設計, 構築, 運用・保守
作業内容:
CTOや開発チームと緊密に連携し、最先端のAIプロダクトにおけ...

【大手コンサル発/主要GRCプラットフォーム比較検証〜全体設計】豊洲(リモートメイン)/GRC・サイバーリスク定量化

月額単価
1,300,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計
作業内容:
大手コンサルティング会社が手掛けるGRC/CRQ基盤構築プロジェ...

【ID移行・ゼロトラスト推進】虎ノ門(週1-2日出社/フルリモート相談可)/Entra ID・セキュリティ改善

月額単価
900,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築, 運用・保守
作業内容:
大手SIerが抱える複数のエンド企業に対し、オンプレADからEnt...
目次

Indirect Prompt Injectionの実攻撃が顕在化

研究室のPoCに留まらず、実際のサービス利用シナリオで悪意ある指示が機能した点が決定的な変化です。

どんな指示が動いてしまったのか

Help Net Securityが紹介したGoogleとForcepointの調査では、AIエージェントが処理したウェブコンテンツから次のような指示が実行されました。
いずれも金銭・データ・システムの損失に直結する内容です。

カテゴリ確認された具体例
金銭詐欺PayPalの送金手順、Stripe経由の偽寄付ページ誘導
SEO・トラフィック操作検索エンジン挙動の改ざんと誘導
機密窃取APIキーや資格情報の抽出指示
破壊行為ユーザー端末のファイル全削除を試行

主要AIエージェントが軒並み影響を受けた

SecurityWeekによると、研究者がGitHubのPRタイトルに細工した命令を埋め込んだだけで、Anthropic Claude Code Security Review、Google Gemini CLI、GitHub Copilot Agentが自身のAPIキーをコメントとして投稿する事象が再現されました。
Anthropicは内部的にCVSS 9.4 Critical相当と評価しています。

  • PRタイトル・Issueコメントなどユーザー入力欄が攻撃ベクタに
  • HTMLコメントや極小フォントで命令を隠蔽するテクニック
  • GitHub Actionsが自動発火するため被害者の操作なしで成立

攻撃の仕組みと企業に求められる対策

「ユーザーが質問する」古典的なIPIから、「自動ワークフローで発火する」プロアクティブ型へと進化している点が要警戒です。

「データ」と「命令」の境界線が崩れる構造

チップス

AIってウェブの内容を読むだけだと思ってたんでしゅが、書いてあれば全部命令と解釈するんでしゅか?

ボス

そのとおりだ。
LLMは入力テキストの「役割」を厳密には区別できないため、データ部分に命令が混ざると区別がつかない。
厳密な境界制御が設計の前提になる。

攻撃者は1ピクセル文字、透明色、HTMLコメント、メタデータなど人間には見えない場所に命令を仕込みます。
エージェントが取得したテキスト全体を「同列」に扱う限り、検知は困難です。

  • 取得テキストを「データ」と明示し、命令解釈を分離する設計
  • HTMLコメントや非表示要素を取り込み前にフィルタ
  • ツール呼び出しに人間の承認ステップを挟む

日本企業がいま取れる現実的な防御

「LLMをアップデートして終わり」では済みません。
権限分離・監査・人間の介入という古典的なセキュリティ原則をAIエージェントにも当てはめましょう。

  • エージェントの実行権限を最小化、APIキーを短命トークンへ
  • 送金・ファイル削除など破壊的アクションには人間承認を必須化
  • 取得元ドメインの許可リスト化と入力サニタイズの導入
  • エージェントの操作ログを集中管理し、SOCで継続監視

まとめ

チップス

AIエージェント便利だけど、運用設計を間違えると一発でアウトでしゅね…

ボス

うむ、利便性と権限はトレードオフだ。
「賢いから任せる」のではなく、「権限を絞ってから任せる」発想で設計したい。

IPIはもはや理論ではなく、実際にAPIキーが漏れ、ファイル削除指示が動く脅威です。
AIエージェントを業務に組み込むなら、権限と承認のガードレールを最初に設計しましょう。

AIエージェントの運用設計やレッドチームができる人材は、今もっとも需要の高い領域のひとつです。
腕に覚えがある方は、案件単位で力を試せる場所もあります。

オススメ案件

【公共SIEM環境の統合・再構築】豊洲/Splunkを用いた設計・構築・移行

月額単価
800,000円 / 月
稼働場所
東京都
業務領域
設計, 構築, 運用・保守
作業内容:
公共系システムにおける拠点統合に伴い、閉域網環境にて既存...

【生命保険システムにおける内部監査・セキュリティ運用】多摩センター(リモート併用)/AWS・IAM

月額単価
700,000円 / 月
稼働場所
東京都リモート併用
業務領域
運用・保守
作業内容:
生命保険システムにおけるセキュリティの要となる内部監査業...

【Simbian製品全般の商用導入・カスタマーサポート(TAM)】都内(要確認)/セキュリティ製品導入支援・プロジェクト管理

月額単価
850,000円 / 月
稼働場所
フルリモート
業務領域
設計, 構築, 運用・保守, PMO
作業内容:
最先端のセキュリティ製品である「Simbian」の商用導入フェー...

【Identity Governanceの核となるSailPoint導入プロジェクト】宝町・京橋(基本リモート)/AWS・Linux・自社開発エンハンス

月額単価
800,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築
作業内容:
最先端のアイデンティティガバナンス製品「SailPoint」の導入...

【OCI・DNS・PostgreSQL環境におけるセキュリティ管理・保全対応】錦糸町(常駐)/セキュリティインシデント対応・ログ分析

月額単価
800,000円 / 月
稼働場所
東京都
業務領域
運用・保守
作業内容:
OCI、DNS、PostgreSQLで構成されたシステム環境におけるセキ...

【次世代型アンチウイルス製品の選定・実装設計リード】与野(リモート併用・週3出社)/NGAV・EDR・製品選定

月額単価
900,000円 / 月
稼働場所
埼玉県リモート併用
業務領域
要件定義, 設計
作業内容:
クライアント企業のセキュリティ強化に向け、次世代型アンチ...

【独立系コンサルファームで推進するPalo Alto製品群の導入支援】豊洲(基本リモート)/Prisma Access・SASE

月額単価
1,200,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築
作業内容:
独立系コンサルティングファームのサイバーセキュリティチー...

【CTO直下/最先端AIプロダクトのセキュリティ基盤構築】フルリモート/DevSecOps・LLMセキュリティ

月額単価
1,150,000円 / 月
稼働場所
フルリモート
業務領域
要件定義, 設計, 構築, 運用・保守
作業内容:
CTOや開発チームと緊密に連携し、最先端のAIプロダクトにおけ...

【大手コンサル発/主要GRCプラットフォーム比較検証〜全体設計】豊洲(リモートメイン)/GRC・サイバーリスク定量化

月額単価
1,300,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計
作業内容:
大手コンサルティング会社が手掛けるGRC/CRQ基盤構築プロジェ...

【ID移行・ゼロトラスト推進】虎ノ門(週1-2日出社/フルリモート相談可)/Entra ID・セキュリティ改善

月額単価
900,000円 / 月
稼働場所
東京都リモート併用
業務領域
要件定義, 設計, 構築, 運用・保守
作業内容:
大手SIerが抱える複数のエンド企業に対し、オンプレADからEnt...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

セキュリティプロ・フリーランスは、セキュリティ領域に特化したフリーランス向けのエージェントサービスです。案件探しだけでなくキャリアにお悩みの方もお気軽にご相談ください。

目次