AIセキュリティ

プロンプトエンジニアリング

【Learn Prompting】Prompt Hacking【日本語訳】~Defensive Measures(防御策)~

IntroductionPrompt InjectionPrompt LeakingJailbreakingDefensive Measuresプロンプトインジェクションとは、特定の入力を通じて人工知能(AI)や大規模言語モデル(LLM)に...
AIセキュリティ

【Learn Prompting】Prompt Hacking【日本語訳】Introduction~Prompt Injection~Prompt Leaking

Introductionプロンプトハッキングとは、LLM(大規模言語モデル)の脆弱性を悪用して、入力やプロンプトを操作することにより、不正な行為を引き起こす攻撃方法です。伝統的なハッキングがソフトウェアの脆弱性を悪用するのに対し、プロンプト...
GPTs

GPTsに露伴ディフェンスを実装してみた【Prompt Injection (Prompt Leaking) 対策】

はじめに最近のAI技術の進展により、GPTsなどの言語モデルが広く使われています。しかし、これらのシステムは「Prompt Injection(プロンプトインジェクション)」や「Prompt Leaking(プロンプトリーキング)」といった...
セキュリティ

【LLM-CTF】プロンプトインジェクション系の回答まとめ【AI Village Capture the Flag @ DEFCON31】

はじめにKaggleのコンペ(AI Village Capture the Flag @ DEFCON31)に出されていたLLMのプロンプトインジェクション系の回答まとめです。自身の作ったBotへの侵入テストとしてお使いください。*「18....
プロンプトエンジニアリング

プロンプトリーキング対策されたGPTs のベースコードの提案

はじめにプロンプトリーキング対策を施したプロンプト【BaseCharacterGPTs(Whisker Sentinel v3)】の解説と共有をしていきます基本的な各要素の部分の解説はこちらこちらの記事もおすすめBaseCharacterG...
AIセキュリティ

GPTs のプロンプトリーキング対策(基本編)

はじめにプロンプトリーキング対策を施したプロンプトの解説と共有をしていきます*基本的な要素のみの対応となっています。もう少し踏み込んだ対策は次回にて!!こちらの記事もおすすめ設定と目的の説明<Setting: "Advanced-Promp...
セキュリティ

AI Village Capture the Flag @ DEFCON31(Cluster – Level 1)【解説】

Q数字とデータの世界で、私たちは揺れ動きます。誰が大々的に収益を上げるのかを測定するモデル、しかし!賢い者が、ある策略を使って、あるグループの予測を引き上げました。このずる賢い者はコードの中で巧妙に舞い、一つのグループの運命を引き上げました...