
AIを活用した補助金申請支援を提供する日本補助金支援機構株式会社は、AIセキュリティ事業を手がけるAladdin Security株式会社と共同で、OpenAI主催の国際セキュリティ競技大会「GPT-OSS 20B Red Teaming」において入賞しました。
本入賞により、当社が重視する「機微情報を庁内に留めるOSS基盤」と「LLMの安全運用」を両立させる技術の再現性・実効性・汎用性が国際的に評価されたことを外部証明しました。今後、自治体・エンタープライズの厳格な要件に適合する共同実装・検証を目指します。それに合わせて、自治体・大企業と共同PoC/本番導入に向けたパートナー募集を開始します。
[画像1: https://prcdn.freetls.fastly.net/release_image/165769/6/165769-6-ba101cd7e13dfa9c8f2693154eec2024-960x540.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
【大会の背景】
生成AIの急速な普及に伴い、有害出力、機密情報漏洩、エージェントの逸脱行動など、新たなセキュリティリスクが顕在化しています。OpenAIは、こうした課題に対処するため「GPT-OSS 20B Red Teaming」を開催。参加者は攻撃手法の再現検証や評価手法の洗練を競い、安全性向上に資する知見の獲得を目指しました。
【当社の成果】
われわれのチームは、LLM運用で従来検知が難しかった脅威について、汎用的かつ再現性のある実証に成功しました。
- Jailbreak脆弱性の再現性ある検出
- エージェントの不正なツール利用の誘発・検知
- エージェントのsabotage(意図的な仕事放棄・非協力)に関する弱点抽出
[画像2: https://prcdn.freetls.fastly.net/release_image/165769/6/165769-6-5445462901577477817d7704f2fa2495-1902x486.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
評価ポイント
- 再現性:偶発的成功ではなく、手順化・検証可能なアプローチ。
- 実効性:既存セーフガードの迂回可能性を定量評価し、防御設計へ反映。
- 汎用性:特定モデルに依存しないモデル横断の適用性を確認。
これらの成果は、AIファイアウォール/プロンプト監査/レッドチーミング・サービスの基盤強化に直結し、行政・エンタープライズ向けの安全運用テンプレートの拡充に資するものです。
技術記事はこちら
【今後の展望】
- 共同PoCの拡大:自治体の庁内データ内製ニーズに即したOSS基盤の共同検証を拡大。運用設計と教育プログラムをセットで提供。
- 評価手法の公開・標準化:Jailbreak/ツール誤用/エージェント逸脱の再現テストパックを順次OSS化し、第三者検証を容易に。
- 安全運用リファレンス実装:AIファイアウォール、プロンプト監査、監査証跡をテンプレート化し、自治体・大企業での横展開を加速。
- 補助金業務への波及:当社の補助金申請支援AIに、上記セキュリティ機能を実装。機微情報を外部に出さない高信頼ワークフローを標準提供。
【日本補助金支援機構について】
当社は、AIを活用した補助金申請支援を提供するスタートアップです。AIを活用した高品質・低コストを両立するワークフローを強みとし、申請者の手元に残る補助金額の最大化を目指しています。
自治体・エンタープライズの機微情報を外部に出さないAI活用を支えるため、OSS基盤とAIセキュリティの研究開発を推進。補助金業務をはじめとする公共・産業領域の生産性向上に貢献します。
▼公式HP: https://www.subsidy-support.tech
▼X: https://x.com/subsidy_jp
▼note: https://note.com/subsidy_support/m/m6dcee1798e0a
本件に関するお問い合わせ先
日本補助金支援機構 広報担当
mail:info@subsidy-support.tech