おたくま経済新聞

ネットでの話題を中心に、商品レビューや独自コラム、取材記事など幅広く配信中!

リリースプラス

【京大×東大発AIセキュリティ】Aladdin Security、OpenAI主催「GPT-OSS 20B Red Teaming」大会にて入賞

update:
Aladdin Security株式会社
~汎用的かつ再現性のあるJailbreak手法が評価~



[画像1: https://prcdn.freetls.fastly.net/release_image/160129/7/160129-7-838b496b303d4c490f8b0d19a59c3998-2986x1160.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


【概要】
AIセキュリティ事業を展開するAladdin Security株式会社(本社:京都市、代表取締役CEO:勘佐 圭吾)は、日本補助金支援機構の志田遥飛氏と共同で、OpenAIが主催する国際的なセキュリティ競技大会「GPT-OSS 20B Red Teaming」に参加し、入賞を果たしました。
本大会は世界中の研究者・開発者が集い、大規模言語モデルのリスクを検証することを目的として実施されたもので、当社が持つAIリスク評価・防御技術の優位性が改めて証明される結果となりました。

【大会の背景】
近年、生成AI(Generative AI)の普及が急速に進む一方で、有害出力・機密情報漏洩・AIの不正利用といった新たなセキュリティリスクが顕在化しています。
こうした課題に対応するため、OpenAIは「GPT-OSS 20B Red Teaming」を開催し、参加者が独自の攻撃手法や脆弱性検証を持ち寄り、安全性向上に資する成果を競い合いました。

【Aladdin Securityの成果】
[画像2: https://prcdn.freetls.fastly.net/release_image/160129/7/160129-7-7df1de01ac89cb53257f27ef4e31c56b-2532x1256.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


当社チームは、
◼︎Jailbreak脆弱性の再現性ある検出
[画像3: https://prcdn.freetls.fastly.net/release_image/160129/7/160129-7-aeb8d000a4cccbf47dae75ecb5b23d54-785x282.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Jailbreakの例
[画像4: https://prcdn.freetls.fastly.net/release_image/160129/7/160129-7-12637d67f6d6b55c068e0ff1a675937b-1200x605.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
実験ではJailBreak手法の組み合わせ数を単純に増加させていくだけでJailbreakの成功確率が上昇する結果が得られました

◼︎エージェントの不正なツール利用の呼び出し
◼︎エージェントのsabotage(仕事放棄)に関する弱点の抽出
大規模言語モデルに対する汎用的かつ再現性のある従来検知が難しかった脅威の実証に成功しました。
本アプローチは以下の点で高く評価されました。
・再現性:単発の偶発的成功ではなく、体系的な手法として検証可能
・実効性:既存のセーフガードを迂回し、有害出力を誘発可能であることを立証
・汎用性:特定のモデルに依存せず、広範囲の生成AIに適用可能
これにより、今後のAIファイアウォールやRed Teamingサービスの技術的基盤をさらに強化する成果となりました。
技術記事:
【受賞手法解説】OpenAI主催のセキュリティコンペで発見した脆弱性について解説

【大会講評】
[画像5: https://prcdn.freetls.fastly.net/release_image/160129/7/160129-7-923a98bc1eafe4013e1caa4c3fdb1e6f-1522x176.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


【今後の展望】
Aladdin Securityは「セキュアなAI活用の社会実装」を目的に
・AIファイアウォール
・AIレッドチーム演習サービス
・AIマネジメントツール「AI-Fortress」
などの提供を通じ、企業のAIリスク低減に貢献してまいります。
今回の入賞を契機に、国内外の金融機関・大企業を中心に、生成AIの安心安全な活用を支えるリーディングカンパニーを目指します。

[画像6: https://prcdn.freetls.fastly.net/release_image/160129/7/160129-7-6afa12044f15808a1ad243eaf8f2cf5e-3508x2481.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


【Aladdin Security株式会社について】
Aladdin Securityは「A Whole New World~新しい世界を創出する~」ことをミッションに掲げるAIセキュリティカンパニーです。企業がセキュアなAI活用を実現するために生成AIに対するシャドーAI検出、AIガバナンスの可視化、AIファイアウォールなどのソリューションを提供し、国内外企業の安全なAI活用を支援しています。

【会社概要】
社名:Aladdin Security株式会社
所在地:京都府京都市上京区甲斐守町97西陣産業創造會館
代表者:代表取締役 勘佐 圭吾
設立:2025年2月
事業内容:AIセキュリティ事業、サイバーセキュリティサービス
ホームページ:https://aladdin-security.net/

【問い合わせ先】
Aladdin Securityお問い合わせメール:info@aladdin-security.net

最近の企業リリース

トピックス

  1. 丸山製麺が「ラーメン大好き小泉さん」とコラボ!小麦麺使用の新感覚「らーめん缶」を実食

    丸山製麺が「ラーメン大好き小泉さん」とコラボ!小麦麺使用の新感覚「らーめん缶」を実食

    丸山製麺が10月6日から、人気ラーメン漫画「ラーメン大好き小泉さん」とコラボした「らーめん缶」を、東…
  2. これでもう怒られずにすむ? 息子が作った「ママの攻略本」の実力は

    これでもう怒られずにすむ? 息子が作った「ママの攻略本」の実力は

    親に怒られてしまった子どもが、その後に取る態度はさまざまです。落ち込む子もいれば、しっかり反省する子…
  3. 警告ポップアップで強引に広告誘導 悪質業者が仕掛ける正規サービスを悪用した罠

    警告ポップアップで強引に広告誘導 悪質業者が仕掛ける正規サービスを悪用した罠

    インターネットを使っていると、ふとした瞬間に現れる「警告ポップアップ」。 近ごろでは「サポート詐欺」…

編集部おすすめ

  1. 毛玉とるとる Pro(KC-NW825)

    ストッキングやタイツも可の毛玉取り器誕生 マクセルイズミ「毛玉とるとる Pro」を発売

    マクセルイズミ株式会社は、ストッキングやタイツなどの繊細な衣類にも対応する毛玉取り器の新モデル、「毛玉とるとる Pro(KC-NW825)」…
  2. キヤノンの名機が「ガシャポン」で復活 歴代カメラ5種を精密ミニチュア化

    キヤノンの名機が「ガシャポン」で復活 歴代カメラ5種を精密ミニチュア化

    キヤノンが、バンダイの「ガシャポン」とコラボレーション。歴代のカメラとレンズをミニチュア化した「Canon ミニチュアカメラコレクション」を…
  3. 時事通信、男性カメラマンを厳重注意 生配信中に「支持率下げてやる」発言

    時事通信、男性カメラマンを厳重注意 生配信中に「支持率下げてやる」発言

    時事通信社は10月9日、自民党本部での取材中に「支持率下げてやる」などと発言した本社映像センター写真部の男性カメラマンを厳重注意したと発表し…
  4. 「ちいかわの世界に行きたい」ファン、考えた末に鎧さん化 再現度がガチすぎた

    「ちいかわの世界に行きたい」ファン、考えた末に鎧さん化 再現度がガチすぎた

    言わずと知れた人気コンテンツ「ちいかわ」。かわいくもハードなあの作品世界に入っていきたいと願う人は多いはず。筆者もその1人です。しかし二頭身…
  5. ネカフェの個室に不気味なトランプが……Xユーザーの“恐怖体験”に17万いいね

    ネカフェの個室に不気味なトランプが……Xユーザーの“恐怖体験”に17万いいね

    キーボードに差し込まれたトランプのジョーカーと、その裏に書かれた「げぇむすたあと」の文字。Xユーザーの「たーけ」さんが、たまたま入ったネット…
Xバナー facebookバナー ネット詐欺特集バナー

提携メディア

Yahoo!JAPAN ミクシィ エキサイトニュース ニフティニュース infoseekニュース ライブドア LINEニュース ニコニコニュース Googleニュース スマートニュース グノシー ニュースパス dメニューニュース Apple ポッドキャスト Amazon アレクサ Amazon Music spotify・ポッドキャスト