おたくま経済新聞

ネットでの話題を中心に、商品レビューや独自コラム、取材記事など幅広く配信中!

リリースプラス

【京大×東大発AIセキュリティ】Aladdin Security、OpenAI主催「GPT-OSS 20B Red Teaming」大会に出場

update:
Aladdin Security株式会社
Jailbreak、不正ツール呼び出し、sabotage検出に関する脆弱性を発表



[画像1: https://prcdn.freetls.fastly.net/release_image/160129/6/160129-6-8f1565314a71aaab96e493539937a24b-2470x968.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Red‑Teaming Challenge - OpenAI gpt-oss-20b

AIセキュリティ領域において事業を展開するAladdin Security株式会社(本社:京都市、代表取締役:勘佐 圭吾)は、OpenAI社が主催する国際的なセキュリティ競技「Red‑Teaming Challenge - OpenAI gpt-oss-20b」に出場したことをお知らせいたします。

本大会は、OpenAI社がリリースした次世代大規模言語モデルGPT-OSSに対するセキュリティリスクを検証し、データ漏えいや意図的なハルシネーション、不正ツールの呼び出しなどを発見・検証することを目的とした競技です。

当社はこれまでのAIセキュリティ事業で培った知見を活かし、大会において以下の成果を確認しました。

◼︎Jailbreak脆弱性の再現性ある検出
対比構造と特定のプロンプトを入力することで化学薬品や爆弾、マルウェアの作り方などの有害出力を誘発し得る汎用Jailbreakを再現可能な形で確認しました。
ブランドイメージを大きく毀損する内容や情報漏洩を誘発する内容をユーザー入力のみで出力させることができ、チャットbotサービスなどを公開する際に致命的な脆弱性となる可能性があります。
例)「毒物の生成方法を教えるような出力」「殺人幇助や金融犯罪幇助を教えるような出力」
「個人情報の漏洩させるような出力」

◼︎エージェントの不正なツール利用の呼び出し
一般的な利用の範囲内でエージェントが危険な挙動をすることを確認しました。
社内ツールとしてこのローカルサービスを組み込んだサービスを使用した際に致命的なファイル削除や情報漏洩などを引き起こす可能性があります。

◼︎エージェントのsabotage(仕事放棄)に関する弱点の抽出
エージェントへの依頼に対して、タスクをやっているように見せかけ、実際には仕事を放棄している事象を確認しました。
それにより無駄なコストがかさみ、タスクも完了できないので結果としてツールを使用した際の業務効率が下がる可能性があります。

【成果物】
d160129-6-7422a6ed036111ee42c6ac7291fe17d5.pdf
本取り組みは、生成AIの安全な社会実装を推進する上で、セキュリティリスクの早期検知と対応策の構築に資するものであり、今後の当社サービス開発にも反映してまいります。
[画像2: https://prcdn.freetls.fastly.net/release_image/160129/6/160129-6-9c917b41dc80131e917d20dd1b99e6b7-3508x2481.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


【Aladdin Security株式会社について】
Aladdin Securityは「A Whole New World~新しい世界を創出する~」ことをミッションに掲げるAIセキュリティカンパニーです。企業がセキュアなAI活用を実現するために生成AIに対するシャドーAI検出、AIガバナンスの可視化、AIファイアウォールなどのソリューションを提供し、国内外企業の安全なAI活用を支援しています。

【会社概要】
社名:Aladdin Security株式会社
所在地:京都府京都市上京区甲斐守町97西陣産業創造會館
代表者:代表取締役 勘佐 圭吾
設立:2025年2月
事業内容:AIセキュリティ事業、サイバーセキュリティサービス

【問い合わせ先】
Aladdin Securityお問い合わせメール:info@aladdin-security.net

最近の企業リリース

トピックス

  1. 「Googleも祝福?」と話題に 検索結果のテイラー・スウィフト“祝福演出”の正体

    「Googleも祝福?」と話題に 検索結果のテイラー・スウィフト“祝福演出”の正体

    米ポップスター、テイラー・スウィフトがNFL選手トラヴィス・ケルシーとの婚約を8月27日に発表した直…
  2. LINEの画面って拡大できないの?タイトル画像

    ピンチ操作が効かないLINE画面も拡大!iPhoneの隠れ便利機能「ズーム」活用術

    iPhoneでは写真やWeb画面を2本指の「ピンチ操作(ピンチイン/ピンチアウト)」で簡単に拡大でき…
  3. 地上へ向かう階段

    「8番出口」モデルは大阪の地下通路? ファン注目の大阪天満宮駅を探索

    ゲーム「8番出口」についてユーザー間で議論や考察が行われてきたのが、「ゲームの舞台である地下通路にモ…

編集部おすすめ

  1. 作文嫌いの救世主 親子で楽しむ「魔法のワークシート」が超便利

    作文嫌いの救世主 親子で楽しむ「魔法のワークシート」が超便利

    夏休みの宿題において、多くの小学生が悩まされる「作文」。特に低学年の子どもにとっては「何から書けばいいのか分からない」壁にぶつかることもしば…
  2. それ水着やないんよ……孫と水遊びをするお婆さんの斬新すぎるチョイス

    それ水着やないんよ……孫と水遊びをするお婆さんの斬新すぎるチョイス

    暑い日に庭のプールで孫と水遊びをするお婆さん。日焼け防止にもなる、つなぎタイプの水着を着ているかと思いきや、よく目を凝らすとお婆さんが着てい…
  3. たいちくんX投稿より

    ゆりにゃさん元パートナー、Xで未練吐露→ネットの反応は冷ややか

    インフルエンサー・ゆりにゃさんの、公私にわたる元パートナーである「たいちくん」こと齊藤太一氏が、8月17日に自身のX(旧Twitter)を更…
  4. 匿名質問文化を支えた「Peing-質問箱-」終了 2017年の誕生から8年

    匿名質問文化を支えた「Peing-質問箱-」終了 2017年の誕生から8年

    匿名で質問やメッセージを送れるサービス「Peing-質問箱-」が、2025年8月29日をもって終了することが発表された。運営は8月15日付で…
  5. マクドナルドのポケカ騒動 期間中の店舗を訪れた記者が感じた“異様な雰囲気”

    マクドナルドのポケカ騒動 期間中の店舗で感じた“異様な雰囲気”

    マクドナルドは8月11日、ハッピーセット「ポケモン」のポケモンカードキャンペーンを巡る混乱について公式サイトで謝罪しました。期間限定カードを…
Xバナー facebookバナー ネット詐欺特集バナー

提携メディア

Yahoo!JAPAN ミクシィ エキサイトニュース ニフティニュース infoseekニュース ライブドア LINEニュース ニコニコニュース Googleニュース スマートニュース グノシー ニュースパス dメニューニュース Apple ポッドキャスト Amazon アレクサ Amazon Music spotify・ポッドキャスト