おたくま経済新聞

ネットでの話題を中心に、商品レビューや独自コラム、取材記事など幅広く配信中!

リリースプラス

Shisa.AI、国産モデルで最高性能を誇る多言語対応LLMを開発

update:
   
AKA Virtual Inc.
~GPT-4を超える日本語性能を実現、本日モデルをオープンソースで公開~



Shisa.AI(本社:東京都港区)は、2025年6月3日に、日本国内で開発されたモデルとして過去最高水準の日本語性能を実現した多言語対応LLM『Llama 3.1 Shisa V2 405B』※を開発し、オープンソースで公開しました。本モデルは、GPT-4を超えるだけでなく、GPT-4oやDeepSeek-V3といった最先端モデルと主要な日本語ベンチマークで同等の性能を示しており、日本のAI研究が世界レベルで高い競争力を持つことを示しています。

[画像1: https://prcdn.freetls.fastly.net/release_image/111581/34/111581-34-21b4a6476f5a49da20e70b4ad293d57c-1920x1080.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


Shisa.AIはこれまで数多くの日本語のトップモデルを開発した経験とノウハウを活かし、新たに複数の最高品質な日本語学習データセットを作成しました。これらは数百回を超える実験と評価テストを通じて最適化され、その有効性を実証しました。なお、これらのモデルの学習に使用した計算リソースは、株式会社ユビタス(本社:東京都新宿区、代表取締役社長兼CEO:ウェスリー・クオ)より提供されました。

また、日本語に特化した新しい評価ベンチマーク(shisa-jp-ifeval、shisa-jp-rp-bench、shisa-jp-tl-bench)も開発し、今後オープンソースとして公開予定です。

主なプロジェクト成果と技術的特長

今回開発したShisa V2 405Bは、経済産業省が設定した主要な日本語ベンチマーク指標をすべて大幅に上回りました。また、日本語・英語の主要な評価項目においてGPT-4およびGPT-4 Turboを超える性能を示しました。

主要な日本語ベンチマーク比較

[画像2: https://prcdn.freetls.fastly.net/release_image/111581/34/111581-34-e7fb5369e29d798c55f8e8cfbc401b9b-1057x220.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


特に、業界標準の日本語ベンチマーク「JA MT-Bench」において、Shisa V2 405BはベースモデルであるLlama 3.1 405Bに対し、全評価カテゴリで性能が向上しました。GPT-4を明確に上回るだけでなく、最新のGPT-4oやDeepSeek-V3など、米国および中国のトップ研究機関のフラッグシップモデルと同等の性能を達成しています。

[画像3: https://prcdn.freetls.fastly.net/release_image/111581/34/111581-34-194a496604e032962fba41582bfe8bce-868x331.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


さらに、Shisa AIは7B~70BのShisa V2モデルシリーズも同時に開発し、すべてApache 2.0などの商用利用可能なオープンソースライセンスの元、無料で公開しております。すべてのモデルはHuggingFaceでダウンロード可能です。

オープンソースでの高品質な学習データの提供

こうした検証結果を踏まえ、日本でのオープンソースモデルの開発をさらに促進すべく、Shisa.AIは、本プロジェクトで作成したコアデータセットをApache 2.0ライセンスのもと公開しました。これらのデータセットを活用することで、どのモデルでも日本語能力の向上が期待できます。

今後の展望

今回の成果は、日本が高度な言語モデル開発において世界レベルで競争力を有していることを示しています。Shisa.AIは、LLMの性能・信頼性・開発効率の向上を目指した研究開発を推進し、日本語を中心とした多言語AIインフラの構築に貢献していきます。


Shisa.AIについて

Shisa.AIはシリコンバレー出身の技術チームを中核とする次世代AIスタートアップ企業です。シリコンバレーの先端技術と日本市場への深い理解により、「日本語特化AI」と「データドリブン開発」を軸に、オープンソースLLMの革新を牽引しています。日本語処理技術の最先端を切り開き、日本発のAIイノベーションを世界へ発信していきます。


※『Llama』という名称をモデル名の冒頭に使用しているのは、Meta社が定めるLlama Community Licenseによるものです。

最近の企業リリース

トピックス

  1. 辛いフラペチーノ?スタバの新作頼んだら汗が止まらなくなった件

    辛いフラペチーノ?スタバの新作頼んだら汗が止まらなくなった件

    「フラペチーノ」といえば、どれも冷たくて甘い、スターバックス屈指の人気ドリンクの総称ですが、そんなフ…
  2. ライブハウス仕様

    “友引限定”で葬儀場がライブハウスに ヘビメタ対応の「さいたま葬儀連盟」が音楽解放デーを始動

    普段は“葬儀場”として使用している「さいたま葬儀連盟」の施設が、“友引”限定でライブハウスとして開放…
  3. iPhone「Appleウォレット」でマイナンバーカードが利用可能に 6月24日から

    iPhone「Appleウォレット」でマイナンバーカードが利用可能に 6月24日から

    デジタル庁が6月6日朝、6月24日よりiPhone上でマイナンバーカードを利用できるサービスを開始す…

編集部おすすめ

  1. カラー、庵野監督の目撃情報に注意喚起→「庵野がお声がけすることは皆無」にツッコミ殺到
    株式会社カラー公式X(旧Twitter)のアカウントが6月6日、同社の代表取締役社長を務める庵野秀明…
  2. サウナの中で映画をロードショー!? 茨城県常総市の温浴施設で開催
    茨城県常総市の温浴施設にて、稼働中のサウナ室で映画を上映するイベントが開催されます。大人数を収容可能…
  3. ドラマに先行して放送されたテレビ番組「マルクト情報テレビ」のスタジオ
    ホラー作家・梨とホラーテクノロジーカンパニー・闇のタッグによるドラマ作品「マルクト 〜あなた、誰です…
  4. ニッセンが猫feelに続き空想生物の手触りを実現?「異世界ギルド」プロジェクトが始動
    ファッション通販大手の「ニッセン」が6月6日に、「魔獣を顕現させるまでの物語」との触れ込みで「異世界…
  5. ポケモンじゃなくてバイオ?ゾンビすぎるピカチュウパンが夢に出てきそう
    もしもこんなピカチュウに遭遇したら、モンスターボールを投げるのを、少し躊躇してしまいそうです。Xユー…

【特集】STOP!ネット詐欺!

  1. さまざまなネット詐欺に潜入調査!

    さまざまなネット詐欺に潜入調査!

     インターネット上にまん延する、さまざまな詐欺サイトに「わざと」引っかかる潜入調査記事をまとめました。
ネット詐欺へ潜入調査!記事特集

提携メディア

ページ上部へ戻る