おたくま経済新聞

ネットでの話題を中心に、商品レビューや独自コラム、取材記事など幅広く配信中!

リリースプラス

FastLabel、ストックマーク株式会社へ日本語特化型LLM開発に必要な独自データを作成し提供

update:
   
FastLabel
ハルシネーションを抑止したドキュメント読解基盤モデルにおけるGENIAC第2期を支援 ~ 本発表に関連した事例ウェビナーを6月4日(水)12時に開催 ~



Data-centric AI[※1]開発に必要なデータ収集・生成からアノテーション、モデル開発、DataOps構築までの全工程を支援するFastLabel株式会社(本社:東京都新宿区、代表取締役CEO:鈴木健史、以下「当社」)は、ストックマーク株式会社(本社:東京都港区、社長:林 達、以下「ストックマーク」)へ、ハルシネーションを抑止したドキュメント読解基盤モデルの開発に必要な、独自のデータを作成し提供したことをお知らせします。
[※1] Data-centric AI:AIのデータセットを改善することでモデルの精度改善を実現するアプローチ
[画像1: https://prcdn.freetls.fastly.net/release_image/65427/177/65427-177-bec665116c662553a72e014c0ae99852-1690x188.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


今回の当社のデータ作成と提供は、経済産業省・NEDOが推進する国内生成AI開発プロジェクト(以下、GENIAC)[※2]」の第2期(2024年10月発表[※3])の中で行われ、ストックマークによる高い日本語能力と深いビジネス知識を併せ持ったビジネスドメインで信頼して活用できる複雑なドキュメント読解のためのLLM開発に活用されました。
[※2]GENIAC: 経済産業省が2024年2月に立ち上げた国内の生成AI開発力強化プロジェクト
[※3]ストックマークの発表:https://stockmark.co.jp/news/20241010

【日本のLLM開発における課題】
日本のLLM開発は主にデータと人員においていくつかの課題があります。

データの課題:日本語は英語圏に比べて公開データが少なく、特に高品質な公開データセット(書籍、論文、SNS、ニュース記事など)が限られていて、ライセンス面でも制約が多いです。また、日本語特有の表記揺れや曖昧さも多く、同じ言葉でも漢字・ひらがな・カタカナ・ローマ字の混在、文脈依存の意味変化や助詞・敬語表現の複雑さなど、モデルが学習しづらい要素が多いです。
人員の課題:日本国内においてLLM開発をリードできるAIエンジニア・研究者は限られており、実際に大規模なモデルの学習・運用を行った経験者が少ない中で開発を推進していかなければなりません。そのため、本質的な研究や開発の業務ではないデータ作成や収集に、限られた人員のリソースが割かれてしまうことは本意ではありません。

【当社の支援内容】
課題を踏まえ、今回当社ではストックマークへ以下の支援を行いました。

AI開発に必要なデータの作成:ストックマークが指定する数万枚のパワーポイントデータをテキストデータに変換しつつ、資料内に含まれる図版やグラフなどの意味や意図の読み取りを含めて実施。
GENIAC要件への対応:GENIACにおける当社の豊富な採択支援実績に基づき、審査基準を満たすデータ作成を支援。

[画像2: https://prcdn.freetls.fastly.net/release_image/65427/177/65427-177-94c10b5b224b62c1aef7af2d70aa91f4-1800x2700.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]

【ストックマーク Senior Researcher森長様より本支援に関する所感】
この度は、FastLabel様へパワーポイントデータへの詳細なアノテーションデータの作成を依頼しました。本プロジェクトに際しては図や表、画像といったテキストで表現されていないデータの意味をどうモデルに学習させるかといった課題がありましたが、アノテーションにあたり、図や表、画像の意味や意図を可能な限り自然言語でテキストとして変換していただいたことで円滑に開発を進行できたと感じています。





[画像3: https://prcdn.freetls.fastly.net/release_image/65427/177/65427-177-877eb8e5b5afd8547844285f48de2ea4-592x495.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]

【本プレスリリースに関連した事例ウェビナーのご案内】
開催日時:2025年6月4日(水)13時00分~14時00分
タイトル:GENIAC 採択プロジェクトに学ぶ!LLM開発の現在地と課題解決のリアル
概要:GENIACの採択企業2社による研究テーマや成果、課題への具体的なアプローチを紹介
登壇者:ストックマーク株式会社、NABLAS株式会社、FastLabel 株式会社
参加費:無料
申し込み:https://fastlabel.ai/seminar/lp-20250604



【当社事業について】
当社は「データセット提供」、「アノテーション代行」、「モデル開発支援」、「FastLabel Data Factory」など、AI開発を行うお客様に向けたトータルソリューションを提供しています。

データセット提供:権利クリアかつ高品質な各種データの収集、販売を行います。ストックの提供や新規撮り下ろしにも対応しています。
アノテーション代行:あらゆる非構造化データに対応し、弊社独自の品質管理によりデリバリー品質 を担保しています。ドメイン知識が必要な仕様にも対応可能です。
モデル開発支援:画像や動画の撮影条件や正確性/統一性を読み解きながらモデルの学習・評価を実施し、評価結果を精度向上につなげていきます。
FastLabel Data Factory:データ収集・管理、アノテーション、モデル開発までワンストップで提供するSaaSです。DataOps構築を実現し教師データ準備を大幅に効率化できます。

当社は各業界リーディング企業への豊富な支援実績を有し、権利クリアかつ高品質なデータ作成に強みを置いております。豊富な経験を通して培ったアノテーション仕様作成をはじめとしたAI開発のノウハウで、今後も多くのお客様を支援してまいります。

【当社の概要について】
社名:FastLabel株式会社
代表者:代表取締役CEO 鈴木健史
事業内容:Data-centric AI開発を支援するプロフェッショナルサービスとプロダクトの提供
設立:2020年1月23日
本社所在地:〒163-0224 東京都新宿区西新宿2-6-1 新宿住友ビル24階
URL:https://fastlabel.ai/

最近の企業リリース

トピックス

  1. “レントゲンのときのアレ”がカプセルトイ化! 光る「レントゲンライト」登場

    “レントゲンのときのアレ”がカプセルトイ化! 光る「レントゲンライト」登場

    病院で見かける“あの光る機械”が、手のひらサイズで再現された。カプセルトイメーカー・株式会社キタンク…
  2. たまごまみれのカップヌードル登場!「オムライス風の味」の新作を正直レビュー

    たまごまみれのカップヌードル登場!「オムライス風の味」の新作を正直レビュー

    5月12日、日清食品の「カップヌードル」に新商品「カップヌードル たまごまみれ ビッグ」が登場しまし…
  3. 石が集まるマルシェで1個2310円の“石菓子”食べてみた 「石味」の正体は意外な食材

    石が集まるマルシェで1個2310円の“石菓子”食べてみた 「石味」の正体は意外な食材

    石を愛する人々が集まるイベントで販売していた、石そのものにしか見えない不思議なお菓子「石菓子(いしが…

編集部おすすめ

  1. 実験の様子(画像提供:国立研究開発法人情報通信研究機構)
    仮想現実(VR)の世界で「自分が飛べる」と感じる体験をすると、高い場所に対する恐怖がやわらぐことが、…
  2. 偽・誤情報を何らかの形で拡散した人の割合
    総務省は5月13日、全国の15歳以上を対象に実施した「ICTリテラシー実態調査」の結果を発表しました…
  3. STARTOとYC社、チケット転売出品者への法的対応本格化 200名超に連絡開始
    STARTO ENTERTAINMENTは、公式サイトを2025年5月10日に更新し、同社契約タレン…
  4. 「鬼滅の刃」劇場限定予告が盗撮被害 公式が違法行為に警告
    5月9日より劇場公開を開始した「劇場版『鬼滅の刃』無限列車編」のリバイバル上映において、本編の最後に…
  5. 「こねこ便420」専用資材
    ヤマト運輸株式会社は、小型荷物向けの配送サービス「こねこ便420」について、2025年5月21日から…

【特集】STOP!ネット詐欺!

  1. さまざまなネット詐欺に潜入調査!

    さまざまなネット詐欺に潜入調査!

     インターネット上にまん延する、さまざまな詐欺サイトに「わざと」引っかかる潜入調査記事をまとめました。
ネット詐欺へ潜入調査!記事特集

提携メディア

ページ上部へ戻る