
[画像: https://prcdn.freetls.fastly.net/release_image/49627/714/49627-714-6dffa81d2a60ad167073d650226aa040-1534x803.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
働き方を変えるDXサービスを提供するSansan株式会社は、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(以下、NEDO)が実施する、国内における生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」(※1)の第3期公募において、提案を行った事業「視覚接地した文書特化型視覚言語基盤モデルの構築」が助成対象として採択されたことをお知らせします。
本事業では、名刺・請求書・契約書などの書類をAIで読み取り、データ化する当社の技術をさらに進化させます。具体的には、既にサービスに実装している文書特化型生成AI「Viola」を発展させ、文字情報だけでなく、その位置や構造も把握できる新たなAIモデル「Cello」を開発。これにより、文書データ化の処理速度と精度を大幅に向上させることを目指します。既存のサービスをベースに開発を行うことから、社会実装の実現可能性が高く、自社のみならず日本全体のDXへの貢献が期待できるという点が評価されこの度の採択に至りました。早期に「Cello」をサービスに実装することで、業務効率化と労働生産性に寄与することを目指します。
■「GENIAC」採択の背景
Sansanは、提供する働き方を変えるDXサービスにおける名刺や請求書、契約書のデータ化を行うOCRシステムや生成AIを全て自社開発し、各プロダクトに実装しています。データ化する文書は、ビジネスシーンで活用するという特性上、限りなく100%に近い精度でデータ化する必要があり、創業以来社内の体制を強化し研究開発を続けてきました。現在は文書画像からの情報抽出に特化した社内基盤モデル「Viola」を実装していますが、新たに開発に取り組んでいる視覚接地機能を備えたモデル「Cello」では、さまざまな文書からテキスト情報とその位置情報を同時に抽出することが可能になります。これにより、既存のOCRシステムやデータ入力プロセスとのスムーズな統合が実現し、データ処理速度と信頼性の大幅な向上を見込んでいます。
この度のGENIACへの提案では、「Cello」の構築とプロダクトへの実装が、自社の事業へのインパクトのみならず、日本全体の生成AIの社会実装およびDX化を進めて行く大きな契機となりうるという点で高く評価されました。当社では、2025年の年間テーマとして「AIファースト」を掲げており、非連続な事業成長を目的としたAI活用を全社で推進しています。今回の採択により、事前学習やファインチューニングモデル(※2)の作成にかかるサーバー費用の助成を受け、「Cello」の開発を更に加速させ、早期にプロダクトに実装することを目指します。また、開発におけるノウハウの共有や論文発表などを通じ、国内の生成AI開発力の強化にも貢献していきます。
■採択の概要
公募事業名:ポスト5G情報通信システム基盤強化研究開発事業/競争力ある生成AI基盤モデルの開発(GENIAC)
当社提案名:視覚接地した文書特化型視覚言語基盤モデルの開発
提案概要:当社では、内製した生成AI「Viola」を活用した文書情報抽出において高い精度を有する実績を有しているが、抽出結果に空間的情報が含まれないため、補正処理においては従来通りOCRやレイアウト分析等を併用する必要がありました。そこで本事業では、「Viola」に空間的情報(バウンディングボックス等)を出力する機能を付加した「Cello」の開発に取り組みます。これにより、テキストの位置情報が明示され、既存システムとの連携が容易となるとともに、データ化工程の効率化、処理速度およびスケーラビリティの向上が期待されます。
採択結果公表ページ:https://www.nedo.go.jp/koubo/CD3_100397.html
※1:GENIAC(Generative AI Accelerator Challenge)
主に生成AIのコア技術である基盤モデルの開発に対する計算資源の提供や、データやAIの利活用に向けた実証調査の支援等を実施するプロジェクト。 計算資源の提供としては2024年2月から第1期が、2024年10月から第2期の開発支援が行われている。
URL:https://www.meti.go.jp/policy/mono_info_service/geniac/index.html
※2:既に学習済みのモデルの一部または全部を再学習し、特定のタスクやデータセットに合わせて調整する手法。
(以上)
■Sansan株式会社 会社概要
「出会いからイノベーションを生み出す」をミッションとして掲げ、働き方を変えるDXサービスを提供しています。主なサービスとして、営業DXサービス「Sansan」や名刺アプリ「Eight」、経理DXサービス「Bill One」、AI契約データベース「Contract One」を国内外で提供しています。
設立:2007年6月11日
URL:https://jp.corp-sansan.com/
所在地:〒150-6228 東京都渋谷区桜丘町1-1 渋谷サクラステージ 28F
資本金:72億30百万円(2025年5月31日時点)
事業内容:働き方を変えるDXサービスの企画・開発・販売
Sansan https://jp.sansan.com/
Eight https://8card.net/
Bill One https://bill-one.com/
Contract One https://contract-one.com/