[画像: https://prcdn.freetls.fastly.net/release_image/3442/6511/3442-6511-5c8d6a4e984584ac439831f6367412d4-1600x800.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
パナソニックR&Dカンパニー オブ アメリカ(以下、PRDCA)およびパナソニック ホールディングス株式会社(以下、パナソニックHD)は、UCLAの研究者らと共同で、拡散モデルを用いたマルチモーダルAI(※)「LaViDa」を開発しました。
近年、マルチモーダルAIは大規模言語モデルの成功を取り入れたモデル大規模化により性能を高めてきましたが、従来の自己回帰型による文章生成では文章量が増えるにつれ、生成時間が増加することが課題でした。今回開発したLaViDaでは、文章の生成を拡散モデルで行うことで生成のスピードを可変にすることが可能になり、既存の自己回帰型手法と同等精度で約2倍の高速化を達成しました。
本技術は、先進性が国際的に認められ、AI・MLのトップカンファレンスであるNeurIPS 2025に採択されました。2025年12月3日から2025年12月5日までアメリカ、サンディエゴで開催される本会議で発表します。
■今後の展望
今回開発したLaViDaは拡散モデルを用いて文章生成を行うマルチモーダルAIです。現在、パナソニックグループでは全社的な業務効率化・自動化を目的としたAIエージェントの導入を進めていますが、各現場に存在する様々な形式のドキュメントや資料は必ずしもAIエージェントにとって理解しやすいものではありません。本手法を用いて統一されたフォーマットに整形することでAIエージェントの導入を加速したいと考えています。
今後もパナソニックHDは、AIの社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進します。
※画像、テキストなど複数の種類の情報を同時に扱えるAIのことを指す
全文は以下プレスリリースをご覧ください。
▼[プレスリリース]パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発(2025年11月27日)
https://news.panasonic.com/jp/press/jn251127-2
<関連情報>
・arXiv
https://arxiv.org/abs/2505.16839
・Panasonic×AI ウェブサイト
https://tech-ai.panasonic.com/jp/
・Panasonic×AI X
https://x.com/panasonic_ai























