[画像1: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-994248342c20dd924b3c0f3d65675e23-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Visual Bank株式会社(東京都港区、代表取締役CEO:永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)やNLP、LLMなどの音声・言語系AI開発に利用される「日本語・1話者・児童書・童話・絵本・昔話テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。
本データセットは、児童書や童話、絵本、昔話といった子ども向け物語を、日本人話者一名が朗読する形式で収録した日本語音声と、その発話内容を忠実に反映したトランスクリプトで構成されています。登場人物の心情や物語の展開を伝えることを意識した自然な朗読発話が含まれており、読み上げ特有の抑揚や間の取り方、文脈に応じた発声が記録されています。
単一話者による長時間の朗読音声がまとまった形で収録されているため、発話者条件を固定した音声認識モデルの検証や、物語文脈を伴う長文テキストを扱う言語モデルの学習・評価に利用することが可能です。音声とテキストが対応付けられていることから、音声認識モデルの学習だけでなく、音声と言語を横断するマルチモーダルな検証用途にも適しています。
Qlean Datasetでは、研究開発段階から商用展開を見据えたAI開発において安心して利用できる学習データの提供を行っており、本データセットもその一環として、音声・言語系AIの基盤的な検証や精度評価を支援します。
今回提供を開始する「日本語・1話者・児童書朗読音声データセット」の概要
[表1: https://prtimes.jp/data/corp/108024/table/139_1_d0294cda616ef21d7e12d7b1021ecd2a.jpg?v=202602160145 ]
「日本語・1話者・児童書朗読音声データセット」のユースケースイメージ
【研究用途】
- 音声認識モデルにおける朗読音声の認識精度検証児童書や童話の朗読音声を用いて、ASRモデルが物語文脈を伴う読み上げ発話をどの程度正確に文字起こしできるかを評価する研究に利用できます。単一話者条件のため、発話内容や文構造に起因する誤認識の分析が可能です。- 長文コンテキストを扱う言語モデルの理解検証物語形式の連続したテキストを用い、LLMが物語の流れや登場人物の関係性をどの程度保持・理解できるかを検証する研究用途に利用できます。
【産業用途】
- 音声読み上げAI・ナレーション生成モデルの評価児童向けコンテンツを想定した音声読み上げAIにおいて、物語調の自然な発話表現をどのように再現できているかを確認するための評価データとして利用できます。- 音声入力を伴う対話型AIの基礎検証物語朗読音声と対応するテキストを用い、音声入力を起点とした対話・応答処理の検証や、音声と言語を統合した処理パイプラインの検証用途に利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup
[画像2: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-92f2316c95e76a44d2c3015bc59c0a39-1813x1116.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像3: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-c7986b2cab3223b7d435ebc8ecf18ff0-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像4: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-d1057f432188d5cbebd0a0bffc6395cc-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像5: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-13409d3ab56e2d4a442bb656ef2dfd95-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴
- すべての被写体から同意取得
- 既存データは最短1日で納品可能
- カスタム撮影・収録・収集による独自データ構築にも対応
お問い合せ
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL:https://amanaimages.com/about/
[画像6: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-9bbd597e245d756820877b0e6e9bcf80-1200x630.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Qlean Dataset Launches a Japanese Single-Speaker Children’s Story Read-Aloud Audio Dataset with Transcripts
Narrative Read Speech Data for ASR, Language Models, and Educational AI
Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai), through its subsidiary amanaimages Inc., has released a new dataset under its AI training data solution, Qlean Dataset.
The dataset is a Japanese single-speaker read-aloud speech corpus based on children’s books, fairy tales, picture books, and traditional folk stories.
It includes Japanese audio recordings in which one native Japanese speaker reads children’s stories aloud, along with transcripts that accurately match the spoken content. The recordings capture clear, natural narration that reflects story flow and characters’ emotions, including pacing, pauses, and expressive intonation typical of read-aloud speech.
Because all recordings are produced by a single speaker and include long-form narrative content, the dataset can be used to evaluate speech recognition models under consistent speaker conditions and to train or assess language models that process extended, story-based text. The aligned audio and text also make the dataset suitable for testing workflows that combine speech and language processing.
Qlean Dataset provides training data designed for use from research and development through to commercial AI applications. This dataset supports basic validation and performance evaluation for speech- and language-based AI systems, including ASR, NLP, and LLM-related use cases.
Dataset Overview: Japanese Single-Speaker Children’s Book Read-Aloud Speech Dataset
[表2: https://prtimes.jp/data/corp/108024/table/139_2_955a1c057ccb32c88f639bb0751e049f.jpg?v=202602160145 ]
Use Case Examples for the Japanese Single-Speaker Children’s Book Read-Aloud Speech Dataset
Research Use Cases
- Evaluation of ASR Performance on Read SpeechThe dataset can be used to evaluate how accurately ASR models transcribe narrative-style read speech with story context. Because the recordings are produced by a single speaker, researchers can focus on analyzing recognition errors related to linguistic structure and content rather than speaker variability.- Assessment of Language Models Handling Long-Form Narrative ContextBy using continuous story-form text, researchers can evaluate how well language models retain context, understand narrative flow, and track relationships between characters across extended passages.
Industrial Use Cases
- Evaluation of Text-to-Speech and Narration ModelsFor speech synthesis systems designed for children’s content, the dataset can serve as evaluation data to assess how naturally narrative-style speech and storytelling expressions are reproduced.- Foundational Validation for Voice-Enabled Conversational AIBy combining read-aloud speech and aligned text, the dataset supports testing dialogue and response pipelines that start from speech input, as well as integrated processing workflows that bridge speech and language components.
About Qlean Dataset
Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.
Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”
By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.
▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en
▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineu
[画像7: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-9f9f800ddc0442c0bd0110e1ecc6c6a6-1813x1116.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像8: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-df6e1fe622a9aaa918b4548981145693-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像9: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-77e92955d2aa51c60d2455fcdde21326-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
[画像10: https://prcdn.freetls.fastly.net/release_image/108024/139/108024-139-c50731d3a171fbf91968f36bfface00d-960x540.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
Key Features of Qlean Dataset
- Existing datasets deliverable within one business day
- Custom data collection and recording services available
Contact
About Visual Bank Inc.
Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.
Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.
CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo
Corporate Site: https://visual-bank.co.jp/en
Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview























