Japan

トップページ > 学ぶ(ヒストリー・サイエンス) > てくのろじぃ解体新書 > 「声デザイン」技術

「声デザイン」技術

ほしい音声を思いのままに

人工的に作り出した人の声でテキストを読み上げる「音声合成」において、低コスト・短期間で理想の声を簡単に作り出せる「声デザイン」技術。今後市場が格段に広がることが予想されるこの技術について、森田先生に教えてもらいました。

人の声を人工的に作り出す「音声合成」技術

ニャンダロー:知らない道を初めて運転したけど、カーナビが音声でずっと案内してくれて安心だったニャ。それにしても、全国にはたくさんの地名があるのに、全部を声で録音するのは大変そうですね…。

今回の先生 インダストリアルICTソリューション社 メディアインテリジェンス 商品推進部 森田 眞弘さん

森田先生:実はそうでもないんだ。カーナビの音声の多くは、人の声を人工的に作り出す「音声合成」という技術を用いて作られているから、人の肉声をすべて録音する必要はないんだよ。

ニャ:そうニャんですか!?あの素敵な声は人間ではなく機械だったということですね…。最近は声まで自動で作りだせるんですね。

先生:音声合成はスマートフォンの音声案内や音声応答、ニュースや書籍の読み上げといったインターネット上のさまざまなコンテンツで使われるようになり、合成音声を耳にする機会が急に増えてきた印象があるよね。でも意外にもその歴史は長いんだ。東芝は、1970年代に「総合研究所」(現在の「研究開発センター」)で研究を開始してから、脈々とその技術を受け継いできたんだよ。国内のカーナビに組み込まれた音声合成ミドルウェアでは、東芝が長年トップシェアを維持しているよ。

ニャ:そんなに前から研究してきたんですね!言われてみれば、昔から機械の声ってあった気がしますが、最近は本物の人の声のように自然になって、声の種類も多様になってきていますよね。

イメージ通りの声が作れる「声デザイン」技術

先生:そうだね。最近は各社がその分野に力を入れていて、技術の革新が進んでいるよ。中でも東芝の最新の「声デザイン」技術を使えば、数万種類の多様な声を低コスト・短期間で簡単に作り出せるんだ。

ニャ:そんなに多様な声を作れるんですか!?それだけあれば目的や好みにぴったり合った声がありそうですね。ん?でも数万種類の中からどうやって理想の声を見つけるのかニャ?

先生:まずパソコンなどの画面上でイメージに近いキャラクターのアイコンを選ぶか、「知的」「爽やか」「落ち着いた」などの声の印象を選ぶんだ。続いて、性別、年齢、明るさなどの声の特徴を示す7つの項目の数値をグラフ上で操作することで、イメージした声を直感的に作り出せるようになっているよ。(図1

ニャ:とっても簡単ですね!でも、形のないものだし、イメージ通りってなかなか難しいような…。

先生:各人が抱いている印象の通りに音声を変化させるために、開発では声の特徴を示す形容詞とその度合いを人によってぶれにくいものにすることに注力したんだ。まず、声の特徴を表す言葉を選定するために、声に関するアンケート結果を統計処理することによって「明るさ」「硬さ」「明瞭さ」などの代表的な形容詞を選択。選択した言葉を評価軸にした主観評価を行い、その結果からそれぞれの声の特徴を表すスコアを算出。さらに、スコア化された声のデータを分析することで、スコアと声の特徴の関係を統計的にモデル化したんだ。このモデルでは、話者による声の違いが「性別」「年齢」「明るさ」などの声の特徴を表わす要素ごとに分解されモデル化されているよ。(図2)こうして作り上げた統計モデルを元に、イメージ通りの特徴を持つ音声が合成できるようになったんだよ。

ニャ:ニャるほど。声の特徴という抽象的な部分をスコア化することで、理想的な声を作り出すことができるのですね。

図1 直観的にイメージを選び出せる操作画面
図2 声の特徴を表す要素

話者の音声からそっくりな声を作るカスタム音声辞書技術

先生:他にも、話者の音声から特徴をつかんで、その話者にそっくりな声を作り出せるカスタム音声辞書(似声)作成技術もあり、最近よく使われているよ。抑揚(声の高さの変化)、リズム(各音素の長さ)、声質(音声スペクトル、各帯域でのノイズの比率)などの声の特徴を話者の音声に合わせて自動で調整し、たとえばある有名人の声そっくりにすることもできるよ。その似声のモデルに「喜び」「怒り」「哀しみ」などの感情差分モデルを加えると、感情表現もできるんだ。このように多様な声を使える音声合成で、誰でも簡単にさまざまな音声コンテンツを作れるようになったことで、今後活用の場も大きく広がっていくことが期待されているよ。

ニャ:将来はいろんなところで、東芝の技術から生まれた音声が聞こえるようになるんですね。楽しみだニャ。先生、ありがとうございました。

関連リンク

てくのろじぃ解体新書 一覧へ

学ぶ(ヒストリーサイエンス)トップページ

東芝未来科学館 〒212-8585 神奈川県川崎市幸区堀川町72番地34 スマートコミュニティセンター(ラゾーナ川崎東芝ビル)2F

このページのトップへ