Japan

トップページ > 学ぶ(ヒストリー・サイエンス) > てくのろじぃ解体新書 > 手書き文字認識技術

手書き文字認識技術

すらすらと入力できる

キーボードやマウスの代わりに、手書きでPCやスマートフォンなどの電子端末に入力できる手書き文字認識技術は、日々進化し続けています。今回は、その仕組みと最新の動向を研究開発センターインタラクティブメディアラボラトリーの登内(とのうち)先生に教えてもらいました。

文字認識技術は大きく分けると2種類

ニャンダロー:皆さんこんにちは!手書き文字認識技術って、携帯ゲーム機の普及などで私たちには身近に感じる技術だけど、実際はどんな仕組みなのかニャ?先生教えてください。

今月の先生 研究開発センター インタラクティブメディアラボラトリー 登内 洋次郎さん

登内先生:ニャンダローくん、こんにちは。文字認識技術には2種類あるんだ。ひとつは紙に筆記されたり印刷された文字をスキャンして画像データとして認識するOCR(Optical Character Recognition)技術で、これは郵便あて名自動読取区分機などで使われているよ。そしてもうひとつがPCやスマートフォンの画面上に指やペンで直接入力された筆跡から認識するオンライン文字認識技術だね。今日は後者について説明していくよ。

まず、オンライン文字認識技術は、1990年頃にPCをキーボードやマウスを使わずにペンで操作・入力したいという強いニーズから開発が始まったんだ。当時の入力システムは、PC画面上に複数の文字入力枠があり、ひとつの枠の中にひとつずつ順番に文字を筆記するというもの(図1)。別の枠に次の文字が書かれ始めた時点で、ひとつ前の文字の記入が終わったと判断して認識処理され、ユーザーは次々に入力することができたんだ。枠がなくて自由に書かれた文字は、どこまでが1文字なのかが明確にわからないし、日本語の「語」という字のように、へんが「言」でつくりは「吾」と、複数から成り立つ文字もあるから、当時は「枠あり式」が一般的だったんだ。この文字入力枠をなくして、自由に書ける「枠なし式」が広まってきたのは最近だね。

手書き文字認識技術はこの3種類 図1 1枠に1字ずつ文字を書く「枠あり式」 図2 「枠なし式」ではどう文字認識する?図3 「重ね書き文字認識」のしくみは?

レグザタブレットに使われる「枠なし式」

ニャ:枠がないと、文字と文字の切れ目はどうやって判定しているのかニャ?

先生:文字を何通りにも切り出し、それぞれを掛け合わせて、もっともらしい組み合わせの候補を選んでいるんだ。詳しく説明すると、まず図2のように、書かれた文字列をいろいろな切れ目で切り出す。その後、1字ずつ認識処理をするんだけど、この認識処理がすごいんだ。例えば「し」という字は、書く人によって「レ」や「L」に読める時があるよね。それぞれの手書き文字の平均パターンを辞書として持っておき、その辞書の文字と実際に入力された手書き文字を比較して評価値(スコア)を付けているんだ。一番似ているものはスコアも高くなり、スコアが高い組み合わせが一番良い組み合わせになるけれど、それに文字を構成する各パーツの大きさも加味して、文字のつながりやすさや言語的な前後関係をみて、認識精度を上げているんだよ。もちろん、文字の認識処理には東芝がOCRで培った技術も使われていて、最近では、レグザタブレットでもこの技術が使われているよ。

ニャ:レグザタブレットにこの技術が使われていることは知らなかったニャ。他にもスゴイ文字認識技術があるんですか?

小さな画面には「重ね書き文字認識技術」

先生:東芝独自の「重ね書き文字認識技術」があるよ。これは、携帯電話やスマートフォンなどの小さな画面に入力する時に使われる技術。先ほどの「枠なし式」は携帯電話やスマートフォンのような端末では処理が重いので向かず、「枠あり式」は小さな画面に枠を複数入れると書きづらいし、枠をひとつにすると1字書き終わるごとに一定の処理時間を空けなければいけないから、どちらもすらすらと文字を入力できなかったんだ。これを解決したのが、「重ね書き文字認識技術」なんだ。文字を同じ場所に連続して重ね書きすることができて、一画入力するごとに認識結果が出力されるんだ(図3)。携帯電話の入力予測候補や、かな漢字変換も加えると、キーボードのタッチタイピングのように、手元を意識せずに文字をすらすらと入力できるようになる。さらに、スペースや変換、バックスペースなどの指を使ったジェスチャー機能もついているから、最小限の指の移動で操作することができるんだ。ニャンダローくんも試してみる?

「枠なし式」でもサクサク入力できる!

ニャ:ウニャ〜!!!こんなにすらすらと入力できるなんて驚きました!

先生:最近はタブレットが次々と発売されているから、これからも手書き文字認識技術は進化していくだろうね。オフィスではキーボード入力だけど、外では手書き入力など使い分けるといいんじゃないかな?

ニャ:こんなにサクサク入力できるんだったら、手書き文字入力もどんどん使っていきます。さーて、まずはタブレットを買いに行こうかニャっと。

関連リンク

てくのろじぃ解体新書 一覧へ

学ぶ(ヒストリーサイエンス)トップページ

東芝未来科学館 〒212-8585 神奈川県川崎市幸区堀川町72番地34 スマートコミュニティセンター(ラゾーナ川崎東芝ビル)2F

このページのトップへ