− 携帯電話のカメラを使って、印刷されたURLや電話番号を読み取る技術はすでに実現されています。しかし日本語の認識は、あまり聞いたことがありません。
|
古賀: アルファベットや数字などはだいたい100字程度ですが、日本語の場合は漢字と仮名を合わせて約4000字もあり、単純に考えれば処理時間もメモリーも40倍必要な計算になります。ですからこれまで、限られたメモリー容量しかない携帯電話の中で日本語の文字認識を行うのは非常に困難だったのです。そこで私たちは、より高速で省メモリーの日本語文字認識エンジンを開発し、この課題をクリアしようと考えたのです。
|
− どのようにして小さなメモリーサイズに納めることができたのでしょう。
|
嶺: Discriminative Feature Extraction法という従来からある統計的学習理論に基づいて、文字の特徴抽出と判別関数、双方のパラメータを同時に、認識の誤りが最少となるように最適化する方法を考案しました。この手法を漢字認識に適用したのは日立が初めてだと思います。これにより、従来の方法なら数MBから数十MBほど必要とされていたメモリーを700kBという、携帯電話に搭載できる業界最小サイズに納めることに成功しました。携帯電話向けの標準プラットフォームで動作するため、幅広く使っていただくことができます。
|
− 漢字認識に成功したのも今回が初めてなのですか。
|
古賀: これまでも携帯電話上で漢字を“読む”技術はありました。ただそれは、単に漢字を「文字」として読むだけで、「単語」としては認識できない。つまり『新しい研究所を作る』という言葉をカメラで読み取っても、そこから「新しい」「研究所」「作る」といった単語は抽出できず、国語辞典などで意味を調べるには、読み取られた文字の前後を手動で消していく作業が必要でした。
ところが今回は、カメラで撮った文字列から漢字や仮名の単語を自動的に抽出して、認識できます。文字認識本体のメモリーが小さくなった分を利用し、単語辞書を載せることで、こうしたことが実現できました。また、縦書き・横書きも自動判定が可能であり、使い勝手がよくなるよう、工夫しています。
日立には、帳票処理や郵便区分機などで文字認識に早くから取り組んできた歴史があります。また、カメラで文字認識するための研究も1998年頃からスタートしていました。こうした長年の技術やノウハウの蓄積が、今回の技術に大きく生かされているのです。
|