− 研究開発の背景から教えてください。
|
木村: ブロードバンドの本格的な普及によって、マルチメディアの映像コンテンツが大量にあふれる時代となりました。あと数年のうちに商業サイトだけでなく個人でも、気軽に映像データをインターネットでやりとりする時代がやってくるでしょう。
そのため今度は、多量の映像データの中から欲しい映像をいかに素早く検索できるかが重要な課題となってきます。
しかしネット上で流通する映像は、ファイルのアイコンを見ただけでは、その中身全体を知ることはできません。アナログのビデオテープでも、すべてを早送り再生でもしなければ中身を知ることができないのと同じです。そこで、どうすればもっと簡単にコンテンツの中身を検索し、見たい情報にスピーディにアクセスできるかが今回の研究開発の大きなテーマとなりました。
|
藤田: この研究は中央研究所が平成元年に、当時通産省の国家プロジェクトの一環としてスタートさせたもので、当初は静止画やアナログ映像の検索を目的としていました。その後は日立独自の研究として進めてきましたが、その途中でISO/IECがマルチメディア・コンテンツの検索照合に用いる標準規格MPEG-7の規格化を進め、当社もこれに参画したことから、アナログ映像だけでなくMPEG映像にも対応した画像検索技術として改めて提案することになったものです。
|
− 検索技術の内容を、教えてください。
|
藤田: インターネットには、あるキーワードからその言葉を含んだWebサイトを探し出してくれる検索エンジンというものがありますよね。MPEG-7はそれと同様に、ある映像のイメージや音などから、それと同じか似通ったマルチメディアデータを高速に探し出すための規格で、特徴の記述方法についての国際標準化作業を行っています。本に例えると書誌情報――発行年月日やあらすじ、図書目録のようなものを作るものだと考えてください。
私たちが開発した映像検索技術では、映像の色と継続時間によって、その特徴をXMLの形で記述したファイルを作り、これをもとに検索を行います。具体的には1枚の画像を縦横8つのブロックに分割し、ブロックごとに平均色を求めます。次に、その色に変換・圧縮をかけ、1枚あたり8バイトのデータに落とし込みます。つまり、どんなに大きな画像でも、すべて8バイトのデータとして記述できるわけです。ここまでは既存の技術ですが、普通のテレビ放送なら1秒間に30枚の絵が送られてくるので、本来なら8バイト×30の特徴を映像が続く秒数だけ記述しなければなりません。
|
しかし、これではあまりにもデータが重くなってしまうため、日立では、似たような場面が続く場合には、それらの映像をひとまとめにして、そのグループの映像が何秒続くのかという特徴を記述する方法を提案しました。これにより、従来の約5分の1にまで記述量を低減させることができました。約1年分(365日×24時間)の映像の特徴記述ならCD-ROM1枚に蓄積できる計算です。
さらに検索する場合にも、照合のための計算量を減らすため、探し出したい映像のキーワードに相当する“カギ映像”の特徴量が変わる部分と、対象となる映像データベースの特徴量が変わる部分のみを直接比較するアルゴリズムを開発し、検索時間を従来の半分にまで減らすことに成功しました。
|

高速映像検索デモ画面例はこちらから
|