ヘッダをスキップ   IT(情報・通信)総合サイト Japan Site

ナビパラ.コム日立トップページへ


ここからグローバル・ナビゲーション |  ホーム  |  ソリューション  |  イベント・セミナー  |  IT情報  |  経営情報  |  ナビパラ通信  |   コラム  |グローバル・ナビゲーションここまで

    会員登録登録内容確認/変更退会    サイトマップ    お問い合わせ
検索 by Google

 > 詳細な検索


コラム

ここからブレッド・クラム ホーム > コラム > 開発者に聞く > バックナンバーブレッド・クラムここまで

ページタイトル

開発者に聞く



ここから本文
 
このコーナーでは、日立製作所の研究所等で研究・開発を行っている技術テーマを中心としたコラムをお届けします。 研究員にインタビューを行い、技術テーマ解説・開発過程におけるエピソードなどを交えてわかり易くご案内いたします。
データを更新しても検索速度を低下させない
ハードディスク向けの知的データベース管理技術
■ データの書き換えを繰り返しても検索速度を低下させない

− ミュージックプレーヤーやデジタルビデオレコーダーなど、パソコン以外のところでもハードディスクが使われるようになってきました。今回の技術は、そのような場面で大いに役に立ちそうですね。
伊藤: はい、ミュージックプレーヤーや携帯電話、カーナビなどの携帯機器やデジタルビデオレコーダーのような情報家電は急速に高機能化が進んでいます。また大容量ハードディスクの価格が下がってきたため、これら携帯機器や情報家電でも多量の情報を扱えるようになりました。ハードディスクはCDやDVDといった従来のストレージと比べて高速であり、さらに書換えができるというメリットがあります。そこでこれら携帯機器や情報家電でも最新の情報を扱えるよう、ハードディスク上のデータを高速に処理することが求められています。しかし既存の技術では、こうした要求に応えることが非常に難しいのです。特に、書き換えによって検索性能が低下していくことが大きな問題になります。
 従来のデータ管理方式を単純にハードディスクに適用したのでは、更新データがハードディスク上の空き領域へ随時書き込まれていくため、しだいに関連性の高いデータがバラバラに離れてしまう、専門的に言えば「断片化」した状態になってしまうのです。ハードディスクはデータを読み込む際、目的の場所までヘッドを動かす「シーク」と、実際にデータを読み込む「リード」という動作を繰り返し行っています。データ読み込みではシーク時間の割合が大きいため、断片化が進み関連のあるデータを読み込む際に何度もシークしなければならなくなると、検索速度が低下してしまいます。
− PCでいうなら空き領域の断片化を解消する“デフラグ”が必要な状態ですね。
伊藤: はい、ですから高速なデータ読み込みには、シークの回数をいかに少なくするかが重要なポイントです。しかし携帯電話やカーナビを使っているときにデフラグをしていただくわけにはいきませんよね。そこで新たに開発したのが、データの識別情報(ID)を利用した「初期データの分散配置技術」と、関連データをハードディスク上の近い領域へ配置する「データ更新技術」です。
図1 地図データの管理方法
図1 地図データの管理方法
※クリックして拡大図をご覧下さい
 携帯機器や情報家電で扱うデータは、大抵は関連のあるデータのグループに分けられます。例えばミュージックプレーヤーで扱う音楽データであればアーティスト名やアルバム名をIDとしてグループに分けられますし、携帯電話やカーナビで扱う地図データでは地図を区画に分けて管理するので区画番号をIDとしてグループに分けられます。さらに、これらのグループは一気に読み込まれることが多いのです。音楽を聴くときは同じアルバムの曲を続けて聴くことが多いですよね。地図データでは検索を行うときに同じ区画の中のデータをまとめて読み込みます。例えば区画番号が12番の区画に教会とコンビニ、ガソリンスタンドがあるという場合には、それらにはすべて12番という区画番号が付与されています。そこで「これから進む経路の近くにあるコンビニを探したい」といった検索を行うときには12番の区画の中のデータを一気に読み込んで目的のコンビニにたどり着くわけです(図1)。
 このような同じグループ内のデータを一気に読む場合は、それらのデータを連続領域に配置しておけばシーク回数を最小限に減らせます。この考え方自体は従来からありましたが、データの更新がまったく考慮されていませんでした。これに対しわれわれは、各領域に追記データを書き込むためのスペースをあらかじめ設けておく「初期データの分散配置技術」を開発しました。さらに、1番の追記データは1番のすき間に、2番の追記データは2番のすき間にというように、同じIDを持つ初期データと連続する空き領域に自動的に配置する「データ更新技術」をあわせて開発しました(図2)。
図2 重複ID近傍配置表
図2 重複ID近傍配置表
※クリックして拡大図をご覧下さい

■ 組み込みデータベースで追記場所を正確に管理

− 確かにその方法ならハードディスクの断片化を防ぐことができますね。
伊藤: 最初から用意されていたすき間を使い切った場合でも、同じIDを持つデータ全体を、後ろの空いている場所に全部移動してしまうことによって連続性を保ちます。この、各IDのすき間の場所を正確に把握して細かなデータ更新をスピーディに実現できた理由は、データ管理に組み込みデータベースを適用しているからです。
林: 本システムのプロトタイプでは、日立の「Entier」を使いました。Entierは定評あるHiRDBの技術とノウハウを継承した、軽量で高速、高信頼な組み込み型リレーショナルデータベースです。データベースエンジンとしてのメモリー量が少なくてすむため、同じIDを持つデータを大きな単位で読み込んでも快適に動作しますし、何よりも信頼性が高い。例えば、データ更新中に機器の電源が遮断されても、すぐに前の状態に戻すような機能もあります。
 また、今回のプロトタイプでは、データ量が多く検索も複雑な地図データを題材にしました。
 私が所属する知能システム研究部では、以前からGIS(地理情報システム)や地図情報システムなどの研究開発を担当しています。Entierの開発時にも地図情報システムへの応用を考え、現在位置から半径100メートル以内のお店の情報を取ってくるといった「空間情報検索」という機能を提案しました。以前、HiRDBを用いた地図情報システムを開発した際に蓄積したノウハウが、今回の技術開発の大きなベースとなっています。
伊藤: 私の所属するプラットフォームシステム部には主に大規模なデータベース向けの基本的な検索技術や高速化、高信頼化の技術がありました。しかし、携帯機器や情報家電向けに使いやすいデータベースを作るためにはその道の専門家じゃないと分からないことがあるんですよね。つまり、Entierを開発したソフトウェア事業部のノウハウと、中央研究所で地図を担当しているセクション、データベースを専門にやってきたセクションが密接にコラボレーションできたことが、今回の開発につながったのだと思います。発想自体は非常にシンプルなんですが、日立ならではのグループ力と連携が、他社に先行して開発できた一番の要因でしょう。

■ 幅広い分野で使い勝手のいいデータベース管理システムを提供できる

− これらの技術によって、検索速度性能を維持したままでの随時書き換えを可能にしたわけですね。
伊藤: 効果を確認するため、3年間分相当のデータ更新を加えた後に、さまざまな検索の所要時間を計測する実験を行いました。その結果、本技術を適用していない場合に比べ、検索所要時間が約3分の1以下となることを確認しました。体感的に言うならば、ボタン操作をした瞬間、反応がピッと返ってくるようなイメージです。ここでワンテンポのタイムラグがあるのとないのとでは、気持ちよさがかなり違ってくるでしょうね(笑)。
− 今後の展開は。
林: 今回開発した技術は、Entierと組み合わせることで、音楽や地図のデータベースだけではなく、デジタルカメラの写真データや、ビデオレコーダーの映像データといった分野にも適用できると考えています。例えばデジタルカメラのメーカーがこの技術を導入すれば、写真管理プログラムの開発効率が大幅にアップし、開発コストを下げることができます。また、より高速な通信インフラを活用することで、企業の基幹システムと組み込みシステムとのスピーディなデータ連携を図り、データ活用の幅を一段と広げることも期待されています。そのためにも、本技術のさらなるブラッシュアップと、日立グループ一丸となったソリューション開発に取り組んでいきたいと思います(図3)。
図3 今後の展開 ITシステムとの連携
図3 今後の展開 ITシステムとの連携
※クリックして拡大図をご覧下さい
− これからの展開が楽しみですね。本日はどうもありがとうございました。
[ Back ] 2 / 3 [ Next ]
本文ここまで


ここからローカル・ナビゲーション
開発者に聞く
ここから1つ下の階層
バックナンバー

ITウオッチング

モノがたり
ローカル・ナビゲーションここまで



イベント・セミナー

助成金・補助金

税金Q&A




ページトップへ

 
ここからフッタ  | サイトの利用条件 | 個人情報保護に関して | 商品名称について | 推奨環境 | 当サイトへのリンクについて |フッタここまで

© Hitachi, Ltd. 2001, 2008. All rights reserved.