|
【技術分類】
A−6−(1) 検索トポロジーのWWWサーバ間構築
【技術の名称】
スコアリング
【技術内容】
本検索結果のスコア付けにtf-idf法を用いるサーバ同士が連携した場合、複数の検索サーバの検索結果を単にスコアの高い順にマージソートしたのでは正しいマージ結果を得ることは出来ない。そのようなことを避けるために、サーバ連携時には、2パスのスコア付けを行う次のようなサーバ間連携プロトコルが提案されている。Queryの要求を出すものをC(Search Client)、検索結果を返すもの(複数)をS(Search Server)とする。
(1)CはSにquery要求をする。その際検索結果と各キーワードの出願頻度も要求する。
(2)CはSにquery要求のキーワード、およびすべてのSからのキーワードの出願頻度の総和を渡して、再スコアリングを要求する。
(3)Cは2で得られたSからの結果をマージする。
(4)もしパス2のレスポンスが非常に遅い場合には、暫定的なスコア付けでソートを行い結果を提示する。
このようにすることで、tf-idf法を用いて複数サーバからの検索結果を利用しても正しいスコアリングを得ることが出来る。
【図】
図 スコアリングを行うサーバ間連携プロトコル

出典:「モーバイルエージェントを用いた連携検索システムの実装に関する検討」、「情報処理学会シンポジウムシリーズ Vol.2000 No.7」、(2000年6月28日)、國頭吾郎、相澤清晴、森川博之、青山友紀著、(社)情報処理学会発行、158頁 図1 サーバ間連携プロトコルの流れ
【応用分野】
【出典/参考資料】
「モーバイルエージェントを用いた連携検索システムの実装に関する検討」、「情報処理学会シンポジウムシリーズ Vol.2000 No.7」、(2000年6月28日)、國頭吾郎、相澤清晴、森川博之、青山友紀著、(社)情報処理学会発行、157頁〜162頁
【技術分類】
A−6−(1) 検索トポロジーのWWWサーバ間構築
【技術の名称】
同一キーワードによるリソース間リンク
【技術内容】
このシステムでは、Webロボットによって、WWWデータを収集するのではなく、検索対象(リソース)が持つキーワードに注目して、同一のキーワードを持つリソース間に専用のリンクを張り、Ingridトポロジーと呼ばれる検索のためのトポロジーを構築する。このトポロジーを構築する部分が、従来のWebロボットによるWWWデータ収集部分に相当する。即ち、検索に前もって検索用のトポロジーを構築しておき、検索の段階で、これまでのWebロボットが行っていたような巡回により検索結果を見つけるという方法をとる。検索自体をIngridトポロジー内で分散させているといえる。
【図】
図 同一キーワードによるリソース間リンク

出典:「インターネット広域分散協調サーチロボット」、「Computer Today No.87 9月号」、(1998年9月1日)、山名早人著、(株)サイエンス社発行、9頁 図8 Ingridの仕組み
【応用分野】
【出典/参考資料】
「インターネット広域分散協調サーチロボット」、「Computer Today No.87 9月号」、(1998年9月1日)、山名早人著、(株)サイエンス社発行、4頁〜9頁
|