検索エンジンの世界では,この種の濫用を「ウェブスパム」と呼んでいる(この用語は,電子メールのスパムからの類推で作られたものである。ウェブ検索の結果を撹乱する迷惑なウェブページがあることは,電子メールの受信ボックスに迷惑なメールが届いているのとよく似ている)。すべての検索エンジンにとって,さまざまなタイプのウェブスパムを検出し,取り除いていくことは,継続的に進めなければならない重要な仕事である。たとえば,マイクロソフトの研究者たちは,2004年にちょうど1001個のページがリンクしているウェブサイトを30万以上も見つけた。これは非常に怪しげな動きである。これらのウェブサイトを手作業で調べてみたところ,そのリンクの大多数は,ウェブスパムであることがわかった。
そのため,検索エンジンはウェブスパマーとの知恵比べに否応なく巻き込まれており,リアルなランクを返せるように,たえずそれぞれのアルゴリズムを改良しようとしている。このようにページランクに改良圧力がかかっているために。アカデミズムでも業界内でも,ウェブのハイパーリンク構造を使ってページのランク付けをするほかのアルゴリズムの研究が数多く生まれている。この種のアルゴリズムは,リンクベースランキングアルゴリズムと呼ばれることが多い。
ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.64
PR