忍者ブログ

I'm Standing on the Shoulders of Giants.

読んだ本から個人的に惹かれた部分を抜き出します。心理学およびその周辺領域を中心としています。 このBlogの主な目的は,自分の勉強と,出典情報付きの情報をネット上に残すことにあります。書誌情報が示されていますので,気になった一節が見つかったら,ぜひ出典元となった書籍をお読みください。

   

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

ウェブスパムとの闘い

検索エンジンの世界では,この種の濫用を「ウェブスパム」と呼んでいる(この用語は,電子メールのスパムからの類推で作られたものである。ウェブ検索の結果を撹乱する迷惑なウェブページがあることは,電子メールの受信ボックスに迷惑なメールが届いているのとよく似ている)。すべての検索エンジンにとって,さまざまなタイプのウェブスパムを検出し,取り除いていくことは,継続的に進めなければならない重要な仕事である。たとえば,マイクロソフトの研究者たちは,2004年にちょうど1001個のページがリンクしているウェブサイトを30万以上も見つけた。これは非常に怪しげな動きである。これらのウェブサイトを手作業で調べてみたところ,そのリンクの大多数は,ウェブスパムであることがわかった。
 そのため,検索エンジンはウェブスパマーとの知恵比べに否応なく巻き込まれており,リアルなランクを返せるように,たえずそれぞれのアルゴリズムを改良しようとしている。このようにページランクに改良圧力がかかっているために。アカデミズムでも業界内でも,ウェブのハイパーリンク構造を使ってページのランク付けをするほかのアルゴリズムの研究が数多く生まれている。この種のアルゴリズムは,リンクベースランキングアルゴリズムと呼ばれることが多い。

ジョン・マコーミック 長尾高弘(訳) (2012). 世界でもっとも強力な9のアルゴリズム 日経BP社 pp.64
PR

bitFlyer ビットコインを始めるなら安心・安全な取引所で

Copyright ©  -- I'm Standing on the Shoulders of Giants. --  All Rights Reserved
Design by CriCri / Photo by Geralt / powered by NINJA TOOLS / 忍者ブログ / [PR]