はてなホッテントリでSEOブーストかかってるっぽいサイトを見分ける

はじめに

「はてなのホッテントリがつまらなくなった論」について思うこと

最近はてブ周りの話がちょっと盛り上がってたので備忘録的に
前書いたエントリの

残念なはてブランキングを何とかしたい - システムアーツ@はてな
はてブSEOの話 - システムアーツ@はてな

「残念なはてブランキングを何とかしたい」の時に作ったphpのソースを公開しておく

php動かすマシンとはてなのサーバー両方に負担がかかるのであんまり乱用しないよう注意してください
なのでプライベートな場所で時々動かしてニヤニヤする程度に止めておくのがいいでしょう

以下ソース

//ホッテントリRSS読み込み
$GridData = simplexml_load_file('http://b.hatena.ne.jp/hotentry.rss');

if (!empty($GridData)){
    foreach($GridData as $record){
        //コロンで区切られた要素を取得
        $node = $record->children('http://www.hatena.ne.jp/info/xmlns#');
        $intBookmarkcount = (int)htmlspecialchars($node->bookmarkcount);

        if ($intBookmarkcount < 1000){
            echo '<br />';
            //リンク
            echo '<a href='.$record->link.'>'.$record->title.'</a>';
            echo '<a href='.'http://b.hatena.ne.jp/entry/'.$record->link.'>'.'('.$intBookmarkcount.')'.'</a>';
            
            $LinkTest = $record->link;
            $intCount = 0;
            $intComment = 0;

            // はてブの情報取得
            $hatena_json_uri = 'http://b.hatena.ne.jp/entry/jsonlite/?url='.rawurlencode($LinkTest);
            $result = file_get_contents( $hatena_json_uri );
            $h_r_a = json_decode($result);

            // サムネイル画像のアドレス(string 型)
            #echo $h_r_a->screenshot.'<br />';

            // はてブ数(string 型)
            #echo $h_r_a->count.'<br />';

            // ブックマークユーザー分だけ、ループを回す
            if (!empty($h_r_a->bookmarks)){
              foreach ($h_r_a->bookmarks as $val_entry) {
                //公開ブクマ数
                $intCount += 1;

                if (!empty($val_entry->comment)){
                    //コメントユーザー数
                    $intComment += 1;

                    // ユーザー名(string 型)
                    #echo $val_entry->user.'<br />';

                    // コメント(string 型)
                    #echo $val_entry->comment.'<br />';
                }
              }
            }
            $intLock = ((int)$h_r_a->count - $intCount);
            echo '<table border="1">';
            echo '<tr>';
            echo '<th><kbd>総ブクマ数</kbd></th>';
            echo '<th><kbd>公開</kbd></th>';
            echo '<th><kbd>非公開</kbd></th>';
            echo '<th><kbd>非公開率</kbd></th>';
            echo '<th><kbd>コメント率</kbd></th>';
            echo '</tr>';
            echo '<tr>';
            echo '<td>'.number_format($h_r_a->count).'</td>';
            echo '<td>'.number_format($intCount).'</td>';
            echo '<td>'.number_format($intLock).'</td>';
            echo '<td>'.number_format(($intLock / (int)$h_r_a->count)*100, 2).'%</td>';
            echo '<td>'.number_format(($intComment / (int)$h_r_a->count)*100, 2).'%</td>';
            echo "</tr>\n";
            echo "</table>\n";
        }

    }
}

蛇足的な解説

今見てもあんまり変わってないなーって言う印象
非公開率が30%に近いほどクロ。シロのエントリでも10〜15%くらいあるので15〜20%がブースト用のアカウントだと思われる。非公開数200超の物もあるのでSEO業者は軽く見積もって100個以上のアカウントを動員できてる事になる。
コメント率は10%を切るとグレー、5%切るとほぼクロと言って良い。最近はなんかの連携機能か、タイトルや本文がブクマコメントに入ってる物もあるがまだ誤差の範囲内。ブクマコメントで盛り上がってるエントリとの区別は容易。
非公開率とコメント率を合わせて判断すると結構な確率でSEOブーストエントリの判断ができるんじゃないだろうか

クックパッドとか料理系のエントリは個人的にはシロだと思ってます。これは純粋にはてな社の営業努力で純粋にソーシャルブックマークとして使う女性層が増えた結果かと。