BBRK 04-04-22


はてなアンテナロボット、巡回頻度

はてなアンテナ」のデータ取得ロボットは、UAをフェイクする悪い子だ(笑)、というのを BBRK 04-04-07 で記事にしましたが、今回はどのくらいの頻度でデータ取得を行っているのかについて当サイトでの実測データを元にまとめてみました。

今回集計してはっきり判ったことですが、ページによって、ロボットのチェック頻度がずいぶん異なるということです。公式には はてな質問箱 はてなアンテナについて にて「現在1時間に1回の頻度でチェックをしています。」とアナウンスしていますが、全てのページがそうではない、ということですね。

サンプルとして、BBRK気になる新譜 をチョイス。はてなアンテナ関連サーバの東京移転後しばらく不安定だったりしましたが、安定稼働状態へ完全に遷移したと思われる今週頭 4/19〜21 の 3日間におけるアクセスログから集計。時間毎のアクセス数を計算し、表にしてみました。

まずは BBRK


01234567 8910111213141516 17181920212223合計
4/19 22323043 15022402 12121200 44
4/20 02020122 02013431 31420402 39
4/21 04030212 02021202 03151320 36
平均 13121122 03022312 12231311 40

次に 気になる新譜(平均値は省略)。


01234567 8910111213141516 17181920212223合計
4/19 10000001 00100000 01000100 5
4/20 01000001 00100000 01000110 6
4/21 01000001 00100000 00100100 5

この差はいったいどこから?

予想されるアルゴリズム
・そのページが登録されている「はてなアンテナ」の数が多いページほどチェック頻度が高い。
・更新頻度の高いページほどチェック頻度が高い。

アルゴリズムは未公開なため、この予想の検証は不可(笑)


BBRK に戻る