カテゴリ 'シムエントリ' の記事一覧
【シムエントリ】結果一覧の表示条件を改善しました
シムエントリご利用の皆様へ、2つのお知らせです。
2008年8月13日の更新分から適用されます。
■RSS広告系のエントリを表示しないようにしました
RSSフィードの中に広告が含まれているものがありますが、これを結果に表示しないようにしました。
今回の対応では、
・タイトルの行頭に「PR:」とつくもの
・タイトル内に「スポンサーサイト」とつくもの
の2つが対象となります。今後も対象のものを増やしていく予定です。
もし「これが対象になっていない!」というものがございましたら、コメント欄で指摘いただけますと助かります。
■同じサイトを2回以上表示しないようにしました
記事の関連性があっても、同じサイト(ブログ)が2つ以上列挙されることがありました。
理屈としては間違っていないのですが、「新しいブログを見つけるきっかけ」としてのブログパーツの魅力が少し減ってしまうのではないかと思い、同じサイトを2回以上表示しないようにしました。
そのため、ブログパーツに表示されるサイトは、3つとも違うブログが表示されることになります。
RSSフィードの登録、およびパーツの貼り付けも引き続き行っております。下記からどうぞ。
http://se.koemu.com/
【シムエントリ】[解消しました]類似記事が1件より多く表示されておりません
シムエントリをご利用の皆様へお知らせです。
2008年8月12日 8:45 以降に更新された類似記事データより、類似記事がどの記事も1件より多く表示できない状態となっております。
現在、プログラムを修正し、類似度の再計算を行っております。再計算が完了し次第、正常に戻る予定でございます。
ご利用いただいている皆様にはご迷惑をおかけし、恐縮です。
2008年8月13日 1:00
2008年8月11日のデータに戻して、最大3件表示できるように仮復旧しました。再計算は継続して進めており、こちらが完了し次第完全復旧となります。
2008年8月13日 4:00
問題は解消し、現在は正常に稼働しております。
【シムエントリ】類似度の評価バランスが変わりました
シムエントリご利用の皆様へ、2つのお知らせです。
■TFの値にlogを取るように
本日より、記事中の単語毎の語数(出現頻度)(=TF)と他の値を組み合わせて計算する際、TFの値にlogを取るようにしました。
これにより、類似記事の検索結果が変化いたします。
今までは類似記事を検索する際、単語の数が著しく多いとその多くなった単語に引きずられて検索結果が出る傾向がありました。今回、TFにlogを取るよう になると、単語の数が多さに極端に引きずられないようになり、より興味が深まる記事が探し出しやすくなると期待しております。
※例えば、TF*IDFの計算結果が変化します。
■7日以内に投稿された記事はRSSフィードが途切れた後も対象に
本日から、計算する日から数えて7日以内に投稿された記事については、1度取得するとその後にRSSフィードから外れても類似記事が表示できるようになります。
これまでは、RSSフィードに含まれている記事のみを検索対象としておりました。しかし、1日に数記事以上投稿されるようなとても活発なブログですと、日の浅い記事であってもあっという間に検索対象から外れてしまうという問題がありました。そこで、上記の機能改善を行うことで、できる限り多く、そして鮮度の高い情報がピックアップされやすくなります。
本日2008年7月6日から記事の蓄積を開始していますので、実際にこの機能が最大限の効果を発揮するのは今度の土曜日になります。記事を書き換えた場合は、次回RSS取得時に書き換えた内容が含まれたときに限り、更新されます。
なお、蓄積日数については、システム負荷を鑑みて今後延長も検討しております。
RSSフィードの登録、およびパーツの貼り付けも引き続き行っております。下記からどうぞ。
http://se.koemu.com/
【シムエントリ】情報更新ペース変更のお知らせ
シムエントリの情報更新ペースを、次の通りに変更いたします。
新: 1日1回 AM 3:00 (この時間からRSSの取得を開始します)
旧: 1日4回 6時間毎
理由としまして、自宅で類似エントリの計算を行っているサーバの「電気代」にあります。
前年同月比で電気代が2倍(※1)となっており、家計的に無視できない状況となっております。
そのため、計算終了後はサーバの電源を止め、電気代の高騰を抑える処置をとることといたしました。
個人的な都合で誠に勝手ではございますが、ご理解のほどなにとぞよろしくお願いいたします。
※追伸
資金に余裕が出てきたら、専用サーバでも借りて計算機・回線に余裕を持って今まで以上のサービスを提供できたらと考えています。
※1
電気代が一番少なくなる春、昨年の電気代は3,000円弱でした。しかし、今月は約6,000円となり、サーバ1台が家1軒分の電気を食べていることになります。ちなみに、サーバのCPUはPentium4 521 (2.8GHz)が入っています。
【シムエントリ】[解消しました]現在アップデートが遅れております
シムエントリをご利用の皆様へお知らせです。
2008年4月14日 2:10 以降に更新された記事につきまして、反映が遅れております。
先ほど、復旧作業を行いまして、2008年4月17日 2:10より更新を再開しております。本日の朝までには正常な更新速度に戻る予定です。
ご利用いただいている皆様にはご迷惑をおかけし、恐縮です。
2008/04/18 問題は解消し、現在は正常に稼働しております。
記事一覧
こえむの編集後記 に過去投稿された記事を表示しています。
