シムエントリの記事解析についてのお知らせです。

■一部フィードの解析問題を修正
一部のRSSフィードで本文を正しく取得できていない(※1)ことがわかりましたので、修正しております。

■閾値の変更
上記の修正から抽出精度が確保できたため、 0.1 < cos < 1 の範囲で表示するように戻しました。

■タイトルのウェイト変更
タイトルのtf値のウェイトを10倍に変更しました。以前は3倍でした。
類似比較に当たり、よりタイトルのウェイトが高まります。

※1
Perl のXML::FeedPPですと、HTMLタグを含んでいるフィードが正しく取得できないことがわかりました。
そのため、使用するモジュールをXML::Feedに切り替えて対処しております。
参考:『Atom feedの解析 – ホワイト日記

「【シムエントリ】一部エントリの解析について」に2件のコメントがあります
  1.  数日前からシムエントリを利用させていただいてますが、表示欄の高さが少ないようで、リンクの3行目が隠れてしまいます。
     高さは可変、もしくはユーザ側で設定できるように改修できませんでしょうか?

  2. 更新ご苦労様です。

    私のサイトでもシムエントリの利用を開始させていただきましたが、表示されいているリンク3件のうち2件がサイト内と言うことがありました。

    開発意図からしますと、自サイト内へのリンクは除外しても良いのではないでしょうか?
    有用な意見になれば幸いです。

コメントは受け付けていません。