2004.01.24

RNA 1.9.1

RNA 1.9のバグフィックスを行いました.(Version 1.9.1 build 040123)ダウンロードはこちらから.RNA 1.9をお使いの方のための差分ファイルも用意しています.サンプルはこちらです.変更点は以下の通りです.

・RSSを配信しないサイトにおいてタイトル情報の取得に失敗していた問題を修正 [fix]
・ローカル側のタイムゾーンに基づくソート [update] タイムゾーン設定の異なるサイトの記事が正しくソートされない問題に対処しました.

詳しいインストール方法・使用方法については semblog wiki をご覧ください.
追記:1/24 3:00までにフルパッケージをダウンロードされた方は,申し訳ありませんが再度ダウンロードをお願いします.実行できないバージョンをアップしてしまいました.すみません...

Posted by i2k at 02:13 AM | Permalink | Comments (0) | TrackBack (58)

2004.01.21

RNA 1.9

RSSベースのアンテナならびにFOAFのマネジメント環境を統合した「RNA」の正式版(Version 1.9 build 040120)をリリースしました.RNAはサーバ上で動作させるCGIスクリプトです.ダウンロードは こちら からお願いします.サンプルは こちら です.変更点は以下の通りです.

・JavaScriptによるRNAリストの埋め込み [new] 任意のHTMLページにRNAリストを表示させることができます.
・テンプレートの充実
  ・MovableTypeライクな時刻設定 [new]
  ・<RNAItems> <RNAContents> <RNATrackbacks>でlastn属性に対応 [new]
  ・<RNACategories>の出力カテゴリを指定可能に(順番も指定可能)[new]
・RSSを配信しないサイトへの完全対応 [new] はてなアンテナ連携機能とは異なりカテゴリ分類等が可能になります.
・index.rdfおよびrsd.xmlを追加 [new]
・FOAF関係
  ・FOAF TrackbackにおいてfoafファイルのURIを指定可能に [update]
  ・名前の入力を<foaf:name>に一本化,WeblogのURIを登録可能に [update]
  ・foafファイル内にsemblog関連の情報を記述 [update]
  ・未知のタグを消去する不具合を解消 [fix]
・Trackback Tracingの高速化および負荷軽減 [update]
・取得・再構築したRSSの属性を上書きする/しないのオプションを追加 [update] RNAで生成したRSSをアグリゲータにチェックさせる場合に有効です.
・設定ファイルconfig.plの簡素化 [update] 変更の必要がない項目はlib/RNA/Config.pmに移動

詳しいインストール方法・使用方法については semblog wiki をご覧ください.
追記:1/21 20:30までダウンロードできないようになっておりました.なお詳細なドキュメントについてはこれからwikiにて徐々に充実させていく予定です.

Posted by i2k at 03:58 PM | Permalink | Comments (0) | TrackBack (79)

2004.01.15

8020運動

気がつけば2004年.皆様いかがお過ごしでしょうか.申し遅れましたがあけましておめでとうございます.今年もよろしくお願いします.2004年のWeblog世界には何が起こるのか,キーワードは「信頼性」になるような気がします.FOAF的な信頼ネットワークをはじめとして,昨年後半に立て続けにリリースされたサービスの数々(ビジネス・趣味を問わず)もとりあえずやってみたというレベルから,ちゃんと継続できるのか,望ましい挙動を維持できるのかが問われるようになる年かなと.同じことはsemblog.orgにもそのままあてはまるわけで,浮かれず騒がず着実にプロジェクトを進めていく所存です.

さて本題.前回のエントリの時期からこれまでに,今後の方向性を示すようなサービスが続々と出ている. BulkfeedsFeedBackReadOne(Web版) あたりが代表例.どれも年末年始に頻繁な更新がなされている.で,これらに共通するのが「検索」と「推薦」.彼の国ではすでに起こっていることであるけれども,日本でもWeblog(とRSS)は新たな時代に入ってきた徴であるとみることができる.どういうことか.これまではサイトが限られているので自分の読みたいサイトを指名して読んでいればよかったか,もしくは目新しいサイト・コンテンツを適当に配信してもらえるサービスを使っていればそれで済んだ.ところが,メディアとしての影響力が強くなってきたのと量的に爆発してきたのとで,自分の知らない情報(もしくは情報源)を知りたい,かといってわけのわからんコンテンツにまみれるのも嫌だという要求が出てくるようになってきた.その回答の一部がキーワードマッチングによる検索であり,別の一部が推薦ということになるのだろう.この流れには全く異存がない.glucoseでも最新バージョンにて要望の多かったキーワード登録が実装されたし,推薦についても近いうちに何らかのアナウンスをする.

キーワード検索についてはユーザが明示的にやることなのでとくに問題ない.仕組みがシンプルなので出てくるであろう結果についてもそんなにおかしなことにはならない.(ただしRSSスパムみたいなことがいずれ起こってくると単純マッチングでは意味をなさなくなり,エンジンを高度化しないといけなくなるのは普通の検索エンジンと同じ)一方,推薦はというと「クエリーフリー」という言葉が出てきているように,極力ユーザに負荷をかけずにユーザの欲しそうなコンテンツを提示する必要がある.こちらは仕組みも実装も大変.手法自体は人工知能の分野でさんざん研究されてきたからそれを使うとしても,種類がありすぎて何を採用すべきかがわからない.もう1つの問題は推薦の精度で,ユーザは何をどう提示されればうれしいのか,それを評価しにくいので推薦手法に気合いを入れてもなんというか報われない気分になるかもしれない.少し皮肉な言い方をすれば,Weblogを対象とするならば,Weblogのコンテンツはそもそもがいい加減なものなので,いい加減な手法で推薦してもそれなりに当たってしまう(満足が得られる)可能性がある.それを良しとするか悪しとするかは別として,そのあたりをもう少し厳密に突っ込んでいくのが研究テーマになると思われる.

さらに推薦関係でもう1つ考えないといけないことがあるとすれば,それはハレとケの問題というか,ルーチンワークと物見遊山の問題というか(適当),期待通りのコンテンツが提示される割合と,予想外の,がしかし新たな発見につながるようなコンテンツが提示される割合とのバランスではなかろうか.推薦とは主に後者を担うのだが,それが少なすぎるとありがたみがわかなくて,多すぎるとノイズとなってしっくりこない,ちょうどいい推薦の量と質をどうやって見つけるかが重要になる.いわゆる研究としての推薦アルゴリズムではこういう問題をあまり取り扱っておらず,もっぱら精度を追究するのであるが,何らかのプロダクトとして結実させようと思ったらこの問題は避けて通れない.直感的にはそのバランスは日常80:非日常20ぐらいになるのではと思う.さてじゃあこのバランスをどう実現するか?これは予想以上に面倒で大層な仕掛けが必要になるのだろうなあ,と予測しておく.そして,これを実現できた者だけが,(すぐそこに)来るべきMicrosoftが乗り込んでくる時代,Googleが乗り込んでくる時代に喰われないで生き延びられるのだろうなあ.

Posted by i2k at 12:41 PM | Permalink | Comments (0) | TrackBack (69)