2006-08-31
_ Filter::EntryFullText の設定ファイルを書いてみる
Plagger を使いたかった目的の一つにフィードの全文配信をしていないサイトや,そもそもフィードの配信をしていないとこも,なんとかしたいなぁとか思ってたから.これが Plagger のプラグイン,Filter::EntryFullText を使えば HTML から文章を切り出し,フィードを作成することができます.
というわけで,今日は試しに「街の灯」を対象に全文入りフィードを出力するようにしてみました.(9/1追記:日付取得部分がうまくとれないようなので,title と body を取得するように変更)
author: smallstyle custom_feed_handle: http://www\.matino-akari\.com/linksyu custom_feed_follow_link: /news\.cgi\?mode=vew&resno=\d+.*? handle: http://www\.matino-akari\.com/linksyu/news\.cgi\?mode=vew&resno=\d+.*? extract: <h1>.*?<a href=.*?>(.*?)</a>.*?<div class=o>(.*?)<br></div> extract_capture: title body
これだけ.記述した設定ファイルは,assets/plugins/Filter-EntryFullText 以下に配置.あとは,config.yaml などに,
- module: Filter::EntryFullText - module: Subscription::Config config: feed: - url: http://www.matino-akari.com/linksyu/
と定義をしておいて Publish::Feed で出力すると,全文入りのフィードの完成.
ちなみに,chroot 環境で動かしている Plagger は,sarge 環境から cron で呼び出して動かしています.
*/60 * * * * /usr/sbin/chroot /debian-sid /usr/bin/plagger -c /hoge/config.yaml > /dev/null 2>&1
matino-akari_com.yaml としてcommitしていいですか?
ちょろっと更新したので,こちらの yaml で commit してください.よろしくお願いします.
http://www.smallstyle.com/20060908.html#p01