SITEINFOの書き方

おさえるべきポイントは3つ。覚えるべきところは実質2つ。
SITEINFOのテンプレを見ると

    {
        url:          '',
        nextLink:     '',
        pageElement:  '',
        exampleUrl:   '',
    },

AutoPagerizeを適用するサイトのURL、次のページへのリンク、ページの主要素、実例URLの項目がある。このうちexampleUrlはオプションなので書かなくても良い。
ポイントはurl、nextLink、pageElementの3つになる。
参考:http://autopagerize.jottit.com/details_of_siteinfo_%28ja%29
他にもオプショナルな要素があるようだが(incrementとかfaceFunctionとか)、本家以外の独自拡張なのか本家でも有効なのかよくわからない&自分でも効能がよくわからないので今は忘れておく。

url

単純な文字列か正規表現で記述する。
SITEINFO特有の留意すべき点がいくつかあるが、AutoPagerizeを機能させたいページになるべく広い意味でマッチするように記述することが必要。自分だけで使う分なら元のURLそのままでもOK。とりあえずURLそのままのSITEINFOをwedata以外に公開して、知識のある人に修正してもらうのもひとつの手。
参照:http://autopagerize.jottit.com/siteinfo_incomplete

正規表現のテストや例文集のようなサイトはいくつもあるので参考資料には欠かないはず。今回はこのあたりを利用した。特に3つ目がまとまっていて良かった。

pageElement

XPath式で記述する。
アドオンのXPath Checkerが非常に便利。Firebugもあるとますます良し。ここに関しては繰り返し現れて欲しい要素のXPath式をXPath Checkerで確認して、そのまま書けばよい。出来れば一意に指定できるようにidや属性の指定を適切に選ぶことが望ましいが、個人的に使いたい程度なら、出てきた式をそのまま書いても困らない。

nextLink

XPath式で記述する。
基本的にはpageElementと同じ。しかし、nextLinkに関してはちゃんと次へと続くものを選べるようにするのがポイント。次のページだとリンク位置が微妙に違っていたりするのを修正する。資料は山のようにあるのでページに合わせてパターンを選択するのが吉。

サポートツール

こんなのがある。使い方はそれぞれのページ参照。後者は最新版のFirefoxだとインストールできないのでNightly Tester Toolあたりが必要。

続く?

思っていた以上に長くなったのでいったん終わる。