HTML diff (Wiki)

Pythonのライブラリ:
  1. lxml.html.diff かなり良いライブラリ。Unicode対応できるが、結果が時々おかしい。timeitを使って、1000回実行したら、35.06秒かかった。
  2. htmldiff.py 結果がいい。1000回実行したら、37.11秒かかった。
  3. templatemaker いいライブラリ。しかし、文字列ベースですので、HTMLがちょっと違う。Linux系のライブラリあるけど、Windows系がなかなか。
    テキストの向けだ。HTMLに対したら、チョウ遅い。1回差分したら、2.5秒かかる。
  4. google-diff-match-patch : このライブラリは、plaintextしか対応できない。しかし、HTMLコードが1タグ1ラインで書いたら、lineModeを利用できる。コードも多少の整理が必要だ。
Comments