arcanum_jp’s blog

おっさんの日記

jericho-html-2.5.jarおさわり中

 入力されたhtmlはやっぱりXSS対策をしないと・・・と思いとりあえずスクリプトになるタグや属性だけでも保存するHTMLから削除するためにjericho-htmlをおさわり中。

 このパーサーでパースさせていらぬタグや属性を削除すればいいかな・・・なんて簡単に考えていたけど、このライブラリの基本ってパースして情報を抜き取るだけなのかな。

 AttributesからAttributeを抜き出してAttributes#remove(Object)でできると思ったらなぜか何回やっても例外が返る。しかもAttributesの親クラスのSequentialListSegmentっちゅうクラスAPIがjericho-htmlには無い!

 しょうがないんでWeb上でさがしたらあったけどremoveメソッドって対応しないのねガクッ・・・jericho-html以外でタグを削除できるライブラリを探さないと・・・

public boolean remove(Object o) {
throw new UnsupportedOperationException();
}