入力されたhtmlはやっぱりXSS対策をしないと・・・と思いとりあえずスクリプトになるタグや属性だけでも保存するHTMLから削除するためにjericho-htmlをおさわり中。
このパーサーでパースさせていらぬタグや属性を削除すればいいかな・・・なんて簡単に考えていたけど、このライブラリの基本ってパースして情報を抜き取るだけなのかな。
AttributesからAttributeを抜き出してAttributes#remove(Object)でできると思ったらなぜか何回やっても例外が返る。しかもAttributesの親クラスのSequentialListSegmentっちゅうクラスAPIがjericho-htmlには無い!
しょうがないんでWeb上でさがしたらあったけどremoveメソッドって対応しないのねガクッ・・・jericho-html以外でタグを削除できるライブラリを探さないと・・・
public boolean remove(Object o) {
throw new UnsupportedOperationException();
}