Jericho Html Parser
こうだったらなぁと思うところ。
JerichoはタグについてはElementとして認識するけど、タグに囲まれてもいない単なる文字列はタグのコンテンツの内容としてしか認識されない。どういうことかと言うと、tdタグなんかに例えば、次のように記述すると、
... <td> xxxにおけるマトリクス <table> ... ここにマトリクスの内容 </table> </td>
この場合、Element(tdタグ)#getChildElements()は1件のリストで当然