Javaと情熱のあいだ

カステラとドーナツと珈琲

jericho-htmlを使う

commons-logging.jarが無いと動かない。
HTMLParserよりjericho-htmlのほうが使いやすい。
HTMLParserはテキストが取得しにくい。
jericho-htmlでHTMLは取得できるけど、テキストが取れないので悩んでいたら
ElementのgetRendererでテキストが取得できることが判明。