jericho-htmlを使う
commons-logging.jarが無いと動かない。
HTMLParserよりjericho-htmlのほうが使いやすい。
HTMLParserはテキストが取得しにくい。
jericho-htmlでHTMLは取得できるけど、テキストが取れないので悩んでいたら
ElementのgetRendererでテキストが取得できることが判明。
commons-logging.jarが無いと動かない。
HTMLParserよりjericho-htmlのほうが使いやすい。
HTMLParserはテキストが取得しにくい。
jericho-htmlでHTMLは取得できるけど、テキストが取れないので悩んでいたら
ElementのgetRendererでテキストが取得できることが判明。