Web scraping de HTML/XML com o jsoup [Java]

O jsoup é uma biblioteca Java usada para scraping (extração de dados) de HTML/XML para Java. Permite também manipular e gerar HTML. Tem uma linha de desenvolvimento estável, boa documentação e uma API fluente e flexível. Repare como é simples imprimir os parágrafos de uma página:

Document doc = Jsoup.connect("http://example.com").get();
doc.select("p").forEach(System.out::println);

Leia o artigo na íntegra no site oficial Baeldung, onde o publiquei originalmente (em inglês).

Deixar uma resposta