728x90
- Jsoup 메서드 : html(), text(), outerHtml() 차이
Jsoup에서 html(), text(), outerHtml() 메서드는 각각 HTML 요소를 다루는 방식에 차이가 있다.
아래 예제를 각 메서드 별로 어떻게 파싱하는지 알아보자.
<div>
<p>Hello</p>
<span>World</span>
</div>
1. html()
Element div = doc.selectFirst("div");
System.out.println(div.html());
// 출력값
<p>Hello</p>
<span>World</span>
2. text()
Element div = doc.selectFirst("div");
System.out.println(div.text());
// 출력값
Hello World
3. outerHtml()
Element div = doc.selectFirst("div");
System.out.println(div.outerHtml());
// 출력값
<div>
<p>Hello</p>
<span>World</span>
</div>
- 정리
- html() : 해당 Element의 내부 HTML 반환. 자식 태그 포함해서 반환
- text() : 해당 Element의 텍스트만 추출. 태그는 무시하고, 순수한 글자만 반환
- outerHtml() : Element 자체를 포함한 전체 HTML 반환. html()과는 달리, 자기 자신까지 포함
728x90