1. HTML 파싱할 사이트 검색(참고 : 무신사)
2. Java에서 HTML 파싱하기
- HTMLParser.java
package app;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.InputStreamReader;
import java.net.URL;
public class HTMLParser {
public static void main(String[] args) throws Exception{
String urlStr = "https://www.musinsa.com/category/014001";
URL url = new URL(urlStr);
BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream()));
BufferedWriter bw = new BufferedWriter(new FileWriter("무신사.html"));
String s = null;
while((s = br.readLine()) != null) {
System.out.println(s);
bw.write(s);
bw.newLine();
}
bw.close();
}
} // 코드를 다시 보니 정규표현식은 사용되지 않았었다.. (23.07.24)