[jQuery] RSS를 이용한 신문기사 크롤링(Crawling)하기 [신문사 RSS URL을 통한 XML 파싱하기]
·
◎ JavaScript/jQuery🌊
1. 크롤링을 할 RSS URL 검색(참고 : 한겨레 RSS서비스) RSS서비스 : 한겨레 RSS서비스 : 한겨레 www.hani.co.kr 2. RSS URL을 이용한 신문기사 크롤링하기 - it.java package controller; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.URL; import javax.servlet.ServletException; import javax.servlet.annotation.WebServlet; import javax.servlet.http.HttpServlet; import javax.servlet.http...
[JAVA] 자바(Java)에서 HTML 파싱(Parsing)하기 [정규식(Regular Expression)을 사용한 HTML 파싱]
·
◎ Java/Java☕
1. HTML 파싱할 사이트 검색(참고 : 무신사) 책/음악/티켓 > 잡지/무크지 | 무신사 스토어 총 12 개 브랜드와 잡지/무크지(70) 기타 컬처(96) www.musinsa.com 2. Java에서 HTML 파싱하기 - HTMLParser.java package app; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.FileWriter; import java.io.InputStreamReader; import java.net.URL; public class HTMLParser { public static void main(String[] args) throws Exception{ String urlStr =..