자바(Java)/스크래핑, 크롤링

[파싱,스크래핑] 노트패드++ http:// 없애기

xemaker 2023. 4. 13. 17:35

파싱, 스크래핑시 html 파일로 작업을 할 때 http:// 가 있으면 오래걸리고 등 하니 없애버리고 싶을 때가 있다.

불필요하니..

그래서 어떻게 할까.. 생각하다가

노트패드 ++ 에서

Ctrl+f 하면 Find 탭이 기본적으로 뜨니 그 옆에 Replace 탭으로 가서

아님 바로 Ctrl+h 해도 된다.

대화상자가 뜨고 좌측 하단에 Search Mode 박스에서 Regular expression 선택

Find what: 에
http(.*)"

Replace with: 에
"

하고 Replace All 을 하면

http:// 로 되어 있는 부분이 다 없어진다.

즉 href="" 이렇게 된다.