자바(Java)/스크래핑, 크롤링
[파싱,스크래핑] 노트패드++ http:// 없애기
xemaker
2023. 4. 13. 17:35
파싱, 스크래핑시 html 파일로 작업을 할 때 http:// 가 있으면 오래걸리고 등 하니 없애버리고 싶을 때가 있다.
불필요하니..
그래서 어떻게 할까.. 생각하다가
노트패드 ++ 에서
Ctrl+f 하면 Find 탭이 기본적으로 뜨니 그 옆에 Replace 탭으로 가서
아님 바로 Ctrl+h 해도 된다.
대화상자가 뜨고 좌측 하단에 Search Mode 박스에서 Regular expression 선택
Find what: 에
http(.*)"
Replace with: 에
"
하고 Replace All 을 하면
http:// 로 되어 있는 부분이 다 없어진다.
즉 href="" 이렇게 된다.