Phantom

키워드 기반 크롤링 프로젝트 - 3 본문

Project

키워드 기반 크롤링 프로젝트 - 3

Ph4nt0m_ 2018. 2. 8. 19:22
반응형
이번은 그냥 간단한 링크 가공이다.


이전 글들을 보면 알겠지만.. 링크가 파라미터까지 전부 날라간 형태로 저장이 된다.


이런 형식으로 말이다.

그래서 정규 표현식을 이용해 뒷부분을 잘라내고 다시 앞부분을 붙일 생각이다.


파이썬 정규표현식 모듈을 임포트 해주고
고정텍스트 부분은 그대로 쓰고 가변적인 부분을 정규표현식으로 처리해줬다.

그리고 앞부분을 붙여서 item['link']에 리턴해준다.


결과물


결과 값 검증



참조 링크


반응형
Comments