본문 바로가기
반응형

웹 크롤링2

Python 입문자의 오류 - '''와 줄 바꿈 문제 #2068 웹 크롤링을 따라 해보고 있는 중입니다. 문제 책에는 분명 다음과 같이 '''..url..'''로 표기되어 있었는데요. url=''' https://example.com/~ ''' 이것이 에러를 뿜어냅니다. 책과 코드를 몇 번을 비교하다 결국 저자의 github에서 답을 찾을 수 있었습니다. 표기상의 문제였던 거죠. 해결 1 해당 페이지의 예제를 확인하니 소스코드상에 '..url..'로 되어 있기에 표기를 고쳐서 수정하니.. 문제가 해결되었습니다. url='https://example.com/~' 해결 2 혹시나 싶어 문제의 코드도 개행을 없애고 다시 실행해 보니 문제없이 해결되는 것을 확인할 수 있었습니다. url='''https://example.com/~''' 줄 바꿈이 문제 처음에는 싱.. 2020. 9. 12.
한입에 웹 크롤링 리뷰 B18.046샘플사이트를 접속하는데 계속 문제가 생겨서 결국 포기하고 예제를 참고로 다른 사이트를 테스트삼아 따라해 보게 되었습니다. 이건 이대로 공부가 되니 좋다는 생각도 들었습니다.책의 초반부는 파이썬의 기초를 다지기 위한 문법을 설명해 주고 있으며, 중반부는 샘플 사이트를 통해 크롤링하는 방법을 차근차근 설명해주고 있습니다. json을 다루는 방법과 네이버API를 활용하는 방법등도 책의 샘플을 따라하는데는 지장이 없을만큼 자세하게 나와있습니다.크롤링에 대해서는 잘 이해가 가지 않던 부분이 있었는데 원하는 정보가 있는 HTML의 DOM구조를 파악해서 필요한 부분을 발췌하는 과정을 자동화 하여 원하는 정보를 모으는 작업이라는것을 알 수 있었습니다.해결을 하긴 했습니다만, 네이버API 부분은 실제로 소스.. 2018. 10. 29.
728x90
반응형