크롤링 3

크롤링 완성(?)

완성 링크 : http://54.180.142.13/list.php - 해당 링크 현재(2021.11.22) AWS 서버 공급 중단상태, 차후 다른 플랫폼 서버로 이동 후 재 서비스 예정 # 소스코드 import requests from bs4 import BeautifulSoup import pymysql # MySQL Connection 연결 conn = pymysql.connect( host = '54.180.142.13' , user = '-' , password = '-' , db = 'news', charset='utf8') curs = conn.cursor() # Connection 으로부터 Cursor 생성 URL = 'https://www.boannews.com/media/o_list.a..

python 2021.11.22

웹 스크랩핑(크롤링)_2

# 크롤링을 막아놓은 사이트에 대한 대처 selenium모듈을 설치해준다. Terminal 에 pip install selenium 크롬드라이버 설치 버전확인 : 크롬 우측상단 크롬 맞춤설정 및 제어 - 도움말 - 크롬정보 본인 크롬버전 확인 : 73버전 https://sites.google.com/a/chromium.org/chromedriver/downloads 버전에 맞게 설치 윈도우 환경이므로 win32 다운로드, 압축푼뒤 파이썬 폴더에 드래그 앤 드롭 하면 exe파일이 들어가진다. from selenium import webdriver driver = webdriver.Chrome('./chromedriver') driver.implicitly_wait(3) driver.get('https://..

python 2021.11.18

웹 스크랩핑(크롤링)

# Web Scraping 필요한 모듈 1. requests 2. beautifulsoup 모듈을 설치하는 방법 Terminal 에서 pip install 모듈명 으로 설치 하거나, File | Settings | Project: 프로젝트명 | Project Interpreter에 들어가면 현재 설치된 모듈을 확인 할 수 있다. 여기에서 원하는 모듈명을 검색해서 설치 할 수도 있다. > 설치한 모듈의 함수 등 동작내용을 확인하기 위해 해당 모듈명으로 검색해서 제작자가 정리해놓은 사용법을 확인해야 한다. import requests # requests 모듈 사용 선언 URL = 'https://naver.com' response = requests.get(URL) # 요청 (requests의 get 함수 ..

python 2021.11.18