from bs4 import BeautifulSoup as bs
from requests.exceptions import ProxyError, SSLError, ConnectTimeout
from fp.fp import FreeProxy
from user_agent import generate_user_agent, generate_navigator
ua=generate_user_agent(device_type='desktop')#user_agent를 이용해 생성
proxy_server = FreeProxy(https=True, timeout=5).get()#freeproxy를 이용해서 proxy가져옴
proxies = {"http": proxy_server, 'https': proxy_server}
headers = {
'User-Agent': ua
}
while True:
try:
post_one = requests.get(url, headers=headers, proxies=proxies, timeout=5)
psource = post_one.text
soup = bs(psource, 'html.parser') # Soup으로 만들어 줍시다.
break
except (ProxyError, SSLError, ConnectTimeout) as e:
print(e)
continue
print(soup)
크롤링하다가 ip로 막히는 경우가 생길때 써보면 된다.
없는 프로그램은 설치해서 해보자
'파이썬' 카테고리의 다른 글
파이썬 로그를 남겨보자 (0) | 2024.02.13 |
---|---|
[파이썬]크롤링할때 프록시를 이용해 ip 차단 우회하기 2 - Selenium Chrome (0) | 2024.02.08 |
윈도우10에서 파이썬 pip로 pandas 설치 안될때 (0) | 2021.04.29 |
Mecab에 새로운 단어 등록하기 (0) | 2020.11.17 |
우분투 xdpyinfo 설치와 chromium 설치 그외 파이썬 크롤링 필수 설치 (0) | 2019.12.16 |