關於python爬資料不完整這件事的解決辦法－晨柚的部落格

Dec 05 Wed 2018 21:50
關於python爬資料不完整這件事的解決辦法

當你遇到你用python爬蟲時沒辦法成功爬j完
這時你就必須想到有三個可能:

1.是不是你爬的網站有禁止機器爬
如果有這個可能記得要用 slepp 跟 random函式
time.sleep(t是變數)
將自己爬蟲的行為盡可能不像機器

2.加個header下去爬假裝自己是瀏覽器
headers = {'user-agent': 'Mozilla/5.0'}

3.有可能你的IDE沒辦法全部PRINT 出結果來
所以盡可能還是將爬蟲的資料用寫入筆記本的方式寫入
(我就是一直找不到問題後來用筆記本寫入後才發現是ide
沒有全部print的問題)