當你遇到你用python爬蟲時 沒辦法成功爬j完
這時你就必須想到有三個可能:

1.是不是你爬的網站有禁止 機器爬
  如果有這個可能記得要用 slepp 跟 random函式
  time.sleep(t是變數)
  將自己爬蟲的行為盡可能不像機器
  
2.加個header下去爬 假裝自己是瀏覽器
  headers = {'user-agent': 'Mozilla/5.0'}
  
3.有可能你的IDE沒辦法全部PRINT 出結果來
  所以盡可能還是將爬蟲的資料用寫入筆記本的方式寫入
  (我就是一直找不到問題 後來用筆記本寫入後才發現是ide 
   沒有全部print的問題)

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨柚 的頭像
    晨柚

    晨柚的部落格

    晨柚 發表在 痞客邦 留言(0) 人氣()