想寫一個爬蟲來抓indiegogo募資網站的網址
2020/09/10 下午 04:59
Python網路爬蟲討論版
吳育任
觀看數:50
回答數:2
收藏數:0
老師好,我最近想寫一個indiegogo網站的爬蟲,可是遇到一些問題所以想來請教一下
目標:抓到多個募資計畫的網址
問題:我現在遇到的問題是我的爬蟲執行完之後是回傳空值,還有一個錯誤訊息
回答列表
-
2020/09/10 下午 05:14張維元 (WeiYuan)贊同數:0不贊同數:0留言數:2
嗨,育任
你可以確認一下你爬的動作當下畫面是否已經產生?我懷疑是 sleep 不夠久
如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)
-
2020/09/14 下午 04:33Jia贊同數:0不贊同數:0留言數:2
我想老師的意思是 driver.get(url) 載入網址後,需要等一下子再抓 driver.page_source,因為你要的資料是後來動態載入的,並不是一開始就在網頁原始碼中。
對網頁右鍵 > 檢視網頁原始碼裡頭並找不到你要的資料,開發人員工具 > Network > XHR中可以發現這些後來載入的資料。
或許可以使用 sleep 或 WebDriverWait 來解決。