logo
Loading...

想寫一個爬蟲來抓indiegogo募資網站的網址 - Cupoy

老師好,我最近想寫一個indiegogo網站的爬蟲,可是遇到一些問題所以想來請教一下網址:https...

想寫一個爬蟲來抓indiegogo募資網站的網址

2020/09/10 下午 04:59
Python網路爬蟲討論版
吳育任
觀看數:50
回答數:2
收藏數:0

老師好,我最近想寫一個indiegogo網站的爬蟲,可是遇到一些問題所以想來請教一下

網址:https://www.indiegogo.com/explore/energy-green-tech?project_type=campaign&project_timing=all&sort=trending


目標:抓到多個募資計畫的網址


問題:我現在遇到的問題是我的爬蟲執行完之後是回傳空值,還有一個錯誤訊息

回答列表

  • 2020/09/10 下午 05:14
    張維元 (WeiYuan)
    贊同數:0
    不贊同數:0
    留言數:2

    嗨,育任


    你可以確認一下你爬的動作當下畫面是否已經產生?我懷疑是 sleep 不夠久


    如果這個回答對你有幫助請主動點選「有幫助」或「最佳解答」的按鈕,也可以追蹤我的GITHUB 帳號。若還有問題的話,也歡迎再開一個新的問題繼續發問,或者把你理解的部分整理上來,我都會提供你 Review 和 Feedback 😃😃😃另外我目前有舉辦一個課程:【資料科學家的 12 堂心法課】,歡迎一起來玩玩!(By the way,我並不是主辦單位的人員,所以如果覺得我回答得不好,不要找他們抱怨/客訴XD)

  • 2020/09/14 下午 04:33
    Jia
    贊同數:0
    不贊同數:0
    留言數:2

    我想老師的意思是 driver.get(url) 載入網址後,需要等一下子再抓 driver.page_source,因為你要的資料是後來動態載入的,並不是一開始就在網頁原始碼中。


    網頁右鍵 > 檢視網頁原始碼裡頭並找不到你要的資料,開發人員工具 > Network > XHR中可以發現這些後來載入的資料。


    或許可以使用 sleep 或 WebDriverWait 來解決。