執行訓練深度學習模型程式碼時出錯
2020/05/19 下午 06:45
Julia程式語言討論版
徐威銓
觀看數:6
回答數:3
收藏數:0
執行以下程式碼時
epochs = 20
@epochs epochs Flux.train!(loss, params(model), train, ADAM(0.005), cb=throttle(evalcb, 10))
出現以下錯誤:
在此之前的程式碼都有正常執行,想了解問題所在及處理方法,謝謝。
回答列表
-
2020/05/20 下午 10:34杜岳華贊同數:1不贊同數:0留言數:1
請確定你的 CuArrays 及 CUDAnative 套件有安裝完整,並且可以用以下程式碼測試。
using CuArrays
X = cu(rand(3, 3))
X*X'
測試通過正常運作後,請跟 Flux 一同使用。
-
2020/05/21 上午 07:37JJLai贊同數:2不贊同數:1留言數:0
這個問題我也有遇到
在沒有GPU的電腦運作是正常的
但在有GPU的電腦就會出現這個問題
-
2020/05/21 下午 09:42Sans贊同數:1不贊同數:0留言數:2
Hi
我有遇到一樣的錯誤訊息
原始環境:
KUbuntu 18.04 LTS, Nvidia driver 390.x, cuda 9, cudnn 9.0
後來解決的過程如下:
1. 更新Nvidia driver至440.33.01 (可以直接裝cuda 10.2附的)
2. 安裝cuda 10.2 + cudnn 10.2
3. 重裝CuArrays
4. pkg > build CuArrays <---我沒有證據,但懷疑套件在第一次build的時候會去吃當時的cuda,然後cuda更新時不會自動rebuild。總之以防萬一我有做這步驟。
然後目前是可以正確在GPU模式使用CNN的。
附一下目前各套件版本:
julia: 1.4.1
Flux: 0.10.4
Zygote: 0.4.20
CUDAapi: 4.0.0
CuArrays: 2.2.0