用Objection Detection API訓練遇到的問題?
2020/08/27 上午 00:00
電腦視覺深度學習討論版
SuYa
觀看數:9
回答數:1
收藏數:0
cvdl
cvdl-d48
目前都將圖片scale成618X618下去訓練,不過在google colab上訓練時卻遇到另一個問題
使用的預訓練模型為 faster_rcnn_nas,tf version 1.x(1.15.2),batch size = 8,training steps = 150000,evaluation steps = 50,卻會在訓練階段顯示記憶體超過10%,而在訓練第一階段就停下來,即便後來將batch size調降成2,也是會遇到相同的問題
於是,我選了另一個較為輕量的模型來做訓練,ssd_mobilenet_v2,tf version 1.x(1.15.2),batch size = 12,training steps = 150000,evaluation steps = 50,這次就能開始訓練,但跑得非常緩慢,最後超過colab使用時間12小時,就自己停下來了,training steps並沒有完全跑完,我後來檢查在tf version 1.x時,其訓練的速度就跟使用cpu幾乎一樣沒什麼不同,請問可以怎樣做調整才好?
回答列表
-
2020/09/04 上午 01:21Jeffrey贊同數:0不贊同數:0留言數:2
請問一下,
(1)執行環境有選GPU or TPU 的設定
(2) 資料集有多少張照片? 多少類別?
(3) epoch 設這個數字是因為有跑完過相同模型但是 accurancy 不好才增加的嗎?