Loading...

Vision Transformer (ViT) 用于图片分类 - Shusen Wang - 深度學習 Deep Learning 公開課 - Cupoy

Vision Transformer (ViT) 是很新的模型，2020年10月挂在 arXiv 上，2021年正式发表。在所有的公开数据集上，ViT 的表现都超越了最好的 ResNet。前提是要在足...

AI共學社群

Vision Transformer (ViT) 是很新的模型，2020年10月挂在 arXiv 上，2021年正式发表。在所有的公开数据集上，ViT 的表现都超越了最好的 ResNet。前提是要在足够大的数据集上预训练 ViT。在越大的数据集上做预训练，ViT 的优势越明显。课件： https://github.com/wangshusen/DeepLea...