不堆参数、不靠时长,Meta加速ViT训练流程,吞吐量4倍提升
机器之心报道 机器之心编辑部 有时候,好的训练「技巧」比蛮力堆参更有效。 现阶段,视觉 transformer(ViT)模型已经在图像分类、目标检测与分割等各样各样的计算机视觉任务中得到了广泛应用,并可以在视觉表征与识别中实现 SOTA 结果。由于计算机视觉模型的性能往往与参数量和训练时长呈正相关,AI 社区已经实验了越来越大规模的 ViT 模型。 但应看到,随着模型开始超出万
吞吐量
机器之心 . 2022-05-26 1287
- 1