在这篇文章中,我们探索了两种基础架构,它们使Transformer能够闯入计算机视觉的世界。 几乎所有的自然语言处理任务,从语言建模和masked词预测到翻译和问答,在2017年Transformer架构首次亮相后都经历了革命性的变化。Transformer在计算机视觉任务中也表现出色 ...