前段时间 Transformer 已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』、『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』、『Lifting Transformer』、『TimeSformer』等等
Transformer为什么这么有实力? 因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer 更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智能研究生的强烈兴趣。
但要想啃透 CV Transformer 难度不小:一方面,Transformer 本是应用于 NLP的论文,其中很多内容都形成了共识,在论文中并不会去详细介绍这些共识内容,例如 QKV是什么,embedding 是什么等,对于其他方向的人看到这些就很难理解。
尽管已经引起了极大的关注,但将其应用于其他领域时仍面临许多挑战,包括从方法论的合理性到实际商业业务表现。
那么为了让大家更好地掌握图神经网络,咕泡教育现邀请到「人工智能实战专家 - 唐宇迪博士」,专为深度学习的同学开设了「transformer - <实例篇>」 ,既包括前沿的学术分享、又有来自头部大咖的实践分享。