当前位置 > 首页 > 新闻动态 > 行业动态 > 苹果开源FastViT:快速卷积Transformer的混合视觉架构
苹果开源FastViT:快速卷积Transformer的混合视觉架构
苹果此前在论文《FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization》中提出的 FastViT 架构已正式开源。
FastViT 有机地结合了 CNN 和 Transformer 的优势,无论在精度或者运行效率上均有了稳定的提升。FastViT 引入了一种新的 Token 混合算子,命名为 RepMixer。从名字来看,它结合了结构重新参数化技术。该算子的作用原理是通过消除网络中的 skip connection 来降低内存访问成本。
实验结果表明,FastViT:
· 在移动设备上的速度比混合 Transformer 架构 CMT 快 3.5 倍
· 在 ImageNet 数据集上的精度相同,但速度比 EfficientNet 快 4.9 倍且比 ConvNeXt 快 1.9 倍
· 在相似的延迟下,FastViT 在 ImageNet 上的 Top-1 精度比 MobileOne 高出 4.2%
参考:https://mp.weixin.qq.com/s/poJur-vOtU2-h2tUe89shA、https://mp.weixin.qq.com/s/uqcWy4sx1NQuqOplsGDUlg
来源:OSC开源社区
关于联盟
边缘计算作为新兴产业应用前景广阔,产业同时横跨OT、IT、CT多个领域,且涉及网络联接、数据聚合、芯片、传感、行业应用多个产业链角色。为了全面促进产业深度协同,加速边缘计算在各行业的数字化创新和行业应用落地,华为技术有限公司、中国科学院沈阳自动化研究所、中国信息通信研究院、英特尔公司、ARM和软通动力信息技术(集团)有限公司作为创始成员,联合倡议发起边缘计算产业联盟,致力于推动“政产学研用”各方产业资源合作,引领边缘计算产业的健康可持续发展。
加入联盟联系我们