mask_字节宝

全能型AI！用通用预训练感知模型处理多模态多任务！商汤&西交&港中文提出：Uni-Perceiver

动物的生物智能系统通过整合不同方式的信息并同时处理各种任务来感知世界。相比之下，当前的机器学习研究遵循特定于任务的范式，导致任务之间的协作效率低下，并且为新任务开发感知模型的边际成本较高。在本文中，作者提出了...

image mask prompt token zero

2021-12-27

WSDM‘21 | 如何增加GNN的鲁棒性?

GNN 模型通常是根据拓扑结构，利用节点特征构建消息传递过程。然而，并不是所有的节点都需要参与消息传递过程，因此，需要一种选择的方法来刻画哪些边上的消息传递是真正需要的，也就是对边信息进行去噪。作者首先给出了一个GC...

distribution mask rank

2021-12-10

论文阅读: 2103.Boundary IoU

2103.16562：Boundary IoU: Improving Object-Centric Image Segmentation Evaluation

error gd mask min scale

2021-12-06

MIoU，Mean IoU，Mean Intersection over Union，均交并比

MIoU（Mean IoU，Mean Intersection over Union，均交并比，交集 / 并集），也就是语义分割中所谓的 Mask IoU 。MIoU：计算两圆交集（橙色TP）与两圆并集（红色FN+橙色TP+黄色FP）之间的比例，理想情况下两圆重合，比例为1。 ...

intersection mask mean union

2021-12-06

diffuse color控制颜色

解锁进入内部，内部复制置换，restex读取贴图，记得要勾上rgba,displace将贴图信息转换为置换信息，也可以控制置换强度的大小。

layer mask surface

2021-12-06

微软提出VLMo：用“模态混合专家”进行统一的视觉语言预训练！即将开源！

本文分享论文『VLMo: Unifified Vision-Language Pre-Training with Mixture-of-Modality-Experts』，由微软提出《VLMo》，用“模态混合专家”进行统一的视觉语言预训练！即将开源！...

image ls mask patch token

2021-12-02

BEIT：基于图像重建进行预训练！微软提出BEIT，Top-1准确率达86.3%！代码已开源！

在本文中，作者介绍了一种自监督视觉表示模型BEIT （B idirectional E ncoder representation from I mage T ransformers）。继BERT在自然语言处理领域开发之后，作者提出了一种用于预训练视觉Transformer的masked image mod...

image mask modeling patch token

2021-12-02

diffuse color控制颜色

解锁进入内部，内部复制置换，restex读取贴图，记得要勾上rgba,displace将贴图信息转换为置换信息，也可以控制置换强度的大小。

layer mask surface

2021-11-26

视频预训练界的HERO！微软提出视频-语言全表示预训练模型HERO，代码已开源！

在本文中，作者提出了HERO，一个新的大规模视频+语言综合表示学习框架。HERO以层次结构编码多模态输入，其中视频帧的局部上下文通过多模态融合被跨模态Transformer（Cross-modal Transformer）捕获，而全局视频上下文由时间Tr...

frame mask modeling token 视频

2021-11-18

Virtual Data Augmentation: 虚拟数据扩增技术

听说过数据扩增（Data Augmentation），也听说过虚拟对抗训练（Virtual Adversarial Traning），但是我没想到会有人将其结合，谓之虚拟数据扩增（Virtual Data Augmentation）。这篇文章主要讲解EMNLP2021上的一篇论文Virtual Data Aug...

data embedding mask token virtual

2021-11-15

9 10 11 12 13

全能型AI！用通用预训练感知模型处理多模态多任务！商汤&西交&港中文提出：Uni-Perceiver

WSDM‘21 | 如何增加GNN的鲁棒性?

论文阅读: 2103.Boundary IoU

MIoU，Mean IoU，Mean Intersection over Union，均交并比

diffuse color控制颜色

微软提出VLMo：用“模态混合专家”进行统一的视觉语言预训练！即将开源！

BEIT：基于图像重建进行预训练！微软提出BEIT，Top-1准确率达86.3%！代码已开源！

diffuse color控制颜色

视频预训练界的HERO！微软提出视频-语言全表示预训练模型HERO，代码已开源！

Virtual Data Augmentation: 虚拟数据扩增技术

热门文章

热门手册