最新 最热

有效捕捉目标级别语义信息,之江实验室&浙大提出再注意机制TRT

机器之心专栏机器之心编辑部来自之江实验室和浙江大学的研究者提出了一种再注意机制,旨在更有效地捕捉目标级别的语义信息,抑制背景干扰,实现更准确的目标定位能力。弱监督定位任务(Weakly supervised object localizatio...

2022-08-25
1

消费级GPU成功运行1760亿参数大模型

机器之心报道机器之心编辑部在消费级 GPU 上运行大规模模型是机器学习社区正面临的挑战。语言模型的规模一直在变大,PaLM 有 540B 参数,OPT、GPT-3 和 BLOOM 有大约 176B 参数,模型还在朝着更大的方向发展。这些模型很难...

2022-08-25
1

阿里达摩院获KDD 2022最佳论文,国内企业首次获奖

机器之心发布机器之心编辑部8 月 18 日,全球数据挖掘领域顶级会议 KDD 2022 大奖公布,阿里巴巴达摩院团队斩获应用科学方向“最佳论文奖”,这是中国企业首次获得该重磅奖项。KDD(ACM SIGKDD)是数据挖掘领域历史最悠久、规...

2022-08-25
1

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

机器之心报道机器之心编辑部为了重拾自己对 AI 开源和教育的热情,Andrej Karpathy 在家录了一个详解反向传播的课程。前段时间,特斯拉 AI 高级总监、自动驾驶 Autopilot 负责人 Andrej Karpathy 在推特上宣布自己即将离...

2022-08-25
1

KDD 2022奖项出炉:华人学者摘创新奖、博士论文奖、新星奖等多个奖项

机器之心报道机器之心编辑部KDD 2022 已经公布时间检验奖、博士论文奖、创新奖等重磅奖项。最近几天,一年一度的 KDD 大会正在美国华盛顿特区举办。本届大会包含 Research 和 Applied Data Science 两个 track。前段时...

2022-08-25
1

「声纹识别」中文课上线:从理论到编程实战,谷歌声纹团队负责人主讲

对任意一个领域的学习,如果有人可以指导你完成从基本概念、实践方法到系统认知的构建,你的职业发展将事半功倍。声纹识别领域,现在就有这样一门课程刚刚上线。什么是声纹识别?声纹识别(Speaker Recognition)是一门位于音频...

2022-08-25
1

GitHub 3.1K,业界首个流式语音合成系统开源!

大家好,我是崔庆才。想必大家在开发项目过程中可能或多或少用到语音识别、语音合成等相关技术,但又不知道哪家的服务好,而且有的收费还贼贵。尤其流式识别更是个难题。今天我给大家推荐一个流式语音合成库,现在在 GitHub ...

2022-05-27
1

GitHub 3.1K,业界首个流式语音合成系统开源!

智能语音技术已经在生活中随处可见,常见的智能应用助手、语音播报、近年来火热的虚拟数字人,这些都有着智能语音技术的身影。智能语音是由语音识别,语音合成,自然语言处理等诸多技术组成的综合型技术,对开发者要求高,一直是...

2022-05-25
1

基于Pytorch实现的EcapaTdnn声纹识别模型

本项目使用了EcapaTdnn模型实现的声纹识别,不排除以后会支持更多模型,同时本项目也支持了多种数据预处理方法,损失函数参考了人脸识别项目的做法PaddlePaddle-MobileFaceNets ,使用了ArcFace Loss,ArcFace loss:Additive A...

2022-05-10
1

全新开源!业界首个声纹识别与音频检索系统,10分钟搭建产业级应用

飞桨语音模型库PaddleSpeech,为开发者提供了语音识别、语音合成、声纹识别、声音分类等多种语音交互能力,代码全部开源,各类服务一键部署,并附带保姆级教学文档,让开发者轻松搞定产业级应用!...

2022-04-19
1