最新 最热

WenetSpeech数据集的处理和使用

WenetSpeech数据集 包含了10000+小时的普通话语音数据集,所有数据均来自 YouTube 和 Podcast。采用光学字符识别(OCR)和自动语音识别(ASR)技术分别标记每个YouTube和Podcast录音。为了提高语料库的质量,WenetSpeech使用...

2021-12-07
0

PPASR流式与非流式语音识别

本项目将分三个阶段分支,分别是入门级 、进阶级 和最终级 分支,当前为最终级,持续维护版本。PPASR中文名称PaddlePaddle中文语音识别(PaddlePaddle Automatic Speech Recognition),是一款基于PaddlePaddle实现的语音识别框...

2021-12-07
0

语音对话机器人

那么它一定得回复我们,对吧。为了能够智能点,我们就用到了图灵得接口图灵真的非常好用能够 查天气语音**讲故事**讲笑话 下面附上第三步的代码

2021-12-06
1

浅谈语音助手可以给企业带来什么?

未来, 无疑是数字化的,采用语音助手很可能成为商业战略的一个必要组成部分,正确使用语音 AI 为各种市场开辟了新的机会。如果不确定语音手可能对自己的企业品牌有什么好处,这里有一些方法可以将语音助手整合到业务中,并且...

2021-12-04
0

使用pytorch和卷积实现stft/istft

语音项目中我们通常会使用stft对特征进行提取,很多python库也提供了接口。本文主要介绍使用librosa,torch,以及卷积方式进行stft和istft的运算。

2021-12-01
0

中文域名连通人工智能的元宇宙

11月1日,工业和信息化部印发了“十四五”信息通信行业的发展规划,在栏目“构建新型行业管理体系”的第一条“全面增强基础管理能力”中特别提到:完善中文域名应用环境,进一步推动中文域名应用。...

2021-11-30
1

金融/语音/音频处理学术速递[11.24]

【1】 Pricing cryptocurrencies : Modelling the ETHBTC spot-quotient variation as a diffusion process标题:加密货币定价:将ETHBTC现货商数变化建模为扩散过程链接:https://arxiv.org/abs/2111......

2021-11-25
1

元宇宙中可跨语种交流!Meta 发布新语音模型,支持128种语言无障碍对话

语言交流是人类互动一种自然的方式,随着语音技术的发展,我们可以与设备以及未来的虚拟世界进行互动,由此虚拟体验将于我们的现实世界融为一体。...

2021-11-25
0

Meta发布支持128种语言的新语音模型:指向元宇宙跨语种交流,可在线试玩

Facebook AI(bushi),更准确地说是Meta AI,刚刚发布了自监督语音处理模型XLS-R,共支持128种语言。

2021-11-23
0

AI在华东金融专场 | 腾讯云核心伙伴进阶营走进上海

11月18-19日,“腾讯云•核心伙伴进阶营•基础产品专场”活动在上海成功举办。本次活动选取了适合合作伙伴推广的私有化标准产品,从伙伴激励、渠道赋能、技术支持等多个维度助力合作伙伴提升在腾讯云基础产品的能力,帮助...

2021-11-22
1