最新 最热

我用MOKI帮我制作了一系列儿童动画短片

MOKI 是由美图公司推出的 AI 视频短片创作工具,辅助视频创作者创作动画短片、网文短剧、故事绘本以及音乐视频(MV)。

2024-10-08
0

语音识别与语音控制的原理介绍

机器硬件:OriginBot(导航版/视觉版)PC主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3语音版

2024-09-20
0

AI中的端到端end to end到底是什么意思?

在人工智能(AI)的世界里,有一个听起来非常直观但又略带神秘的术语——“端到端”(end to end)。这个术语在AI领域中频繁出现,尤其是在自动驾驶、语音识别和图像识别等领域。那么,到底什么是端到端,它又是怎样改变我们的技术体...

2024-09-11
0

【AI音频处理】:重塑声音世界的无限可能

随着人工智能技术的飞速发展,其应用领域也在不断拓宽,其中音频处理作为一个充满挑战与机遇的领域,正经历着前所未有的变革。从语音识别、语音合成到音乐创作、声音效果处理,AI在音频处理方面的应用已经深入到我们生活的方...

2024-09-02
0

使用AI识别语音和B站视频并通过GPT生成思维导图

直接发送语音:对AI脑直接发送语音(如使用语音说厦门三天两夜的旅行攻略),AI脑图会使用腾讯云语音识别AI能力,自动识别出语音内容文本,再根据内容文本要求生成结构化易于理解的思维导图,并以图片形式下发给用户。...

2024-08-25
0

【人工智能】Transformers之Pipeline(二):自动语音识别(automatic-speech-recognition)

pipeline(管道)是huggingface transformers库中一种极简方式使用大模型推理的抽象,将所有大模型分为音频(Audio)、计算机视觉(Computer vision)、自然语言处理(NLP)、多模态(Multimodal)等4大类,28小类任务(tasks),共计覆盖32万个模...

2024-08-13
0

【机器学习】机器学习与语音识别的融合应用与性能优化新探索

语音识别是人工智能和机器学习领域的重要分支,旨在将人类语音转换为文本或执行相应的操作。随着深度学习技术的发展,机器学习在语音识别中的应用取得了显著进展,推动了智能助手、自动驾驶、医疗诊断等领域的发展。本文将...

2024-08-06
0

玩转AI新声态 | 玩转TTS/ASR/YuanQI 打造自己的AI助手

本次带来的是腾讯云玩转AI新声态语音产品应用实践,利用 TTS / ASR / 元器智能体 打造一个《小朋友的故事屋》智能体 Bot 最近腾讯发布了元宝,那么我们就做一个专属讲故事的童话匠该 bot 可以实现语音和智能体交流达到...

2024-07-06
0

AI: Transformer在神经网络中的位置及其重要性

近年来,Transformer模型在神经网络领域中引起了广泛关注,尤其在自然语言处理(NLP)领域表现出色。本文将详细介绍Transformer在神经网络中的位置、其工作原理、优势以及在不同领域的应用。...

2024-06-25
0

【教程】极简Python接入免费语音识别API

语音识别(speech recognition)技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR)、电脑语音识别(英语:Computer Speech Recognition)或是语音转文本识别(英语:Speech To Text, STT),其目标是以电脑自动将人类......

2024-05-28
0