语音识别_字节宝

pipeline（管道）是huggingface transformers库中一种极简方式使用大模型推理的抽象，将所有大模型分为音频（Audio）、计算机视觉（Computer vision）、自然语言处理（NLP）、多模态（Multimodal）等4大类，28小类任务（tasks），共计覆盖32万个模...

人工智能语音识别 pipeline 模型音频

2024-08-13

【机器学习】机器学习与语音识别的融合应用与性能优化新探索

语音识别是人工智能和机器学习领域的重要分支，旨在将人类语音转换为文本或执行相应的操作。随着深度学习技术的发展，机器学习在语音识别中的应用取得了显著进展，推动了智能助手、自动驾驶、医疗诊断等领域的发展。本文将...

模型数据性能优化机器学习语音识别

2024-08-06

玩转AI新声态 | 玩转TTS/ASR/YuanQI 打造自己的AI助手

本次带来的是腾讯云玩转AI新声态语音产品应用实践,利用 TTS / ASR / 元器智能体打造一个《小朋友的故事屋》智能体 Bot 最近腾讯发布了元宝,那么我们就做一个专属讲故事的童话匠该 bot 可以实现语音和智能体交流达到...

语音合成 aigc 语音识别语音助手玩转腾讯云语音项目实战腾讯云语音技术 yuanqi-sdk-java 元器前端后端

2024-07-06

AI: Transformer在神经网络中的位置及其重要性

近年来，Transformer模型在神经网络领域中引起了广泛关注，尤其在自然语言处理（NLP）领域表现出色。本文将详细介绍Transformer在神经网络中的位置、其工作原理、优势以及在不同领域的应用。...

语音神经网络语音识别模型系统

2024-06-25

【教程】极简Python接入免费语音识别API

语音识别（speech recognition）技术，也被称为自动语音识别（英语：Automatic Speech Recognition, ASR）、电脑语音识别（英语：Computer Speech Recognition）或是语音转文本识别（英语：Speech To Text, STT），其目标是以电脑自动将人类......

Python 语音识别

2024-05-28

1 2 3 4 5

我用MOKI帮我制作了一系列儿童动画短片

语音识别与语音控制的原理介绍

AI中的端到端end to end到底是什么意思？

【AI音频处理】：重塑声音世界的无限可能

使用AI识别语音和B站视频并通过GPT生成思维导图

【人工智能】Transformers之Pipeline（二）：自动语音识别（automatic-speech-recognition）

【机器学习】机器学习与语音识别的融合应用与性能优化新探索

玩转AI新声态 | 玩转TTS/ASR/YuanQI 打造自己的AI助手

AI: Transformer在神经网络中的位置及其重要性

【教程】极简Python接入免费语音识别API

热门文章

热门手册