最新 最热

GPT-SoVITS - 1分钟人声样本,完成声音克隆

集成了语音伴奏分离、训练集自动分割、中文ASR、文本标注等工具,帮助初学者创建训练数据集和GPT/SoVITS模型。

2024-04-21
2

openai whisper 语音识别,语音翻译

Whisper 是openai开源的一个通用的语音识别模型,同时支持把各种语言的音频翻译为成英文(音频->文本)。

2024-03-08
3

【RV1126】移植sherpa实时语音识别和TTS文字转语音功能

参考:【RV1126】移植kaldi实时语音识别 https://blog.csdn.net/qq_28877125/article/details/130376397

2024-02-28
4

【机器学习】Transformer:自然语言处理的巅峰之作

Transformer引入的自注意力机制,使得模型在处理输入序列时能够聚焦于不同位置的信息,而不受限于传统循环结构的依赖关系。这种机制使得模型能够更好地捕捉长距离依赖,从而提高了对语义信息的理解能力。自注意力机制的巧...

2024-02-21
2

谷歌2023年裁员超12000人,遣散费支出高达21亿美元!

1月31日消息,根据谷歌(Google)母公司Alphabet于30日公布的2023年第四季度及全年财报显示,谷歌在2023年裁员了超过12,000名员工,遣散费及相关费用支出高达21亿美元,而且随着裁员的继续,相关支出仍在不停追加。...

2024-02-06
1

在全志R128上进行HiFi5语音算法部署

在 lichee/rtos-components/thirdparty/Kconfig 中追加:

2024-02-02
1

Unity Hololens2开发|(七)MRTK3子系统 TextToSpeechSubsystem(文本转语音)

腾讯云开发者社区是腾讯云官方开发者社区,致力于打造开发者的技术分享型社区。提供专栏,问答,沙龙等产品和服务,汇聚海量精品云计算使用和开发经验,致力于帮助开发者快速成长与发展,营造开放的云计算技术生态圈。...

2024-01-18
1

FreeSwitch: esl inbound模式下外呼拨号

相信大家可能接到过一些电话,听上去不象是真人打过来的,比如:通知“您的信用卡到期了”,或者“您订的飞机航班取消了,请尽快改签或取消行程”,这种就是所谓的“自动外呼”系统,技术上讲,可以通过 esl inbound模式实现(注:对esl...

2024-01-14
1

盘点一个Python自动化办公实战案例(二)

前几天在Python最强王者交流群【钟爱一生】问了一个Python自动化办公的问题,一起来看看吧。

2023-12-26
1

AudioGPT 语音技术全覆盖:语音识别、增强、分离、风格迁移等 | 开源日报 No.114

oil.nvim 是一个类似于 vim-vinegar 的文件浏览器,允许您像普通 Neovim 缓冲区一样编辑文件系统。其主要功能包括支持常见插件管理器、通过适配器抽象进行所有文件系统交互以及提供 API 来执行各种操作。该项目的关键...

2023-12-15
2