最新 最热

RNN、LSTM、GRU神经网络构建人名分类器

以一个人名为输入, 使用模型帮助我们判断它最有可能是来自哪一个国家的人名, 这在某些国际化公司的业务中具有重要意义, 在用户注册过程中, 会根据用户填写的名字直接给他分配可能的国家或地区选项, 以及该国家或地区...

2024-06-03
4

01-大语言模型发展

LLM,Large Language Model,大语言模型。为什么叫2.0?因为在大语言模型,也就是LLM出现之前,我们把它归结为1.0时代。那么1.0时代主要的是NLP(自然语言处理)的各类工程,它其实都是一个特点,就是说通用性比较差。那么整个AI领域的...

2024-05-25
1

【AI大模型】AI大模型热门关键词解析与核心概念入门

腾讯云开发者社区是腾讯云官方开发者社区,致力于打造开发者的技术分享型社区。提供专栏,问答,沙龙等产品和服务,汇聚海量精品云计算使用和开发经验,致力于帮助开发者快速成长与发展,营造开放的云计算技术生态圈。...

2024-05-25
1

十分钟掌握在 PyTorch 中构建一个深度神经网络,基本组件、步骤和代码实现,从导入模块和定义网络结构到训练和评估网络性能。

深度神经网络(Deep Neural Networks, DNNs),也被称为人工神经网络(Artificial Neural Networks,ANNs),已成为当今机器学习任务中最流行、最成功的方法之一。这些网络能够表示数据中的复杂关系,并在图像分类、自然语言处理、语...

2024-05-25
2

训练深度神经网络,使用反向传播算法,产生梯度消失和梯度爆炸问题的原因?

反向传播是神经网络训练的精髓。它是根据上一个迭代获得的误差(即损失)对神经网络的权重进行微调的做法。权重的适当调整可确保较低的误差,从而通过提高模型的泛化能力使其变得可靠。反向传播算法的核心思想和工作原理可...

2024-05-25
1

RNN-循环神经网络

自然语言处理(Nature language Processing, NLP)研究的主要是通过计算机算法来理解自然语言。对于自然语言来说,处理的数据主要就是人类的语言,我们在进行文本数据处理时,需要将文本进行数据值化,然后进行后续的训练工作。...

2024-05-24
4

BayesFlow:使用神经网络的摊销贝叶斯工作流框架

BayesFlow: AMORTIZED BAYESIAN WORKFLOWS WITH NEURAL NETWORKS

2024-05-22
1

国产五大模型之一MiniMax 使用国内首个MOE架构

阿里被曝2024年面向AIGC的第二次大手笔投资来了——加注大模型赛道独角兽Minimax,领投至少6亿美元。

2024-05-21
2

探索深度学习的奥秘:从入门到进阶

在当今这个信息爆炸的时代,人工智能(AI)和机器学习(ML)已经不再是遥不可及的科幻概念,而是逐渐成为我们生活的一部分。其中,深度学习(Deep Learning)作为机器学习的一个重要分支,凭借其强大的特征学习和处理能力,已经在图像识别...

2024-05-13
1

PyTorch 图像篇

计算机视觉技术是一门包括计算机科学与工程、神经生理学、物理学、信号处理、认知科学、应用数学与统计等多学科的综合性科学技术, 是人工智能的一个重要分支, 目前在智能安防、自动驾驶汽车、医疗保健、生成制造等领域...

2024-05-13
2