我们整理了GTC2022精彩讲座预告,欢迎大家报名参加
01
在云中大规模构建大型语言模型 [A41328]
Oracle 云基础设施 (OCI) 专为高性能工作负载(包括自然语言处理)而设计和构建。甲骨文云已经展示了使用 NeMo-Megatron 将几个节点上的 BERT 等工作负载扩展到 GPT-3 等大型语言模型 (LLM),跨越数百到数千个节点。了解将 OCI 用于 LLM 的注意事项、方法、挑战和真实客户洞察。
时间:Thursday, Sep 223:00 AM - 3:25 AM CST
02
大型语言模型的高效大规模训练和部署 [A41200]
NeMo Megatron 使企业能够使用多种并行技术轻松地大规模训练和部署大型transformer模型。在本次演讲中,我们将解释如何在多节点环境中预处理数据、自动选择最佳超参数以最小化多个 GPT-3 和 T5 配置的训练时间、大规模训练模型并部署模型 在具有易于使用的脚本集的多节点生产环境中。NeMo Megatron 使工作流程自动化,缩短了部署时间,并降低了总拥有成本。此外,我们将展示如何自动创建提示以使模型适应不同的下游任务。
时间:Thursday, Sep 22/5:00 AM - 5:50 AM CST
03
启用基于大语言模型的 AI 应用程序的快速路径 [A41199]
大型语言模型 (LLM) 不断增长且功能强大。然而,它们需要深厚的技术专长和大量计算才能为应用程序部署,这使得大多数人无法开始使用它们。然而,诸如 p-tuning 之类的进步已经改变了从业者如何在工作负载和行业(如内容生成、摘要、聊天机器人、医疗保健、药物发现、营销、代码生成等)中应用 LLM。在本次演讲中,我们将重点介绍几种途径 开发涉及具有数千亿参数的定制 LLM 的 AI 应用程序,使所有软件开发人员都可以访问 LLM。p-tuning 等最先进的技术允许为特定用例定制 LLM。LLM 的快速原型设计、实验和开发通过 NVIDIA AI 平台解锁。
时间:Thursday, Sep 225:00 AM - 5:50 AM CST
04
如何让您的会话应用程序对话 [A41126]
为了跟上竞争的步伐,您的应用程序应提供高度准确的信息,并以不同语言向许多客户提供实时表达的声音。加入本次会议,了解如何快速将您的无声应用程序转变为具有匹配或优于人类语音准确性的引人入胜的对话应用程序。该课程包括动手演示,展示了如何轻松地将 NVIDIA Riva 应用于您的特定领域应用程序。
时间:Thursday, Sep 224:00 AM - 4:50 AM CST
05
使用 AI 服务从非结构化信息中获得洞察(由 Oracle Cloud 提供)[A41397]
呼叫中心接到的电话对于提高客户满意度至关重要。但是,从记录的通话中提取必要的信息并运行适当的分析以大规模发现洞察力是一项挑战。了解 OCI 语音、OCI 语言和其他 AI 服务如何结合起来帮助您获得新的见解。OCI Speech 可以转录来电并通过 OCI 语言运行转录以发现情感和意义。提取的洞察力可与 Oracle Analytics 一起使用,以识别趋势并帮助培训客户支持代表。此外,OCI 异常检测允许它采取异常并抢先生成警报。OCI 预测可以根据呼叫数据和趋势预测客户保留率和客户流失率。了解如何利用 Oracle 提供的预构建 AI 模型来实现流程自动化、发现新见解和预测,并迈向新的数字时代。。
06
语音 AI 揭秘 [A41127]
诸如自动语音识别 (ASR) 和文本转语音 (TTS) 等语音 AI 技术使当今的数百万次对话自动化。它们通过虚拟助手、联络中心座席助手和数字化身等应用程序为客户提供个性化的类人体验。我们将回顾一些鼓舞人心的用例和解决方案,以应对刚开始使用语音 AI 的企业所面临的常见挑战。学习实现世界级准确性和为您的行业定制的技术。我们还将展示如何使用 NVIDIA Riva 构建语音 AI 管道。。
时间:Thursday, Sep 2212:00 AM - 12:50 AM CST
07
大规模语音转文本 [A41340]
语音转文本通常被视为“已解决的问题”,但开箱即用的解决方案在现实生活中很少有用,而且它们通常没有有意义的定制。 曾经为企业创建的每个联络中心都由主题和词汇不同于一般英语的企业情境组成。 在为 T-Mobile 的联络中心创建第一个语音驱动的 AI 体验时,我们发现了三个大问题:(1) 我们如何构建和部署自动语音识别 (ASR) 模型? (2) 我们如何从手机获取音频到我们在云端的模型? (3) 我们如何确保我们的 ASR 模型在我们的专家和客户使用的所有类型的语音中公平地工作? 我们将介绍我们与 NVIDIA NeMo 的模型开发,与 NVIDIA Riva 的云部署,我们在模型中识别和消除偏见的努力,以及 T-Mobile 语音到文本的未来。
时间:Thursday, Sep 222:00 AM - 2:50 AM CST
08
大规模语音转文本 [A41340]
语音转文本通常被视为“已解决的问题”,但开箱即用的解决方案在现实生活中很少有用,而且它们通常没有有意义的定制。 曾经为企业创建的每个联络中心都由主题和词汇不同于一般英语的企业情境组成。 在为 T-Mobile 的联络中心创建第一个语音驱动的 AI 体验时,我们发现了三个大问题:(1) 我们如何构建和部署自动语音识别 (ASR) 模型? (2) 我们如何从手机获取音频到我们在云端的模型? (3) 我们如何确保我们的 ASR 模型在我们的专家和客户使用的所有类型的语音中公平地工作? 我们将介绍我们与 NVIDIA NeMo 的模型开发,与 NVIDIA Riva 的云部署,我们在模型中识别和消除偏见的努力,以及 T-Mobile 语音到文本的未来。
时间:Thursday, Sep 222:00 AM - 2:50 AM CST
08
人机交互的未来 [A41193]
我们将分享 Adept 如何构建自然语言界面的未来,让每个人都能成为专家。研究主题将包括从 Adept 和 NVIDIA 如何修改 Megatron-LM 以在非同质网络环境中跨数千个 GPU 有效训练大型语言模型 (LLM) 到我们如何使 LLM 理解屏幕并采取行动的完整堆栈。
时间:Thursday, Sep 222:00 AM - 2:50 AM CST
更多预告:
GTC2022精彩讲座预告|智能视频分析及智能制造
GTC2022精彩讲座预告|自动驾驶及自主机器人