最新 最热

一群顶尖搜索人才如何 2 个月出货,还把 GPU 利用率干到 60%!揭秘百川智能研发大模型这一年

王小川在去年 4 月份宣布成立“百川智能”的两个月后,就迅速对外推出了 70 亿参数量的中英文预训练大模型 Baichuan 7B。一年多后的今天,百川智能已经将大模型迭代到了 Baichuan 4。...

2024-06-27
1

25 年软件开发经验老司机告诉你:如何用生成式 AI 做项目管理!

我有 25 年软件开发和领导团队的经验。今年,我重新回到产品和编程相关的工作上,恰逢生成式 AI 助手(如 Claude3、ChatGPT、Llama2 和 MistralAI 等大语言模型)蓬勃发展。它们的出现对我来说非常有价值。...

2024-06-27
1

检索增强生成:革命性技术还是过度承诺?

本文将深入剖析 RAG(Retrieval-Augmented Generation)所宣称的能力和其在实际应用中的表现。我们首先将探讨 RAG 的工作原理,评估其潜在的优势。随后,我们将分享在实践中遇到的一些挑战,以及我们为应对这些挑战所开发的解...

2024-06-27
1

Slack 结合 AST 和 LLM 自动转换 15000 个单元测试,成功率达 80%

Slack 的工程团队最近发表了一篇文章,分享了他们如何使用大型语言模型(LLM)自动将 15000 个单元和集成测试 从 Enzyme 迁移到 React Testing Library (RTL)。通过结合抽象语法树(AST)和 AI 驱动的自动化方法,Slack 实现了 8...

2024-06-27
1

斯坦福人工智能指数 2024 报告:人工智能法规和生成式人工智能投资的增长

斯坦福大学以人为中心的人工智能研究所(HAI)发布了《2024 人工智能指数年度报告》(2024 AI Index annual report)。该报告确定了人工智能的主要趋势,例如自 2022 年以来,生成式人工智能投资增长了 8 倍。...

2024-06-27
1

清华大学教授黄民烈:如何把大模型“调教”成我们放心的样子

OpenAI 安全团队与公司高层的矛盾由来已久,随着首席科学家 Ilya Sutskever 的离职,大模型的安全问题再次成为舆论中心。业内对大模型的安全问题也形成了两派:一派以杨立昆为代表,他们认为对于安全的紧迫感是过度夸张,另一...

2024-06-27
1

CVPR竞赛冠军方案:运动表达引导视频分割方法,代码及技术报告均已开源

在CVPR 2024 像素级视频理解(PVUW)挑战赛中,来自塔普智能(Tapall.ai)、南方科技大学、谢菲尔德大学、华威大学的研究团队在运动表达引导视频分割(MeViS)赛道上获得冠军。该团队提出的技术专为解析由自然语言表达引导的视频内...

2024-06-27
1

AI: 从零开始训练一个最小化的Transformer聊天机器人

这里将介绍如何从零开始,使用Transformer模型训练一个最小化的聊天机器人。该流程将尽量简化,不依赖预训练模型,并手动实现关键步骤,确保每一步都容易理解。...

2024-06-27
1

为什么Kubernetes对于生成式AI很有意义?

Kubernetes 对第三方运营商、存储集成、GPU 支持等的支持使其成为 GenAI 应用程序的绝佳平台。

2024-06-27
1

禁止开源的呼吁是错误和危险的

呼吁“禁止开源”最早出现在去年秋天——部分原因是Meta和其他公司“开放”大型语言模型 (LLM)。游说者在政治集会和政策圈中四处散布这个词。然而,许多批评者无法解释开源在任何情况下意味着什么,并且不熟悉开源定义 (...

2024-06-27
1