最新 最热

普林斯顿开源34B数学大模型:性能媲美谷歌Minerva,参数少一半!550亿token专业数据训练

最近,普林斯顿大学等七家机构联合发布了一个专门用于数学的大语言模型LLEMMA,性能媲美谷歌Minerva 62B,并公开了其模型、数据集和代码,为数学研究带来了前所未有的机会和资源。...

2023-11-19
1

ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力

从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。

2023-11-19
1

「对齐」太强是坏事?人大最新研究:完美正样本反而会损害「图对比学习」

由于在图结构数据中可以轻松的利用边以及节点的drop进行增强,对比学习成为了天然的自监督范式。

2023-11-19
1

计算机指令的流水线执行与流水线冒险

不要等待计算结果保存到目的寄存器,增加一条额外数据通路,将计算的结果直接传给下一条指令计算的输入

2023-11-19
1

囤 H100 的都成了大冤种!英伟达发布最新 AI 芯片 H200:性能提升 2 倍,成本下降 50%

周一,半导体行业巨头英伟达发布了新一代人工智能芯片 H200,旨在为各种 AI 模型提供训练和部署支持。

2023-11-18
1

13B模型全方位碾压GPT-4?这背后有什么猫腻

一个参数量为 13B 的模型竟然打败了顶流 GPT-4?就像下图所展示的,并且为了确保结果的有效性,这项测试还遵循了 OpenAI 的数据去污方法,更关键的是没有发现数据污染的证据。...

2023-11-18
1

玩转围棋、国际象棋、扑克,DeepMind推出通用学习算法SoG

2016 年 3 月,一场机器人与围棋世界冠军、职业九段棋手李世石展开的围棋人机大战受到全球的高度关注。我们知道,最后的结果是 DeepMind 的机器人 AlphaGo 以 4 比 1 的总比分获胜。这是人工智能领域一个里程碑性的事件,...

2023-11-18
1

让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入

AI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。

2023-11-18
1

重要突破!西湖大学团队和浙二医院共同实现脑机接口中文解码

先进神经芯片中心默罕默德·萨万教授团队,自然语言处理实验室张岳教授团队和朱君明教授团队联合发布了他们最新的研究结果:“A high-performance brain-sentence communication designed for logosyllabic language”....

2023-11-18
1

第一个Quarkus+GraalVM架构的应用上线了(13)

经过两周的不懈努力,博主的第一个以Quarkus+GraalVm的业务应用终于上线了,下面是可喜可贺的数据,邀君共赏。阿里牛逼是有道理的,人家的应用早就能够以如此的性能运行了,之前一直不相信,1分钟弹性伸缩扩容200+的实例,现在我信...

2023-11-18
1