最新 最热

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题。

2023-11-02
1

架构风格-架构师(六十六)

管道过滤器是 构件顺序交互,前一个构件的输出时候一个构件的输入。顺序结构或有限循环结构。

2023-11-02
1

大长案例 - 经典长连接可水平扩容高可用架构

这些需求构成了支撑百万充电桩充电业务的长连接可水平扩容高可用架构的基本要求。根据具体情况,可能需要选择合适的技术栈和架构模式来实现这些需求。...

2023-11-02
1

聊聊RNN与Attention

attention mechanism,称为注意力机制。基于Attention机制,seq2seq可以像我们人类一样,将“注意力”集中在必要的信息上。

2023-11-02
1

比流计算资源效率最高提升 1000 倍,“增量计算”新模式能否颠覆数据分析?

数据平台领域发展 20 年,逐渐成为每个企业的基础设施。作为一个进入“普惠期”的领域,当下的架构已经完美了吗,主要问题和挑战是什么?在 2023 年 AI 跃变式爆发的大背景下,数据平台又该如何演进,以适应未来的数据使用场景?...

2023-11-01
1

性能暴涨!苹果M3系列发布:最高920亿晶体管,128GB统一内存!

10月31日早间消息,苹果公司定于美国太平洋时间10月30日17点举行一场名为“来势迅猛”(Scary Fast)的产品发布会,正式发布了最新的M3系列处理器,这也业界首款采用3nm工艺制造的个人计算机芯片,包括M3、M3 Pro和M3 Max。全...

2023-11-01
0

清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。中国科协发布的2023重大科学问题中“如何实现低能耗人工智能”被排在首位。...

2023-11-01
1

每日学术速递10.30

1.Detecting Pretraining Data from Large Language Models

2023-11-01
0

开源语言大模型演进史:早期革新

尽管业内最初强调专有模型,但随着GPT-3等流行语言模型的发布,LLM研究社区开始发布相关开源变体。最早的开源语言模型在性能上落后于最佳的专有模型,不过,它们为提升LLM的研究透明度奠定了基础,并促进了后续LLaMA-2等强大模...

2023-11-01
0

如何优雅兼容公有云和私有化?腾讯低代码混合云「可分可合」架构值得借鉴

「架构设计」没有放之四海而皆准的方法。“软件架构不像桥梁和房屋的架构。桥梁建成后就很难改变,但软件不一样。软件一旦运行起来,我们就可以更深入地了解我们的工作负载,然后再选择一个可演进的架构,在不影响客户体验的...

2023-11-01
1