最新 最热

FastViT 论文阅读

FastViT 是苹果公司在 ICCV 2023上发表的网络结构设计的论文,在速度和精度上取得比较好的折衷,速度上既能和MobileOne这种轻量级网络匹敌,精度上也不输PoolFormer、ConvNeXt等比较新的大网络结构。...

2023-10-23
1

Code Llama 解读系列1-论文阅读

2023年8月24日,Meta 开源了基于 Llama 2) 通用 LLM 的代码生成系列模型 Code Llama),支持Python, C++, Java, PHP, TypeScript, C# 和 Bash 编程语言,而且支持学术研究和商业使用。...

2023-10-23
1

手机上看arxiv上论文的方法

有时候想要在手机上访问Arxiv上的论文,打开arxiv.com,发现体验比较差,没有响应式设计,需要不断移动页面才能读完一行文字,影响阅读。偶然发现了arxiv-vanity这个网站,发现能很好的满足手机上看arxiv论文的需求,收藏了。...

2023-10-23
1

论文解读: 百川大模型7B和13B技术报告

百川2技术报告详细介绍了模型的研发细节,包括7B和13B两个版本,以及在2.6T数据上进行了训练。报告还提及模型在数学、代码能力以及医疗和法律任务上的显著改善,并对模型安全性能力的提升方法进行了公布。此外,还展示了Baic...

2023-10-22
0

论文解读: streaming-LLM 使各种模型稳定、高效地处理长达400万tokens的文本

为了保持论文中原汁原味的语义信息,保留相关原文,没有刻意翻译成中文,避免造成误解。

2023-10-22
1

生信教程 | 基于PSMC估计有效群体大小

PSMC 模型使用单个个体的完整二倍体序列中的信息来推断种群规模变化的历史。它最初于 2011 年发布,现已成为基因组学领域非常流行的工具。在本教程中,我们将逐步完成为 PSMC 生成必要的输入数据的步骤,并在发布的猛犸象...

2023-10-22
0

Lora升级!ReLoRa!最新论文 High-Rank Training Through Low-Rank Updates

尽管通过扩展导致具有数千亿参数的大型网络在统治和效率方面表现突出,但训练过参数化模型的必要性仍然难以理解,且替代方法不一定能使训练高性能模型的成本降低。在本文中,我们探索了低秩训练技术作为训练大型神经网络的...

2023-10-21
1

加速国内访问 Arxiv 论文的一些方法

我们知道可以用wget命令下载一些网络文件, 不过arxiv 上的论文使用wget下载时需要加参数--user-agent=Lynx,速度才能较快,下面是使用的例子:

2023-10-21
1

11年逆袭,寒门专升本职高生终成MIT博士生!自学CMU课狂发5篇顶会,全网热议

最近,专升本职高生周信静逆袭成MIT博士生的故事,再度刷爆互联网,冲上知乎热搜第一。

2023-10-20
0

陶哲轩再逼近60年几何学难题!周期性密铺问题又获新突破

9月18日,陶哲轩和Rachel Greenfeld将预印本论文《平移单密铺的不可判定性 (Undecidability of translational monotilings)》上传到了arXiv。

2023-10-20
0