01、GOT-OCR2.0
GOT-OCR2.0
是一款开源强大的端到端 OCR 模型,不仅支持传统的场景文本和文档识别,还能处理乐谱、图表、甚至复杂的数学公式!
模型设计采用了一个集成的 vision encoder 和 decoder,能够同时处理多种类型的 OCR 输入,从而极大提高了信息传递的效率。
尤其是在高分辨率图像处理方面,GOT-OCR-2.0 采用了 local attention 机制,以避免全局注意力机制在高分辨率图像中的内存消耗问题。
Star:3.8k
项目地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0
主要功能:
- • 支持多场景文本识别
- • 一体化端到端设计
- • 高效处理高分辨率图像
- • 适应 AI 2.0 时代
02、Maccy
Maccy
是一款轻量级的开源 macOS 剪贴板管理工具,它能帮你记录剪贴板历史,并可以快速找到之前的剪贴板内容,快捷键操作,简单快捷。
Star:12.1k
项目地址:https://github.com/p0deje/Maccy
主要功能:
- • 轻量级且极简主义
- • 快捷键操作
- • 快速搜索和访问
- • 原生 UI,完美兼容 macOS
03、DrawingSpinUp
DrawingSpinUp
是一款非常有趣的 3D 动画生成系统,它能够通过输入单一角色绘画生成高质量的 3D 动画,极大地简化了从 2D 图像到 3D 动画的制作流程。
Star:306
项目地址:https://github.com/LordLiang/DrawingSpinUp
主要功能:
- • 高质量 3D 动画:保持角色绘画的细节和风格,还能精准地还原角色的动作和表现
- • 预训练模型:提供了预训练好的模型,用户无需从头进行训练即可直接使用
- • 多领域应用:动画制作、游戏开发、虚拟现实等
- • 风格化生成:保持输入绘画的风格,将原画的艺术风格带入 3D 动画