让照片开口说话!基于音频生成动画 | 开源日报 No.253

2024-05-10 17:03:39 浏览数 (2)

OpenTalker/SadTalkerhttps://github.com/OpenTalker/SadTalker

Stars: 10.3k License: NOASSERTION

SadTalker 是一个基于音频驱动的单幅图像对话头像动画生成项目。它可以将单幅人像图像与音频结合,生成逼真的视频对话头像。该项目的主要功能和核心优势包括:

  • 支持单幅图像加音频生成对话头像视频。
  • 通过 Discord 整合,用户可以免费使用,也可以通过发送文件或文本提示生成高质量视频。
  • 提供稳定的扩散 WebUI 扩展,支持全图模式。
  • 不断更新版本,增加新特性,修复 Bug,优化性能。
  • 提供了详细的安装教程和社区教程,覆盖多种操作系统。
  • 支持模型下载脚本,提供预训练模型,同时提供离线模型供用户选择。

Asabeneh/30-Days-Of-Reacthttps://github.com/Asabeneh/30-Days-Of-React

Stars: 24.3k License: NOASSERTION

30-Days-Of-React 是一个逐步指南,帮助你在 30 天内学习 React。这个项目的主要功能、关键特性和核心优势包括:

  • 逐步指南,每天学习不同的 React 主题
  • 提供视频教程以辅助学习
  • 需要 HTML、CSS 和 JavaScript 中级水平技能
  • 可以通过 Fork 该仓库来创建自己的副本进行工作

meta-llama/codellamahttps://github.com/meta-llama/codellama

Stars: 15.0k License: NOASSERTION

codellama 是 CodeLlama 模型的推理代码。

  • 提供了基于 Llama 2 的大型语言模型,具有开放模型中最先进的性能。
  • 支持填充功能、大输入上下文和 0-shot 指令跟随能力。
  • 提供多种不同应用场景的版本:基础模型(Code Llama)、Python 特化版本(Code Llama - Python)和指令跟随模型(Code Llama - Instruct),分别拥有 7B、13B 和 34B 参数。
  • 所有模型都是在 16k 标记序列上训练,并且在最多 100k 标记输入时显示出改进。

esphome/esphomehttps://github.com/esphome/esphome

Stars: 7.7k License: NOASSERTION

esphome 是一个通过简单但强大的配置文件控制您的 ESP8266/ESP32 的系统,并通过家庭自动化系统远程控制它们的工具。

  • 通过简单的配置文件进行 ESP8266/ESP32 控制
  • 可以远程控制设备
  • 与家庭自动化系统集成

langchain-ai/langgraphhttps://github.com/langchain-ai/langgraph

Stars: 2.7k License: MIT

langgraph 是一个构建语言代理图的库。该项目的核心问题是构建具有状态的多参与者应用程序,利用 LLMs 构建,建立在 LangChain 之上。

  • 使用 LangChain 表达语言来协调多个链 (或者参与者) 在多个计算步骤中以循环方式进行计算。
  • 受 Pregel 和 Apache Beam 的启发。
  • 提供了一个类似于 NetworkX 的接口。
  • 主要用于将循环添加到 LLM 应用程序中。
  • 不仅仅针对有向无环图 (DAG) 的工作流程进行了优化。

0 人点赞