0 前言
腾讯混元大模型(Tencent Hunyuan)具备:
- 强大的中文创作能力
- 复杂语境下的逻辑推理能力
- 可靠的任务执行能力
基于混元大模型,腾讯云推出文本生成、图像创作、视频创作产品方案,覆盖全场景AIGC应用:
1 都有啥产品?
1.1 大模型知识引擎
混元生文
基于自然语言对话方式,可结合输入的文本或图片输出相关文本内容,可在文本生成、创作、问答等场景服务各类行业。
点击,进入新闻摘要:
正好 OpenAI最近有大更新的头条:
我们来看看使用混元大模型的解读:
快速帮我们总结了这篇全英文AI头条的核心概念。再不用自己翻译并用中文通读和理解一遍了!
而且还支持直接截图去理解回答:
1.2 混元文生图大模型
混元生图
基于混元文生图大模型,可结合输入的文本描述智能创作出与输入相关的图像内容,为高质量的内容创作、内容运营提供技术支持。
1.3 大模型图像创作引擎
提供AI图像生成与编辑技术服务,可以结合输入的文本或图片智能创作图像。
图像风格化
基于图生图技术将输入的图像进行风格转化,支持动漫、3D、水彩画等多种风格。
大模型图像创作引擎提供AI图像生成与编辑技术服务,可以结合输入的文本或图片智能创作图像。
AI写真
提供 AI 写真训练与生成能力,训练指定人物形象的写真模型,生成多样化风格的写真形象照。
商品背景生成
按照自定义的文本描述智能生成和替换商品图中的背景画面。
1.4 大模型视频创作引擎
视频转译
转译后的视频,能够保留说话人的音色特征,同时实现说话人口型与目标语种一致的视听效果。适用于视频本地化、跨境电商等场景。
基于大模型视频创作引擎,包括视频转译、视频风格化、图片跳舞等多项视频创作能力,基于腾讯混元大模型等一系列领先的人工智能音视频处理技术,支持用户高质量生成视频并处理视频内容。广泛应用在影视制作、广告营销、短视频、游戏等领域。
视频风格化
基于混元视频生成大模型技术,支持将输入视频生成特定风格的视频。生成后的视频画面流畅自然,时序一致性强。
图片跳舞
输入单张全身人像照片并选择舞蹈模板,即可生成对应模板的跳舞视频。生成后的视频,表情自然、动作流畅,娱乐性强。
1.5 人脸融合
人脸融合(Face Fusion)可将一张人脸图像对应的人脸特征融合到模板图像中的特定人物上,生成的图片既兼具指定图像和模板图像中的人脸特征,也保持了模板图像中人物的姿态、表情、动作等属性,支持单脸、多脸、选脸融合。
2 创建自己的应用
比如1.1节里提到的混元生文,点击【创建为我的应用】:
应用配置
可配置如下基础信息:
知识管理
注意到这里的知识库和支持的大模型列表:
点击上图中的蓝色高亮的【知识管理】就来到这里:
我们来导入本地文件:
等待他解析并完成内容审核成功:
学习中,【发布】按钮会置灰:
等到学习完成,文档即变成待发布状态,之后点击发布即可,填写发布说明:
等待发布过程结束,这里注意到文档也会消耗一定 token 的哟:
发布管理
发布成功通知后,点击去调用:
直接根据指引,选择直接在线使用还是接入 API 即可玩耍:
3 更多规格的大模型
点击直达:
新用户专享资源包
新人还能 0 元购!
体验混元的无穷乐趣,点击直达,直接0 元开通!