智谱AI发布了类GPT4o的视频通话功能,现在可以和AI无缝交流了

2024-10-08 20:48:22 浏览数 (1)

智谱AI在KDD大会了,发布更新了一系列大模型。

包括大语言模型、文生图、图像/视频理解、视频生成模型。

GLM-4-Plus 语言基座模型

在语言解析、指令执行和长篇幅文本处理上实现了显著的性能飞跃,确立了其在全球AI领域的领先地位。

GLM-4-Plus目前具备的能力:【视频总结能力】 【推理能力】 【多轮对话】 【时间问答能力】

CogView-3-Plus 文生图模型

展现出与业界顶尖的 MJ-V6 和 FLUX 模型相媲美的卓越性能。

CogView-3-Plus已集成至 智谱清言 ,可以直接在清言APP中体验。

CogView-3-Plus已开放API,可以通过 智谱AI开放平台 BigModel 中接入使用。

GLM-4V-Plus 图像/视频理解模型

不仅在图像识别上达到了卓越水平,还引入了先进的时间感知机制,优化了视频内容的理解。

该模型即将在智谱的开放平台上线,标志着国内通用视频理解模型 API 的首次亮相。

具备高质量图像理解和视频理解能力的多模态模型 GLM-4V-Plus,性能指标接近GPT-4o。

CogVideoX 视频生成模型

继2B版本开源后,其5B版本也已正式开源,性能大幅提升,成为目前开源领域中视频生成技术的佼佼者。

A garden comes to life as a kaleidoscope of butterflies flutters amidst the blossoms, their delicate wings casting shadows on the petals below. In the background, a grand fountain cascades water with a gentle splendor, its rhythmic sound providing a soothing backdrop. Beneath the cool shade of a mature tree, a solitary wooden chair invites solitude and reflection, its smooth surface worn by the touch of countless visitors seeking a moment of tranquility in nature's embrace.

还有个功能,智谱清言的视频通话功能,还在内测......

0 人点赞