智谱AI发布了类GPT4o的视频通话功能，现在可以和AI无缝交流了

智谱AI在KDD大会了，发布更新了一系列大模型。

包括大语言模型、文生图、图像/视频理解、视频生成模型。

GLM-4-Plus 语言基座模型

在语言解析、指令执行和长篇幅文本处理上实现了显著的性能飞跃，确立了其在全球AI领域的领先地位。

GLM-4-Plus目前具备的能力：【视频总结能力】【推理能力】【多轮对话】【时间问答能力】

CogView-3-Plus 文生图模型

展现出与业界顶尖的 MJ-V6 和 FLUX 模型相媲美的卓越性能。

CogView-3-Plus已集成至智谱清言，可以直接在清言APP中体验。

CogView-3-Plus已开放API，可以通过智谱AI开放平台 BigModel 中接入使用。

GLM-4V-Plus 图像/视频理解模型

不仅在图像识别上达到了卓越水平，还引入了先进的时间感知机制，优化了视频内容的理解。

该模型即将在智谱的开放平台上线，标志着国内通用视频理解模型 API 的首次亮相。

具备高质量图像理解和视频理解能力的多模态模型 GLM-4V-Plus，性能指标接近GPT-4o。

CogVideoX 视频生成模型

继2B版本开源后，其5B版本也已正式开源，性能大幅提升，成为目前开源领域中视频生成技术的佼佼者。

A garden comes to life as a kaleidoscope of butterflies flutters amidst the blossoms, their delicate wings casting shadows on the petals below. In the background, a grand fountain cascades water with a gentle splendor, its rhythmic sound providing a soothing backdrop. Beneath the cool shade of a mature tree, a solitary wooden chair invites solitude and reflection, its smooth surface worn by the touch of countless visitors seeking a moment of tranquility in nature's embrace.

还有个功能，智谱清言的视频通话功能，还在内测......

图像识别模型视频性能开源

1 人点赞