智谱AI在KDD大会了,发布更新了一系列大模型。
包括大语言模型、文生图、图像/视频理解、视频生成模型。
GLM-4-Plus 语言基座模型
在语言解析、指令执行和长篇幅文本处理上实现了显著的性能飞跃,确立了其在全球AI领域的领先地位。
GLM-4-Plus目前具备的能力:【视频总结能力】 【推理能力】 【多轮对话】 【时间问答能力】
CogView-3-Plus 文生图模型
展现出与业界顶尖的 MJ-V6 和 FLUX 模型相媲美的卓越性能。
CogView-3-Plus已集成至 智谱清言 ,可以直接在清言APP中体验。
CogView-3-Plus已开放API,可以通过 智谱AI开放平台 BigModel 中接入使用。
GLM-4V-Plus 图像/视频理解模型
不仅在图像识别上达到了卓越水平,还引入了先进的时间感知机制,优化了视频内容的理解。
该模型即将在智谱的开放平台上线,标志着国内通用视频理解模型 API 的首次亮相。
具备高质量图像理解和视频理解能力的多模态模型 GLM-4V-Plus,性能指标接近GPT-4o。
CogVideoX 视频生成模型
继2B版本开源后,其5B版本也已正式开源,性能大幅提升,成为目前开源领域中视频生成技术的佼佼者。
A garden comes to life as a kaleidoscope of butterflies flutters amidst the blossoms, their delicate wings casting shadows on the petals below. In the background, a grand fountain cascades water with a gentle splendor, its rhythmic sound providing a soothing backdrop. Beneath the cool shade of a mature tree, a solitary wooden chair invites solitude and reflection, its smooth surface worn by the touch of countless visitors seeking a moment of tranquility in nature's embrace.
还有个功能,智谱清言的视频通话功能,还在内测......