Dall-E 3是OpenAI最新发布的AI图像生成器,近期在AI领域引起了广泛的关注。它以其卓越的能力令人瞩目,成为了人们热议的话题。相较于之前的Dall-E版本,它在连贯性和图像质量方面有了显著的提升,给人们留下了深刻的印象。
但是Dall-E 3与其最接近的竞争对手MidJourney 5.2和Stable Diffusion XL相比如何呢?
在本文中,我将使用六个不同的提示来比较这三个模型,以查看哪个能够产生最佳的结果。
1. 连贯性
Prompt: An astronaut riding a steel horse on the moon. The astronaut is wearing a medieval armor with a party hat and a green sword.一位宇航员骑着一匹钢铁马在月球上。宇航员身穿中世纪盔甲,戴着派对帽子,手持一把绿色的剑。
连贯性是Dall-E 3的亮点之一。Dall-E 3做到了完美呈现,捕捉到了每一个奇怪的细节。而其他模型则在派对氛围(忽略了帽子)和剑的呈现上有所遗漏,似乎忘记了这些重要的元素。
2. 超现实景观
Prompt: A dreamy landscape where clouds are made of cotton candy and rivers flow with liquid gold.一幅如梦般的景观,云朵如棉花糖般蓬松,河水如液态黄金般流淌。
从外观上来看,我可以说Dall-E 3在这三个模型中仍然是最出色的。通过以独特的方式请求将可识别的元素混合在一起,您可以评估每个AI模型从零开始理解和构建场景的能力。
3. 历史虚构
Prompt: Ancient Egyptian pharaoh using a modern smartphone while riding a dinosaur.古埃及法老骑着恐龙时使用现代智能手机。
MidJourney在这个例子中的结果看起来最酷,但它未能融入古埃及法老的元素。Dall-E 3在这一轮中仍然获胜。
在这个提示中,我想要结合不同的时代,并测试AI对历史准确性和时代错乱元素的认知。一个好的图像生成器应该能够提供一个仍然具有可信度的混合效果。
4. 情感传达
Prompt: A portrait of a woman holding a wilted rose, her expression one of profound sadness and longing.一个女人拿着一朵枯萎的玫瑰的画像,她的表情充满了深深的悲伤和渴望。
这是一个“你是否能理解情感?”的测试。因为有时情绪重要的不仅仅是外观,还有氛围。在这一轮中,Stable Diffusion XL获胜。
这个提示测试了AI通过面部表情和象征性元素传达情感的能力,从中可以看出它们对微妙的人类情感的理解。
5. 生物设计
Prompt: An image of a ‘thunderbird,’ a mythical creature that controls storms, depicted in its natural habitat during a fierce thunderstorm.一张描绘了“雷鸟”的图片,它是掌控风暴的神秘生物,描绘了在猛烈的雷雨期间在其自然栖息地中的景象。
在这个提示中,Dall-E 3已经非常棒,但MidJourney在创造性概念方面表现的更为出色。鸟的形象令人叹为观止,风暴也异常狂野,整个场景给人一种独特的氛围!这个提示需要对不存在的事物进行创造性的构思,测试AI的想象力边界。它还涉及到环境和天气元素,增加了复杂性,并观察AI如何生成特殊效果(如闪电)。
6. 建筑设计
Prompt: Design an eco-friendly futuristic city floating on the ocean, with advanced technology and harmony between nature and artificial structures.设计一个环保的未来城市,它将漂浮在海洋上,实现先进技术与自然和人工结构之间的和谐。
在这个类别中,每个模型都是优秀的,但我更偏向Dall-E3生成的设计。这个设计的柔和色调和元素的对称性给人一种令人向往的感觉,仿佛是一个每个人都想居住的酷炫地方。
如何使用Dall-E 3:
Dall-E 3现在是ChatGPT的一部分,仅对付费用户开放。您也可以在Bing聊天中免费使用Dall-E 3,但不清楚它会免费提供多长时间。
如何使用MidJourney 5.2:
目前官方唯一的使用方式是通过Discord。请点击此邀请链接 https://discord.gg/midjourney加入频道,开始创建您自己的AI图像。
如何使用Stable Diffusion XL:
有多种方式可以使用Stable Diffusion XL,包括HuggingFace、ClipDrop以及在本地设备上设置。我建议使用Playground.AI https://playgroundai.com/create免费使用SDXL。
总结
这三个AI图像生成器所产生的图像质量令人印象深刻,但它们各自具有优点和缺点。
MidJourney在视觉美学方面仍然是佼佼者,经常能够生成令人惊叹和富有创意的图像。然而,它的连贯性可能不够稳定,有时会生成不真实或毫无意义的图像。
Dall-E 3在连贯性方面优于MidJourney,但其图像在视觉上可能不够吸引人。Dall-E 3在遵循指令并生成与特定描述相匹配的图像方面表现更好。
SDXL是一个全能的AI图像生成器,但在视觉美学和连贯性方面都落后于MidJourney和Dall-E 3。
总的来说,我认为最适合您的AI图像生成器将取决于您的具体需求。
IT一线从业者抱团群
致力于帮助广大开发者提供高效合适的工具,让大家能够腾出手做更多创造性的工作,也欢迎大家分享自己公司的内推信息,相互帮助,一起进步!
组建了程序员,架构师,IT从业者交流群,以
交流技术
、职位内推
、行业探讨
为主