画笔之争!Dall-E 3 vs MidJourney 5.2 vs Stable Diffusion XL:AI绘画三强PK!

2023-11-09 12:37:35 浏览数 (1)

Dall-E 3是OpenAI最新发布的AI图像生成器,近期在AI领域引起了广泛的关注。它以其卓越的能力令人瞩目,成为了人们热议的话题。相较于之前的Dall-E版本,它在连贯性和图像质量方面有了显著的提升,给人们留下了深刻的印象。

但是Dall-E 3与其最接近的竞争对手MidJourney 5.2和Stable Diffusion XL相比如何呢?

在本文中,我将使用六个不同的提示来比较这三个模型,以查看哪个能够产生最佳的结果。


1. 连贯性

Prompt: An astronaut riding a steel horse on the moon. The astronaut is wearing a medieval armor with a party hat and a green sword.一位宇航员骑着一匹钢铁马在月球上。宇航员身穿中世纪盔甲,戴着派对帽子,手持一把绿色的剑。

连贯性是Dall-E 3的亮点之一。Dall-E 3做到了完美呈现,捕捉到了每一个奇怪的细节。而其他模型则在派对氛围(忽略了帽子)和剑的呈现上有所遗漏,似乎忘记了这些重要的元素。

2. 超现实景观

Prompt: A dreamy landscape where clouds are made of cotton candy and rivers flow with liquid gold.一幅如梦般的景观,云朵如棉花糖般蓬松,河水如液态黄金般流淌。

从外观上来看,我可以说Dall-E 3在这三个模型中仍然是最出色的。通过以独特的方式请求将可识别的元素混合在一起,您可以评估每个AI模型从零开始理解和构建场景的能力。

3. 历史虚构

Prompt: Ancient Egyptian pharaoh using a modern smartphone while riding a dinosaur.古埃及法老骑着恐龙时使用现代智能手机。

MidJourney在这个例子中的结果看起来最酷,但它未能融入古埃及法老的元素。Dall-E 3在这一轮中仍然获胜。

在这个提示中,我想要结合不同的时代,并测试AI对历史准确性和时代错乱元素的认知。一个好的图像生成器应该能够提供一个仍然具有可信度的混合效果。

4. 情感传达

Prompt: A portrait of a woman holding a wilted rose, her expression one of profound sadness and longing.一个女人拿着一朵枯萎的玫瑰的画像,她的表情充满了深深的悲伤和渴望。

这是一个“你是否能理解情感?”的测试。因为有时情绪重要的不仅仅是外观,还有氛围。在这一轮中,Stable Diffusion XL获胜。

这个提示测试了AI通过面部表情和象征性元素传达情感的能力,从中可以看出它们对微妙的人类情感的理解。

5. 生物设计

Prompt: An image of a ‘thunderbird,’ a mythical creature that controls storms, depicted in its natural habitat during a fierce thunderstorm.一张描绘了“雷鸟”的图片,它是掌控风暴的神秘生物,描绘了在猛烈的雷雨期间在其自然栖息地中的景象。

在这个提示中,Dall-E 3已经非常棒,但MidJourney在创造性概念方面表现的更为出色。鸟的形象令人叹为观止,风暴也异常狂野,整个场景给人一种独特的氛围!这个提示需要对不存在的事物进行创造性的构思,测试AI的想象力边界。它还涉及到环境和天气元素,增加了复杂性,并观察AI如何生成特殊效果(如闪电)。

6. 建筑设计

Prompt: Design an eco-friendly futuristic city floating on the ocean, with advanced technology and harmony between nature and artificial structures.设计一个环保的未来城市,它将漂浮在海洋上,实现先进技术与自然和人工结构之间的和谐。

在这个类别中,每个模型都是优秀的,但我更偏向Dall-E3生成的设计。这个设计的柔和色调和元素的对称性给人一种令人向往的感觉,仿佛是一个每个人都想居住的酷炫地方。


如何使用Dall-E 3:

Dall-E 3现在是ChatGPT的一部分,仅对付费用户开放。您也可以在Bing聊天中免费使用Dall-E 3,但不清楚它会免费提供多长时间。

如何使用MidJourney 5.2:

目前官方唯一的使用方式是通过Discord。请点击此邀请链接 https://discord.gg/midjourney加入频道,开始创建您自己的AI图像。

如何使用Stable Diffusion XL:

有多种方式可以使用Stable Diffusion XL,包括HuggingFace、ClipDrop以及在本地设备上设置。我建议使用Playground.AI https://playgroundai.com/create免费使用SDXL。

总结

这三个AI图像生成器所产生的图像质量令人印象深刻,但它们各自具有优点和缺点。

MidJourney在视觉美学方面仍然是佼佼者,经常能够生成令人惊叹和富有创意的图像。然而,它的连贯性可能不够稳定,有时会生成不真实或毫无意义的图像。

Dall-E 3在连贯性方面优于MidJourney,但其图像在视觉上可能不够吸引人。Dall-E 3在遵循指令并生成与特定描述相匹配的图像方面表现更好。

SDXL是一个全能的AI图像生成器,但在视觉美学和连贯性方面都落后于MidJourney和Dall-E 3。

总的来说,我认为最适合您的AI图像生成器将取决于您的具体需求。

IT一线从业者抱团群

致力于帮助广大开发者提供高效合适的工具,让大家能够腾出手做更多创造性的工作,也欢迎大家分享自己公司的内推信息,相互帮助,一起进步!

组建了程序员,架构师,IT从业者交流群,以交流技术职位内推行业探讨为主

0 人点赞