变身“神笔马良”，国产AI只需要15秒

09-04 228阅读 0评论

8 月 29 日， Midjourney 宣告将进入硬件范畴，并在交际媒体 X 上发布音讯广揽人才，来充分其新建立的硬件部分。

AI绘画好像要卷出新形状。

这并不古怪。Midjourney 创始人 David Holz 曾任 Leap Motion 的首席技能官，具有丰厚的硬件经历。他的前搭档——现为Midjourney 硬件部分负责人——Ahmad Abbas 也曾在苹果公司作业过五年，担任硬件司理，参加了 Vision Pro 头显的研制。

在此之前，我曾问过一众美术、规划相关专业的从业者，Midjourney对ta们来说意味着什么。得到最多的答案是：创意。

而对非艺术专业的，比方我，或是为了配插图，或是出于猎奇，抽卡自娱，也补偿补偿应试教育那些年没能开发自己艺术细菌的惋惜。

但由于Midjourney的运用有必定的门槛（比方魔法，比方一些些米），也劝退了不少人。

好在，跟着AI产品的国产化，国内大模型的AI绘画也成长了起来。那么今日，咱们就来横向测评几个国产文生图的AI模型，并静候AI绘画的新形状。

今日参加测评的玩家有：快手可灵AI、字节即梦AI、商汤秒画。

为了更好地提示各家大模型的所长，测评的系列则混合人像、绘画、写实、3D、再创造等几个方面。

考虑到便利比照，接下来即以系列主题为纲，所生成的条目按可灵、即梦、秒画的顺序排列，图画份额都设置为1:1，其他参数默许。

终究，结合操作过程中的运用体会和特色给出总评，着急的朋友能够直接下拉到操作体会和总评环节。

人像

1. 拍摄，中景，穿戴传统汉服的我国女人，手持折扇，高雅含笑，在古典园林中散步。

2. 特写，夜景，时髦芭莎杂志，金发碧眼的欧洲女孩，黑色夹克，酷辣风格，站在巴黎埃菲尔铁塔前，手里有一杯咖啡。

从人像模块能够看到，第1个prompt里，我的指令是手持折扇，即梦给了我一个团扇；

第2个prompt里，三家好像都没有get到我金发碧眼的指令，生成的图片都是蓝瞳。

绘画

1. 我国水墨画，“孤舟蓑笠翁，独钓寒江雪”，意境悠远，云雾旋绕。

2. 人物脸部速写，铅笔画，中年男子，穿戴宇航服，有着爱因斯坦相同吐舌头的表情。

绘画的功力在第1个prompt里其实高低立见。

第2个prompt里没有秒画的图并不是我漏了，而是秒画提示我不合法字符，我换掉了“爱因斯坦”和“脸部”，都没有成功生成，权且这样，也提示一下想凭借 AI 完结作业的朋友，把此类不确定要素考虑在内。

写实

1. 动物：一只威武的狮子，卧在非洲大草原上，慵懒地晒着太阳。

2. 车：一辆经典的老爷车，行进在60年代的美国公路上，周围是宽广的沙漠景象。

在写实这个版块，狮子的光影层次可灵体现得更好。

秒画好像并没有get到“写实”的滋味，保持着绘画的风格。不过，后边也会提到，相对于可灵没得选，即梦6种迭代模型外，秒画有着29种基模型能够挑选风格化的定制生图。

不知道哪位选手画出了你心中的老爷车。

3D虚拟

1. 动漫风格，一位具有超能力的动漫少女，眼睛闪烁着奥秘光辉，布景是未来都市。

2. 动画风格，一个充溢魔法书本的图书馆，书架上的书本漂浮在空中，书架之间有魔法生物在络绎。

在这个版块，除了提示词所要求的魔法生物外，即梦是仅有画出了人的形象的AI。

再创造

在这个版块，我本来想看看AI生图的想象力和对文明的了解能力，顺便把我喜爱的影视作品中be（bad ending）的惋惜变成he（happy ending），可是……。

prompt1：画一个至尊宝和紫霞仙子在一同的结局。

可是没想到我也be了，嗯，仍是别在一同了。

我想再给ta们一次时机，考虑到我说得不行切当，不死心的我再次输入一个prompt。

prompt2：画一个《海上钢琴师》中主角1900终究上岸了的日子场景。（尽管我也站不上岸）

好的，我了解了，触及人文范畴，AI 八成要be。

不过，我乐于见到的是，创造力这种东西，依然归于人类。AI或许能够供给创意，但它的纯文本想象力，现在依然停步于为人类打辅佐。

再创造也向我再次确证，只要与人类产生相关的全部才有含义。

操作体会

首先是功用区一览，我把可灵、即梦和秒画的操作区拼在了一同。

从操作上看，三位选手都是支撑垫图的，可灵和秒画都能够挑选生成1张 or 多张，即梦只能一次性生成4张，再从中选出自己中意的图。

即梦和秒画一同支撑调理份额和尺度，可灵只支撑调理份额。

从运用体会感来说，可灵和秒画的生成速度大约在15秒，即梦有时耗时20秒，有时耗时一分多钟，而且产生这种状况的概率是3:7。不过，它生成的图也更多。

假如氪金的话，可灵在图片生成之后，还能够进一步画质增强，而“生成视频”这个按钮，将一键直达“图生视频”，也就是说，在sora的中心插了一步画面风格挑选。

即梦生成图片之后，除了相同能够生成视频之外，支撑画布修改、超清图、细节修正、部分重绘、扩图和消除笔等功用。

而秒画，则在prompt的细节上有着较为“Midjourney”的体现，如优化提示词、负向提示词以及加快形式等，大有对标Midjourney的目的。

值得一提的是，除了上述的29个基模型，在模型广场中，总共呈现了74个不同风格的模型（包括29个基模型在内）。

公正起见，在上述测评中，我运用的依然是默许的Artist v1.0 Alpha模型。咱们在运用时能够自取所需，重复探究。

总评环节

总的来说，可灵、即梦和秒画在AI绘画这个产品上各有特色。

在我看来，人像模块，可灵对我国面孔有着更好的了解，更少的“网红感”，更多的东方滋味。外国面孔，秒画有着更好的细节。

绘画里，三位选手对传统诗篇内容都有着较好的了解能力，秒画对水墨画的艺术概念更明晰，但在人像速写中，或许会呈现不稳定的状况，可灵则体现得更好。

写实中，可灵和即梦都了解了需求，而秒画好像还沉浸在绘画的指令里。

3D虚拟版块，三家难分伯仲，不难了解，AI绘画为何会成为创造者的创意来历。

再创造范畴，或许需求提早垫图，否则或许会得到适当魔性的画风。AI的了解力，没有延伸到咱们的文明日子。

运用门槛上，三家的操作都较为流通，可灵和即梦有着根底66分左右的创意值（通行钱银称号），省着点用，可灵能够生成大约300次，即梦60屡次，两者每天报到都送积分。秒画则是每天免费10次生成，更屡次数或可约请老友一同领3天无限卡。

我是余杨，致力于开掘 AI 的有用场景，假如你也有观念、主意或想看的测评，欢迎和我沟通。假如你喜爱这期内容，别忘了一键三连，由于这是我探究更新的动力，咱们下期再会～

相关阅读

发表评论取消回复

评论列表（暂无评论，228人围观）

还没有评论，来说两句吧...

目录[+]