变身“神笔马良”,国产AI只需要15秒

09-04 228阅读 0评论

8 月 29 日, Midjourney 宣告将进入硬件范畴,并在交际媒体 X 上发布音讯广揽人才,来充分其新建立的硬件部分。

 

AI绘画好像要卷出新形状。

 

这并不古怪。Midjourney 创始人 David Holz 曾任 Leap Motion 的首席技能官,具有丰厚的硬件经历。他的前搭档——现为Midjourney 硬件部分负责人——Ahmad Abbas 也曾在苹果公司作业过五年,担任硬件司理,参加了 Vision Pro 头显的研制。

 

在此之前,我曾问过一众美术、规划相关专业的从业者,Midjourney对ta们来说意味着什么。得到最多的答案是:创意。

 

而对非艺术专业的,比方我,或是为了配插图,或是出于猎奇,抽卡自娱,也补偿补偿应试教育那些年没能开发自己艺术细菌的惋惜。

 

但由于Midjourney的运用有必定的门槛(比方魔法,比方一些些米),也劝退了不少人。

 

好在,跟着AI产品的国产化,国内大模型的AI绘画也成长了起来。那么今日,咱们就来横向测评几个国产文生图的AI模型,并静候AI绘画的新形状。

 

今日参加测评的玩家有:快手可灵AI、字节即梦AI、商汤秒画。

 

为了更好地提示各家大模型的所长,测评的系列则混合人像、绘画、写实、3D、再创造等几个方面。

 

考虑到便利比照,接下来即以系列主题为纲,所生成的条目按可灵、即梦、秒画的顺序排列,图画份额都设置为1:1,其他参数默许。

 

终究,结合操作过程中的运用体会和特色给出总评,着急的朋友能够直接下拉到操作体会和总评环节。

 

人像


1. 拍摄,中景,穿戴传统汉服的我国女人,手持折扇,高雅含笑,在古典园林中散步。




 

2. 特写,夜景,时髦芭莎杂志,金发碧眼的欧洲女孩,黑色夹克,酷辣风格,站在巴黎埃菲尔铁塔前,手里有一杯咖啡。




 

从人像模块能够看到,第1个prompt里,我的指令是手持折扇,即梦给了我一个团扇;

 

第2个prompt里,三家好像都没有get到我金发碧眼的指令,生成的图片都是蓝瞳。


绘画


1. 我国水墨画,“孤舟蓑笠翁,独钓寒江雪”,意境悠远,云雾旋绕。

 



 

2. 人物脸部速写,铅笔画,中年男子,穿戴宇航服,有着爱因斯坦相同吐舌头的表情。



 

绘画的功力在第1个prompt里其实高低立见。

 

第2个prompt里没有秒画的图并不是我漏了,而是秒画提示我不合法字符,我换掉了“爱因斯坦”和“脸部”,都没有成功生成,权且这样,也提示一下想凭借 AI 完结作业的朋友,把此类不确定要素考虑在内。


写实


1. 动物:一只威武的狮子,卧在非洲大草原上,慵懒地晒着太阳。

 



 

2. 车:一辆经典的老爷车,行进在60年代的美国公路上,周围是宽广的沙漠景象。




 

在写实这个版块,狮子的光影层次可灵体现得更好。

 

秒画好像并没有get到“写实”的滋味,保持着绘画的风格。不过,后边也会提到,相对于可灵没得选,即梦6种迭代模型外,秒画有着29种基模型能够挑选风格化的定制生图。

 

不知道哪位选手画出了你心中的老爷车。


3D虚拟


1. 动漫风格,一位具有超能力的动漫少女,眼睛闪烁着奥秘光辉,布景是未来都市。





 

2. 动画风格,一个充溢魔法书本的图书馆,书架上的书本漂浮在空中,书架之间有魔法生物在络绎。




 

在这个版块,除了提示词所要求的魔法生物外,即梦是仅有画出了人的形象的AI。

 

再创造


在这个版块,我本来想看看AI生图的想象力和对文明的了解能力,顺便把我喜爱的影视作品中be(bad ending)的惋惜变成he(happy ending),可是……。

 

prompt1:画一个至尊宝和紫霞仙子在一同的结局。

 

 

可是没想到我也be了,嗯,仍是别在一同了。

 

我想再给ta们一次时机,考虑到我说得不行切当,不死心的我再次输入一个prompt。

 

prompt2:画一个《海上钢琴师》中主角1900终究上岸了的日子场景。(尽管我也站不上岸)

 

 

好的,我了解了,触及人文范畴,AI 八成要be。

 

不过,我乐于见到的是,创造力这种东西,依然归于人类。AI或许能够供给创意,但它的纯文本想象力,现在依然停步于为人类打辅佐。

 

再创造也向我再次确证,只要与人类产生相关的全部才有含义。


操作体会


首先是功用区一览,我把可灵、即梦和秒画的操作区拼在了一同。

 

 

从操作上看,三位选手都是支撑垫图的,可灵和秒画都能够挑选生成1张 or 多张,即梦只能一次性生成4张,再从中选出自己中意的图。

 

即梦和秒画一同支撑调理份额和尺度,可灵只支撑调理份额。

 

从运用体会感来说,可灵和秒画的生成速度大约在15秒,即梦有时耗时20秒,有时耗时一分多钟,而且产生这种状况的概率是3:7。不过,它生成的图也更多。

 

假如氪金的话,可灵在图片生成之后,还能够进一步画质增强,而“生成视频”这个按钮,将一键直达“图生视频”,也就是说,在sora的中心插了一步画面风格挑选。

 

 

即梦生成图片之后,除了相同能够生成视频之外,支撑画布修改、超清图、细节修正、部分重绘、扩图和消除笔等功用。

 

 

而秒画,则在prompt的细节上有着较为“Midjourney”的体现,如优化提示词、负向提示词以及加快形式等,大有对标Midjourney的目的。

 

 

值得一提的是,除了上述的29个基模型,在模型广场中,总共呈现了74个不同风格的模型(包括29个基模型在内)。

 

 

公正起见,在上述测评中,我运用的依然是默许的Artist v1.0 Alpha模型。咱们在运用时能够自取所需,重复探究。


总评环节


总的来说,可灵、即梦和秒画在AI绘画这个产品上各有特色。

 

在我看来,人像模块,可灵对我国面孔有着更好的了解,更少的“网红感”,更多的东方滋味。外国面孔,秒画有着更好的细节。

 

绘画里,三位选手对传统诗篇内容都有着较好的了解能力,秒画对水墨画的艺术概念更明晰,但在人像速写中,或许会呈现不稳定的状况,可灵则体现得更好。

 

写实中,可灵和即梦都了解了需求,而秒画好像还沉浸在绘画的指令里。

 

3D虚拟版块,三家难分伯仲,不难了解,AI绘画为何会成为创造者的创意来历。

 

再创造范畴,或许需求提早垫图,否则或许会得到适当魔性的画风。AI的了解力,没有延伸到咱们的文明日子。

 

运用门槛上,三家的操作都较为流通,可灵和即梦有着根底66分左右的创意值(通行钱银称号),省着点用,可灵能够生成大约300次,即梦60屡次,两者每天报到都送积分。秒画则是每天免费10次生成,更屡次数或可约请老友一同领3天无限卡。

 

我是余杨,致力于开掘 AI 的有用场景,假如你也有观念、主意或想看的测评,欢迎和我沟通。假如你喜爱这期内容,别忘了一键三连,由于这是我探究更新的动力,咱们下期再会~

 


发表评论

快捷回复: 表情:
评论列表 (暂无评论,228人围观)

还没有评论,来说两句吧...

目录[+]