声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。
【新智元导读】Midjourney5.2的更新太震撼了,无限变焦,每一帧极致高清,微观宇宙比韦伯望远镜看得还远。
Midjourney和Stable Diffusion,已经卷到没边了!
(相关资料图)
几乎在Stable Diffusion XL0.9发布的同一时间,Midjourney宣布推出了5.2版本。
此次5.2版本最亮眼的更新在于zoom out功能,它可以无限扩展原始图像,同时保持跟原始图像的细节相同。
用zoom out做出的无垠宇宙动画,直接让人震惊到失语,可以说,Midjourney5.2看得比詹姆斯韦伯太空望远镜还要远!
这个极其强大的功能,可以创造出非常神奇的图片,甚至还能被用来拍摄毫无破绽的高清变焦视频!
这个「核弹级」更新,让网友直呼:你们这个功能也太强大了,直接把我的睡眠毁了!
玩了一个小时之后,这名网友再次表示:太强大了,我要哭了……
无限缩放,像宇宙一样没有尽头——
老奶奶宇宙中有多少个老奶奶?答案是无穷个——
爱丽丝追逐着小兔子不小心掉下了「兔子洞」,便进入了仙境。
而网友用zoom out自制的这个「兔子洞」,简直如梦如幻。
还有一个AI图像设计团队——ilumine AI只用一张很小的原画,就通过Zoom Out生成了下面这个宏大的场景图片。
然后再配合自家正在开发的技术2D转3D的技术,直接做了一个3D的游戏场景。
相信等到他们的产品正式推出之后,配合Midjourney Zoom Out这种凭空扩图的功能,用一张原画直接做出3D场景。
这简直是要革了游戏行业的命了,很多游戏制作从业者应该要哭出声吧。
Zoom Out誓要碾压Adobe AI和Uncrop?
此前,Adobe’s Generative Fill的填充功能,就被网友们玩疯了,它填充的周星驰电影剧照,可谓「毫无破绽」。
而Stability AI也紧接着放出大招。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。
而Midjourney的V5.2的zoom out功能,也是不遑多让,甚至更加强大。
只要通过「/image」命令输入提示,Midjourney就会根据你的prompt生成四个视觉迭代图,你可以选择自己最喜欢的一个来放大,这个过程中,整个图像都会以更高的细节被渲染。
现在,所有Upscale的图像下方都有「Zoom Out」按钮,您可以使用它们来重新生成图像。
先给定一张需要缩放的原图,点击下面的「缩放两倍」的按钮。
和之前我们介绍过的Uncrop一样,Midjourney会生成4张备选的图案。
缩放之后4张备选图案的风格都非常一致,只是在背景的细节上有些差别。
在选择了4个Upscale的图案中的一个之后,还可以接着选择放大两倍对照片进行持续缩放。
可以看得出进一步缩放之后的图案风格和细节依然非常一致,如果你想持续缩放下去,就可以做出开头哈勃望远镜的效果。
你只要不停地重复这个过程,就能生成一张巨大无比的拥有无限多细节的「巨图」。
再配上热心网友的指导,就能生成文章一开头的「无限宇宙缩放动画」:
左图如梦似幻的仙境,还可以继续扩大,让艺术和梦幻的世界无限扩张……
网友们激动得觉也不睡了,直接玩疯了。
这已经是大师级的艺术作品了。
墨菲斯变成绝地武士,场景扩大后,显得更厉害了。
有网友感慨道:Midjourney v5.2模拟从极近镜头到全开镜头的摄像机运动时,简直太赞了。
下一步是不是就是把速率变成每秒24-60帧,角色变成可移动的?12个月内是不是Midjourney就会有文字转视频服务了?
当然,还有紧跟时事的网友,为马老板做了八角笼对战图。
三大软件的无限缩放功能对比
Uncrop因为是免费软件,不知道是由于官方的处于节省资源的考虑还是技术上的问题,他们是不支持无限套娃缩放的。
原图:
缩放一次之后:
第二次缩放之后就会产生黑边,拒绝套娃。
而Midjourney的套娃宇宙我们在上边已经见识过它的效果了。
PS的GF,理论上只要画布能无限扩大,也可以吧一张图片在空白处无限补全,达成无限缩放的效果。
只是实现起来要比Midjourney麻烦一些。
硬核网友手把手教你怎么做猫头鹰视频
问题来了,文章开头那段震撼的猫头鹰飞行变焦视频,是怎么做出来的?
大师级网友「歸藏」给出了手把手教我们的详细教程。
首先,生成一张猫头鹰图,然后用下面的1.5倍Zoom Out按钮。
在连续重复这个过程7次之后,得到了7张视频的关键帧图像。
把他们排序之后,登陆app.cunwayml.com,在左边导航找到创建视频这个Tab,然后找到Frame Interpolation这个功能。
然后用我们做好的这7张图,拖进左边的位置上传,检查顺序无误后就可以点击Generate生成视频了。
一段时间之后就可以看到这段视频的预览效果,不过,普通用户只能导出720P。
太长不看版:V5.2更新的8大功能
简而言之,这次V5.2更新,可以概括为如下8大功能。
1方形重构(SquareReframe)
-扩大图片大小
-选择制作方形
这次该更新附带的一个「制作正方形」工具,可以改变以正方形以外的纵横比制作图像的形状。
使用这个工具,就可以调整任何照片的大小,重构图片,社交媒体上怎么方便展示,就怎么调整。
2标准变焦(StandardZoom1.5-2x)
选择缩放1.5倍或2倍。
这个功能适合短距离变焦,可以为照片添加更多细节。
3无限缩放「EndlessZoom(Re-ZoomaPic)」
这个功能可以围绕特定角色,为图片制作全新的大背景。
4自定义缩放重构(CustomZoomReframing)
无论是艺术家、设计师还是品牌,都可以自定义图像大小,让图片适应任何在线平台。
5风格化(Stylize)
Midjourney经过训练,可以创建具有艺术闪光和丰富视觉美感的图像,这是它与Stable Diffusion的最大区别。
以前,用户可以在提示的末尾添加「–styleize X」(图 X 的范围从0-1000),但 V5.2采用了该模型现有的风格化功能,并在真实感和天赋方面将它们增加到11。
6变化模式(VariationMode)
Midjourney V5.2还附带了一个名为「变化模式」的新功能,可以用户反复打磨想要应用于输出的视觉细微差别。
在prompt中使用「低变化」模式,就能生成一致的角色形象,而如果选择「高变化」,就会导致与原始输出的较大的视觉差别,四张图片就会更加具有创意和艺术表现力。
7不同的个人照片(VaryIndividualPics)
给它一张你的原始图片,你可以选择生成好四个类似的你,或者风格变化非常大的你。
8更短提示(/ShortenPrompts)
关于Midjourney,人们往往有一个误解:如果在prompt中使用更多单词,就会看到更好或更详细的结果。
但其实,过于冗长的提示往往会抵消每个单词的影响,从而导致输出的图片并不一定符合用户的想法。
而这次Midjourney更新的缩短」命令功能,就可以分析prompt的成分,为我们提供了一些替代方案的建议。
通过全新的prompts,往往能让原始图片生成更惊艳的结果。
参考资料:
https://arstechnica.com/information-technology/2023/06/stunning-midjourney-update-wows-ai-artists-with-camera-like-feature/
https://the-decoder.com/midjourney-5-2-brings-zoom-out-and-integrated-prompt-analysis/
https://twitter.com/op7418/status/1672457908939014145
关键词: