登录注册
AI视觉字谜爆火,梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型
069金韭韭
关灯吃面的韭菜种子
2023-12-04 12:44:53

 

AI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?!

 

这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来!

哪怕是截然不同的对象也可以,例如一位男子,经过反色处理,就神奇地转变成一名女子:

 就连单词也能被翻转出新效果,happy和holiday只在一旋转间:

 

原来,这是来自密歇根大学的一项“视觉字谜”新研究,论文一发出就在Hacker News上爆火,热度飙至近800。

 

英伟达高级AI科学家Jim Fan赞叹称:

这是我近期见到最酷的扩散模型!


 

还有网友感叹称:

这让我想到了从事分形压缩工作的那段经历。我一直认为它是纯粹的艺术。

 

要知道,创作一幅经过旋转、反色或变形后呈现出新主题的绘画作品,怎么也需要画家对色彩、形状、空间具备一定的理解能力。

如今连AI也能画出这样的效果,究竟是如何实现的?实际效果是否有这么好?

我们上手试玩了一番,也探究了一下背后的原理。

Colab就能直接试玩

我们用这个模型绘制了一组Lowpoly风格的画,让它正着看是一座山,反过来则是城市的天际线。

 同时,我们让ChatGPT(DALL·E-3)也试着画了一下,结果除了清晰度高一些之外似乎就没什么优势了。


而作者自己展示的效果则更加丰富,也更为精彩。

一座雪后的山峰,旋转90度就变成了一匹马;一张餐桌换个角度就成了瀑布……

 最精彩的还要属下面这张图——从上下左右四个角度看,每个方向的内容都不一样。

(这里先考验一下各位读者,你能看出这四种动物分别是什么吗?)

 

 

而下面这两张图虽然没做到四个方向每个都有“新内容”,但还是做出了三个不同的方向。


原文链接:https://www.thepaper.cn/newsDetail_forward_25520620

最终:尘归尘  土归土

过程有点意思~~~~~~~~~~~~




[1]https://news.ycombinator.com/item?id=38477259

[2]https://arxiv.org/pdf/2311.17919.pdf

[3]https://twitter.com/DrJimFan/status/1730253638935920738






作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
因赛集团
S
引力传媒
S
万兴科技
S
万集科技
S
果麦文化
工分
1.60
转发
收藏
投诉
复制链接
分享到微信
有用 1
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据