接触 AI 并创造一个电影故事

Posted on Apr 17th,2023

今年过完年后，开始看到一些完成度很高的 AI 手绘作品，有纯日漫的，也有些 CG 风格的，我当时就在想，既然都 AI 了，那生成手绘图和生成真人照片也没什么难度上的区别了吧，果然，很快就出现了一批又一批超逼真的美少女图片了，虽然质感上还是能跟真人区分开来，但已经足够震撼了。

一个多月前，我第一次用 AI 生成下面这张图，用的是 Draw Things，Prompt 非常简单，就是“girl, happy”，虽然只是一个简单的操作，但我觉得非常神奇，这是一个世界上独一无二的人物，是由我用文字“创造”出来的。接下来整个下午我都在摸索这个软件，兴奋之余更多的是惊吓，动漫模型还好，一些真人模型，动不动就手脚乱飞、面目扭曲，有些真的离谱到引起生理不适。

这段时间，我还开始使用内嵌了 ChatGPT 的 New Bing，New Bing 的出现对我工作和生活的影响是巨大的，我想使用过 ChatGPT 这类 AI 工具的人都能理解吧。

现在我想知道一个什么事都会想要直接问它，特别是我在学习 AI 的时候，看到别人的 Prompt 不知道什么意思，我一定会先问他，如果直接用百度或者 Google 翻译，它只能告诉你对应的中文是什么，但具体是什么却无从而知，比如一些游戏术语，一些虚拟引擎的名称等等，而 New Bing 会告诉你这个代表的是什么，是哪个领域的什么东西，以及其他相关的信息，对于准确理解一个 Prompt 的含义，这简直是保姆级喂饭了。还比如我需要虚构一些内容、翻译出特定场合下的英文等等，New Bing 都帮了大忙。具体的使用，我待会在下面介绍电影案例的时候会说到。

有天晚上，我灵机一动，想试试描述一个场景，让 New Bing 来输出 Prompt ，我再输入到 Draw Things 来生图，想着他们 AI 之间应该比较了解彼此吧，哈。

我告诉它这么一个场景：一个小女孩在雨夜的街道摔倒了。让它输出用于 AI 生图的 Prompt，并将这个故事拓展一下。结果如下图所示，它的 Prompt 很有意思，它还联想出了“泰德熊”这类的词，所以在一些图里面小女孩是抱着泰德熊的，它写的故事也很有意思，说是小女孩因为要去看望生病的妈妈，跑太快所以摔倒了等等。一个由 AI 创作的图文作品如此鲜活地出现在现实世界里。

由于 Draw Things 的效果比较有限，所以我开始尝试安装更加主流的 Stable Diffusion，但多次安装失败后放弃，转而选择了 Diffusion Bee，它比 Draw Things 多了垫图的功能，但质量还是很一般。然后我就把目光转向了 Midjourney，这才真正打开新世界的大门。

我之前就注册过 Discord，也进到了 Midjourney 的界面，但完全看不懂怎么玩。这次是看了知乎上别人的作品，眼前一亮，跟 Stable Diffusion 那些美少女不一样，Midjourney 的图更有设计感，或者说是艺术感，我决定再尝试一次，一探究竟。

Midjourney 现在是我最主要的 AI 生图工具，配合 New Bing 来使用，非常丝滑，于是有了接下来所要介绍的这个虚拟电影故事《Forest Missing》，哈，扯了这么半天，终于要说到正题了。

我是在无意中生成了下面这一张图。这张图超强的电影质感让我很兴奋，我很自然地脑补了一个悬疑剧情：森林里发生了一宗离奇的命案，FBI 女警探带队前来调查，她到底发现了什么？于是我决定把这张图作为一部电影的开头，虚构出一部完整的影片。

我先根据这个 idea 在 New Bing 生成一个大致的剧情，包括男女主角的名字，然后生成片名和导演的名字。我根据剧情在 Midjourney 中生成剧照和海报，甚至P了一张虚拟的豆瓣截图，让这部“电影”看起来更像那么回事，哈哈。

这个作品发在即刻上到现在有1000多个赞，还入选了“即刻镇小报”，这种感觉很像当年作品被站酷放在首屏 Banner 推荐一样，超级开心。

Midjourney Prompt 参考：Portrait Photography, 8k, IMDB, RottenTomatoes, a man and a women searching in the wilderness at night, Flashlights and radios in the dark forest, A tense and thrilling atmosphere, –ar 16:9

“肖像摄影 Portrait Photography”，“纪实摄影 Documentary Photography” 这样的 Prompt 用来提升剧照的质感很有帮助，不然容易出现一些手绘风格的图像。

制作海报的话把比例改成 “ –ar 3:4 ” , 然后加上 “ The title of the movie in bold letters ” 让片名出现，不过片名的字母一般都是乱的，只能看个大概的感觉，后期还需要自己PS。

上面看到的每一个场景我都是生成了无数张，然后挑选完成度比较高的、契合剧情的来拼凑成一个勉强能说得通的故事。

这套作品我是用 Midjourney V4 版本生成的，手的问题还是比较明显的，所以我尽量选那些看不到手的或者手在比较暗的地方的。我完成这套作品的隔天，V5 就发布了，对于手的处理提升了很多，如果它早一点发布就好了。不知道 AI 这个技能对于电影剧组前期生成一些概念图是不是可以起到一些帮助。

最近这段时间，准确地说，就这两个月，AI 技术的发展突飞猛进，各种应用遍地开花。就文字生图、写文案这类工具到处都是，还有老照片修复、上色，图像4倍放大，智能抠图什么的就更不用说了。还有将图片变成视频的 D-ID，文字生成音乐的 Mubert，我在下一篇文章里会介绍我创作的一部小短片，就是用到了这两个工具。对于热爱电影的我来说，Runway 公司即将推出的自动生成电影的 Gen-2 让我非常期待。

AI 对于我现在设计工作上的影响，我上周在公司内部做了比较完整的分享，我简单说一下。

我尝试丢一些 Prompt 给 Midjoureny 做 Logo，以前开玩笑说下班前给我100个方案，现在也就是点25下鼠标而已。我尝试让它做包装盒、做Web页面、将我们的吉祥物小鲸鱼3D化等等，这些它都可以做到，但是细节完全经不起推敲，只是看起来是那么回事，所以当前作为参考和灵感来源完全OK，但要直接拿来用，还远远没有达到要求。

我还发现一个有趣的事情，我将某个收费图库的图片的英文标签，直接作为 Prompt 丢给 Midjoureny，结果生成了非常类似的图片，哈。

我们的生信团队想试试看是否可以通过父母的照片推算出孩子的模样，我尝试用成年男女的图片用 /blend 命令生成一个新的人像，然后用这个人像作为垫图，再生成出不同年龄的男童女童，效果如下图。