Sora终于来了，但卷王可灵依然「拍」上了AI电影

栏目分类

时尚潮流网: 时尚新闻; 服装搭配; 美容护肤; 潮流趋势

你的位置：时尚潮流网 > 美容护肤 > Sora终于来了，但卷王可灵依然「拍」上了AI电影

发布日期：2024-12-13 14:12 点击次数：131

机器之心原创

编著：杨文

6个月迭代10余次，快手可灵沿途狂飙。

这次，轮到名导们下场整活了。

短片一开场就尽头颤动：钟馗手执一把斩鬼剑，穿行在一派乌漆麻黑、虬枝鬈曲的密林中。

伴跟着一阵节拍仓猝的锣饱读声，野兔精、蛤蟆精、长满骷髅的树妖接连现身，急切恐怖的悔怨拉满。

但一声长喝下，镜头一瞥，手机屏幕弹出「勿扰模式」四个大字，下面飘零着被禁止的各式信息：

自动记账 APP、多东说念主视频会议、4 个未知号码回电、183 条微信群音信、风险网站的跳转邻接，以及大 boss 正在打来的电话……

临了画面缓缓打出「放假时分，百鬼勿扰」的字幕。本合计是个考中志怪片，没念念到蓝本是个职场吐槽片。

更让东说念主惊喜的是，这部由俞白眉导演打造的 5 分钟短片，竟统统出自可灵 AI 之手。

早在三个月前，快手可灵 AI 就聚会李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等 9 位著明导演共同发起了「可灵 AI 导演共创计算」，制作出品 9 部 AIGC 电影短片。

12 月 6 日，导演们来交功课了。

视频邻接：https://mp.weixin.qq.com/s/Q3dneGt09iTMJBun4XCaEA

自嘲用凡俗语不会写脚本的贾樟柯，在我方首部 AIGC 电影短片《麦收》中，借助可灵 AI 的「对口型」功能，让机器东说念主说上了山西汾阳话。

《卧虎藏龙》艺术指点叶锦添则袭取可灵 AI 的「首尾帧」功能，刻画了一个外星快递员在天外中的冒险旅程。通过 AI 技巧，每一帧画面皆传神到让东说念主仿佛跻身于一个委果的天外天下。

导演王子川在其作品《雏菊》中，从计较机、机器东说念主等当代科技产物与东说念主的关联张开，大皆使用可灵 AI 的「图生视频」功能，通过相通蒙太奇、高速编著以及殊效镜头，为不雅众带来浓烈的视听冲击。

在助力影视创作方面，可灵 AI 最有发言权。快手科技副总裁、大模子团队细密东说念主义迪暗示，「2024 年视觉生成领域 AI 大模子发展飞速，可灵 AI 自 6 月发布以来，已让繁多用户感受到其在视频创作上的智商。」

这次这 9 部具有实验性质的电影短片，全部使用可灵 AI 进行视频生成。电影导演统统依托视频生成大模子，深度参与电影级实践创作，这在中国尚属初度。

看成中国首个 AIGC 导演共创计算的收尾，这 9 部 AIGC 电影短片已在快手平台上线，并被中国电影博物馆弥远保藏、放映展示。这既是对中国电影历史的一次致意，亦然对未回电影创作的一次斗胆探索。

6 个月迭代十余次

可灵 AI 是如何真金不怕火成的？

本年齿首 Sora 一把火，透顶燃烧了 AI 视频生成这个赛说念。

6 月 6 日，快手率先推出自研的视频生成大模子「可灵AI」，成为寰球首个用户可用的委果影像级视频生成大模子。

而后，可灵 AI 又接连上线了图生视频、视频续写、运下笔刷等功能，不仅在画面质料、教唆驯服和显露幅度等方面有显耀普及，还将生成视频时长延迟约 3 分钟，创作家单次生成的文生视频时长也加多至 10 秒。

尽管获得可以的战绩，但可灵 AI 并莫得躺在功劳簿上吃老本，而是赓续马束缚蹄地蜕故孳新。

9 月 19 日，可灵 1.5 模子重磅登场，径直让画质质料、动态质料、好意思学发达、显露合感性以及语义认知普及了一个 level。

寰球网友也开启猖獗整活模式，酬酢平台上夸耀出一堆脑洞打开的视频，比如蒙娜丽莎戴墨镜、熊猫弹吉他、猪八戒吃面条等。

在贸易化方面，可灵 AI 相通走在行业前哨。

可灵 AI 先后上线 Web 端、孤立 App，打造多端跨平台家具矩阵，并全面怒放内测，陆续向国表里的用户推出会员付费体系。此外，可灵 AI 还面向 B 端怒放了 API 做事，涵盖视频生成、图像生成和诬捏试穿等多个模块。

为了给创作家提供贸易变现新渠说念，可灵 AI 于 10 月 18 日初始「昔时联合东说念主计算」，率先推出一站式 AIGC 生态互助平台。

这半年来，可灵 AI 沿途「狂飙」，十余次迭代升级，也让它有了稳站行业第一梯队的底气。收尾 12 月 10 日，可灵 AI 已领有超 600 万用户，累计生成超 6500 万个视频和超 1.75 亿张图片。

重塑影视行业

可灵 AI 又卷起来

近期，可灵 AI 时不可失，陆续推出 AI 东说念主脸定制模子和 AI 试衣功能，为影视创作家提供了更刚劲的用具撑执。

AI 定制模子

攻克「东说念主物一致性」费事

在视频生成过程中，现在的视频大模子仍具有较强的就地性。它们在处理相易的翰墨姿色时，常常会产生不同的视频主体，这种就地性难以保管故事的连贯性和东说念主物形象的一致性。

对此，可灵 AI 推出了东说念主脸定制模子。创作家只需上传 10 段 5 秒的多角度高清视频，就能自助教师一个东说念主脸模子。要是念念要效果更佳，最多可上传 99 段视频。

完成教师后，就可以在可灵 1.5 模子的文生视频中，生成东说念主脸一致的视频收尾，欢欣创作家生成多个包含磨灭东说念主物镜头的诉求，况兼单个镜头中的东说念主脸，也会更踏实更明晰。

咱们上手体验了一把，教师出 Sam Altman 的东说念主脸模子，然后将其搁置在各式场景中。

比如，Sam Altman 在餐厅吃意大利面：

Sam Altman 在餐厅吃水饺：

以及 Sam Altman 在门庭疏远的大街上骑摩托：

还有科幻作风的，让 Altman 化身钢铁侠行走在赛博一又克作风的大街上：

由此可见，可灵 AI 的东说念主脸定制模子在解决东说念主物 IP 踏实性这一行业费事上迈出了新的一步，这也符号着 AI 视频生成领域兑现了又一个蹙迫技巧突破。

AI 试衣

影视造型新探索

电影《穿普拉达的女王》中，有一幕经典的蒙太奇变装。安妮・海瑟薇在不到一分钟内，换了六身绝好意思穿搭，每套皆号称惊艳。

视频来源：电影《穿普拉达的女王》

那么 AI 能否兑现影视制作中的服装搭配、造型缠绵呢？

可灵 AI 新近上线的「AI 试衣」功能就能惩办。它在可图文生图模子基础上，引入衣裳 SKU 保执网罗、东说念主物 Pose 姿势、配景建立等技巧，兑现恣意衣裳、恣意体魄、恣意动作的试穿效果生成。

用法也很浅薄。只需上传一张模特照和一套服装图，即可一秒变装，这无疑大大提高了影视制作中服装搭配和效果展示的效用。

比如，让安妮・海瑟薇换上一件旗袍，换装后的衣裳不仅当然贴合体魄弧线，还能字据作风搭配手包。

再比如，原自己着露肩衬衫外加牛仔短裤的霉霉，经过可灵 AI 一番矫正，立马从幽闲风造成淑女风，换装后的衣褶、打的结皆生成得很当然。

给凤姐换上一件玄色皮夹克，在保执复杂头饰不变的情况下，它完好保留了毛领子、拉链等细节。

最绝的如故大魔王凯特・布兰切特的变装。前一秒如故酷飒的玄色紧身 T 恤，下一秒就换上寥寂白色玫瑰连衣裙。

它紧密展示了裙子丝绸材质，就连玫瑰花的心绪、位置也皆逐一复原。

天下名画或雕像也能瞬息换装。让身着玄色长袍的蒙娜丽莎「套」上东北大花袄：

给戎马俑穿上圆领 polo 衫和灰色长裤：

此外，它还可以通过 AI 扩图和可灵 AI 的图生视频大模子，兑现全进程素材生成。

比如皇后换上的灰色连帽卫衣，经过 AI 扩图造成一件宽松长袍。

再用镜头限度功能将其转成穿搭视频。

或者输入 Prompt「模特阁下回身向不雅众展示身上的服装」，让换上皮草的黄仁勋动起来。

从文生视频、图生视频，到首尾帧功能，再到东说念主脸模子、AI 换装…… 这些创新技巧的连气儿推出，无一不彰显了快手关于昔时影视行业发展趋势的深刻细察。

怒放分享

引颈 AIGC 改进

看成 AI 视频生成赛说念的杰出人物，快手可灵大模子团队在不竭拓展技巧畛域的同期，还公开了一系列技巧进展，积极和行业分享技巧研发收尾。

在 AI 视频生成领域，视频生成基础模子和数据是构建高质料视频实践生成系统的基石。为了啃下这块硬骨头，可灵团队进行了系统性筹谋，并率先提议一种给视频生成模子（Video DiT）量身定制的 Scaling Law 建模要道。

这种要道概况在较低的计较老本下，提前瞻望大范围模子的性能发达，匡助筹谋者优化技巧采用，治疗模子参数，从而大幅数落实验试错老本。

Video DiT 架构下的精确 Scaling Law 建模

论文题目：《Towards Precise Scaling Laws for Video Diffusion Transformers》论文地址：https://arxiv.org/pdf/2411.17470

另外，可灵大模子团队还公开了其视频教师数据的部分中枢预处理进程，并基于此进程推出了高质料视频生成数据集 Koala-36M。

该数据集是现在寰球源泉的大范围高质料视频 - 文本数据集之一，包含 3600 万个视频片断，平均时长为 13.75 秒，辞别率达到 720p，每个视频片断配有平均 202 字的防护姿色。

数据处理进程

论文题目：《Koala-36M: A Large-scale Video Dataset Improving Consistency Between Fine-Grained Conditions And Video Content》论文地址：https://arxiv.org/abs/2410.08260代码地址：https://github.com/KwaiVGI/Koala-36M名堂主页：https://koala36m.github.io/数据集邻接：https://huggingface.co/datasets/Koala-36M/Koala-36M-v1

在与其他数据集的比较中，基于 Koala-36M 数据集教师的模子展现出了特别的性能，无论是在视频质料如故文本与视频实践的一致性方面均达到了最优。