2022，谷歌、抖音和百度涌向AIGC

西林百事通 › 网站首页 › 资讯列表› 资讯内容

2022，谷歌、抖音和百度涌向AIGC

2023-01-14 发布于西林百事通

就在本月，WSJ 引述知情人士称，作为 2022 年爆红的聊天机器人 ChatGPT 背后的公司，OpenAI 正在谈判以收购要约的形式出售现有股份，这起交易对 OpenAI 的估值达到 290 亿美元左右。在 2021 年的一场交易中，OpenAI 的估值还只是在 140 亿美元左右。

估值高涨的背后不只是因为 ChatGPT，OpenAI 旗下另一个 AI 生成图像模型——DALL-E 2 同样展现了生成式 AI 的能力可以有多高。2022 年，从 Stable Diffusion 以开源形式引爆 AI 创作，到 GPTChat 一周内就突破了百万级用户注册，全球出现了无数生成式 AI 的产品和创业公司，文本、图像乃至视频，掀起了巨大的 AIGC（人工智能生成内容）浪潮。

AI 绘画，图/抖音

基于 Stable Diffusion 开源模型，字节也推出 2022 抖音年度爆款「AI 绘画」，统计显示有 2758.3 万人使用过这款特效。抖音和快手都看到了 AIGC 技术在图像应用上的巨大价值，快手对 AIGC 的布局也证实了这一点。快手在 11 月联合 AI 数字人希加加、度晓晓等发布短视频，进行 24 小时 AI 直播，还通过 AIGC 技术进行作画、写诗、写歌词等。

6 月，一位高级软件工程师甚至声称，开发的对话式 AI LaMDA「有意识、有灵魂」，但随后很快被否认。而在一个月前，刚刚在 2022 年 I/O 大会上公布了 LaMDA2，称其为有史以来最先进的对话式 AI，与年底红遍全球的 ChatGPT 有着相同的语言模型技术和原生应用场景。

12 月 16 日，知名学术期刊《科学》杂志公布了 2022 年十大科学突破，记录一年里最重大的科学发现、进展和趋势，其中一项就是「AI 具备创造力」。用我们更熟悉的词就是：AIGC，即基于 AI 能力的内容创作。

当 AI 开始拥有大规模创造内容的能力，很多事情都可能被颠覆。

AI作画开始大众化

图/OpenAI

2022 年 4 月，人工智能研究公司 OpenAI 发布了新版本的文本生成图像程序——DALL-E 2，随后一张由 DALL-E 2 生成的「宇航员在太空骑马」图片开始蹿红社交网络。

相比前代，DALL-E 2 生成图像有了更高的分辨率和更低的延迟，同样基于用户描述文本进行生成。不过和之前 OpenAI 推出的产品一样，DALL-E 2 开始并不对外开放，仅限部分研究人员注册使用该程序，一直到 9 月才宣布向公众开放使用，每月仅限 15 个免费图像。

这也为下半年 Stable Diffusion 的爆火和流行提供了机会。如果说上半年最火的「AI 画师」当属 DALL-E 2 和 Midjourney，8 月 22 日 Stable Diffusion 发布之后基本就成了「AI 画师」的代名词。

在目前的三大 AI 图像模型中，Stable Diffusion 诞生得最晚，但由于发展良好的开源社区，它的用户关注度和使用范围都超越了 Midjourney 和 DALL-E。任何人都可以免费使用，任何公司也可以基于开源项目定制自己的 AI 生成图像程序。

「一个不在乎人工智能争论的老艺术家」，图/DrMacabre68

「我们已经看到 3 岁到 90 岁的人第一次开始创作。」StabilityAI CEO Emad Mostaque 在一次采访中说，该公司资助了 Stable Diffusion 的开发。在海外知名论坛 Reddit 的「StableDiffusion」板块下，每天都有用户分享通过 Stable Diffusion 生成新的图像作品。

到现在「AI 画师」已经可以走入千家万户。用户可以在本地部署，普通消费级显卡就能满足硬件要求，也可以直接输入一串网址，直接输入描述文本开始创作，这是 2021 年 DALL-E 初代发布的时候不敢想的。

不仅如此，「AI 画师」出现和流行也在 2022 年挑战人类的美术和图片产业。

9 月，全球最大图库盖蒂图片社（Getty Images）宣布禁止上传和销售使用 DALL-E、Midjourney 和 Stable Diffusion 等 AI 艺术工具生成的插图。盖蒂认为 AI 产生的图片并非是一种人类创造性的艺术品。

《太空歌剧院》，图/Jason Allen

同月，游戏公司 CEO 兼游戏设计师 Jason Allen 通过 Midjourney 生成的《太空歌剧院》，在美国科罗拉多州博览会举办的艺术展中一举夺得数字艺术组大奖。

但这次获奖也引起了广泛的争论，有人认为这对其他自己创作的人不公平，「这就跟为什么我们不让机器人参加奥运会的原因完全一样。」参加评审的艺术家杜兰（Cal Duran）甚至表示，他在评分的时候根本没意识到这幅画由 AI 生成。

相比之下，更加务实，一开始就确定了自己「辅助」定位。8 月，基于自身的文心大模型也推出了AI 绘画平台「文心一格」，更明确定位为面向有设计需求和创意的人群，基于文心大模型智能生成多样化AI创意图片，辅助创作者的创意设计。

在技术之外，AI 生成图像还在探索如何解决版权等一系列问题。

用嘴做视频？还要再等等

作为 AI 大厂，Meta 和谷歌实际上没有缺席任何一个重要的 AI 技术，在 AI 视频生成上更是独领风骚。

Meta 在 9 月率先推出了 Make-A-Video，言简意赅地表达了它的作用：做视频。更具体地说，Make-A-Video 可以通过文本、图片或者视频来生成一个全新的视频内容，尤其是文本直接生成视频，直接让视频创作的门槛大大降低，比如输入「机器人在时代广场跳舞」：

外贸收款图/Meta

外贸收款仅仅一周后，Google 也发布了自己的 AI 视频扩散模型 Imagen Video。与 Make-A-Video 相比，Imagen Video 最直接的感受就是清晰度更高——画面分辨率可以达到 1280×768，帧率也能到 24 fps 了。

外贸收款不过，两者实际上都还存在画面不正常抖动、主体畸形、动作不够流畅等问题，而且与之前推出文本生成图像程序一样，谷歌和 Meta 都没有选择对外开放，这也是为什么相比 AI 画画的流行，AI 生成视频领域更多还是处在看热闹的阶段——就像 2021 年的 AI 生成图像。

字节也看好 AI 视频模型的未来，在抖音内就支持了「图文成片」功能，输入一段文字，软件智能匹配图片素材、添加字幕、旁白和音乐，自动生成视频。从一些创作者的反馈来看，目前「图文成片」的实现还很初级，智能匹配和生成视频两个环节都很难真正在视频生产环节中使用。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

西林百事通

亲爱的游客，欢迎！

客服电话

电子邮件

2022，谷歌、抖音和百度涌向AIGC

请发表评论

全部评论

相关阅读

西林百事通

搜搜影视免费在线看最新电视剧

探索高清视频网：畅享视听盛宴的新时代

探索免费电影网的世界

福利在线：为您提供全方位福利服务

畅享精彩电视剧：TV狗免费在线看最新电视剧

探讨免费影视：现代娱乐产业的新趋势

影迷网：免费观看最新电视剧的首选平台

4648电影网免费在线看最热电影

免费福利TV在线看最火影视

探索免费电影网的世界：你的观影新选择

福利看看：如何正确选择适合自己的福利待遇

热门课程

新手指南

关于我们

帮助中心