AIGC以AI打开内容产业新魔法门
编者按:
由OpenAI发布的聊天机器人模型ChatGPT一经发布快速走红,它能够模拟人类的语言行为,拥有强大的语言组织能力,与用户进行自然地交互。本篇把视角放得更广一些,以ChatGPT为代表的AIGC或生成式AI,试着探讨这波AIGC的产品和商业化。
全文约3570字,建议阅读时间10分钟。
所有重大科学革命都有一个共同点,那就是它们都把人类的傲慢从一个又一个先前坚信我们是宇宙中心的信念基座上拉下来。——西格蒙德·弗洛依德
前段时间,AIGC以及上线至今已有超过100万用户的聊天机器人ChatGPT,引起许多人自发在社交媒体上晒出AI绘画的图像和ChatGPT聊天记录,无不感慨于科技的力量。
AIGC的市场前景
2022年9月,红杉资本官网发表了一篇题为《Generative AI: A Creative New World》的重磅文章,把AI分成两类:分析型AI(Analytical AI)和生成式AI(Generative AI)。
人类擅长分析事物,而机器在这方面甚至做得就更好了。机器可以分析一组数据,并在其中找到许多用例(use case)的模式,无论是欺诈还是垃圾邮件检测,预测你的发货时间或预测该给你看哪个TikTok视频,它们在这些任务中变得越来越聪明。这被称为" 分析型AI(Analytical AI) ",或传统AI。
但是人类不仅擅长分析事物,我们也擅长创造。我们写诗,设计产品,制作游戏,编写代码。直到最近,机器还没有机会在创造性工作上与人类竞争——它们被降格为只做分析和机械性的认知工作。但最近,机器开始尝试创造有意义和美妙的东西,这个新类别被称为" 生成式AI(Generative AI) ",这意味着机器正在生成新的东西,而不是仅限于分析已经存在的东西。
生成式AI正在变得不仅更快、更便宜,而且在某些情况下比人类创造的更好。从社交媒体到游戏,从广告到建筑,从编程到平面设计,从产品设计到法律,从市场营销到销售,每一个原来需要人类创作的行业都等待着被机器重新创造……生成式AI可以处理的领域包括了知识工作和创造性工作,而这涉及到数十亿的人工劳动力。生成式AI可以使这些人工的效率和创造力至少提高10%,它们不仅变得更快和更高效,而且比以前更有能力。因此, 生成式AI有潜力产生数万亿美元的经济价值 。
如何化解供应体系的不确定性
目前有两种版本的市场格局分析比较值得关注,一种是美国知名投资机构A16Z给出的框架,一种是OpenAI 创始人Sam Altman给出的框架。
投资机构A16Z版市场框架
分为基础设施层 (代表是英伟达的芯片、AWS/Azure云计算平台),模型层 (代表是这种非开源基础模型,还有Stable Diffusion 这种开源基础模型 ,以及Hugging Face这种模型托管平台),应用层 (Jasper为代表的开放合作派——不拥有自己的模型,以及Midjourney这种拥有自己模型的自力更生派)。
Sam Altman(OpenAI CEO)版市场框架
以下出自Sam Altman和领英创始人Reid Hoffman的访谈:
Reid Hoffman:既然大家都可以通过API使用大型模型,作为AI企业,怎样才能使自己脱颖而出,开辟自己独特的商业路径?
Sam Altman:将来会出现几个大的基础模型,开发人员都基于这些基础模型研发AI应用。但目前的情况依然是某一家公司开发出一个大型语言模型,然后开放API供他人使用。
我认为,将来在基础模型和具体AI应用研发之间会有一个中间层: 出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业 。能做好这一点的初创公司将会非常成功,但这取决于它们能在" 数据飞轮 "上走多远。(注:数据飞轮,指使用更多数据可以训练出更好的模型,吸引更多用户,从而产生更多用户数据用于训练,形成良性循环。)
我对初创企业训练模型的能力持怀疑态度,将来承担模型训练角色的不会是初创公司,但它们可以在上述的中间层角色中发挥巨大价值。
AIGC产品全景图
AIGC产品分类 文本:总结或自动化内容 翻译:翻译跨语言内容 图像:生成图像 音频:在音频中总结、生成或转换文本 视频:生成或编辑视频 编程:生成代码 聊天机器人:自动化客户服务 机器学习平台:应用程序/机器自学习平台 搜索:人工智能洞察 游戏:生成式AI游戏工作室或应用 数据:设计、收集或总结数据 全球AIGC产品全景图
红杉资本版生成式AI图谱 V2.0
红杉资本版生成式AI图谱 V1.0
狮子座资本(Leonis capital)版生成式AI图谱:
调研机构Ether Siim版:
国内市场格局(from量子位)
Gartner技术成熟度曲线
AIGC风险投资情况(from PitchBook)
结语
"在一代人的时间中总有一种产品的出现,它将工程技术从昏暗的地下室、书呆子们臭气熏天的卧室和爱好者们孤独的洞穴中发射出来,变成了你的祖母Edna都知道如何使用的东西。早在 1990 年就有网络浏览器,但直到 1994 年Netscape Navigator(网景浏览器)的出现,大多数人才发现了互联网。2001 年 iPod 问世之前就已经有了 MP3 播放器,但这些播放器并没有引发数字音乐革命。2007 年苹果推出iPhone之前,也有了智能手机,但在 iPhone 之前,没有智能手机的APP……2022 年 11 月 30 日,AI迎来了 Netscape Navigator 时刻。"
我们大概可以理解大名鼎鼎的图灵奖得主杨立昆(Yann LeCun)为何说ChatGPT没有革命性技术了。革命性时刻往往落后于技术研究,在象牙塔之外,甚至落后于最早一批的产品,并且充满争议。
押注文本(Always bet on text)
文本生成图像或者视频很酷,但文本本身更好。按照奥卡姆剃刀原则, 文本是表达、存储、传播、接收信息最高效的路径 。在更大的时空尺度下,现在如火如荼的短视频、播客只会是昙花一现——承载了少量信息传递,却消耗了比文本多出指数级倍的资源。就像Rust创始人Graydon Hoare说的:"所有的文学和诗歌、历史和哲学、数学、逻辑、编程和工程都依靠文本编码来表达它们的想法,这不是一个巧合"。
关于AI超越人类的视角
我们其实不必恐慌于AI比我们写文案写的更好,编程和翻译更快,画画比我们更好。这样的事情早就发生过了,比如拖拉机比我们体力更强,汽车和飞机比人类奔跑更快,计算器比人脑计算更快,未来还会有更多。
关于AI超越人类的视角
比如能耗方面。人类大脑每秒可进行1.5的18次方运算。单个GPU每秒可执行10的13次方运算,因此,需要10万个GPU才能接近大脑的运算能力。还有一个关键点,即人类大脑消耗的功率大约为25瓦,而一个GPU的消耗是人脑的10倍,即250瓦。电子的效率是生物的一百万分之一。 和浩瀚的太空一样,人身体内部的微观世界对人类而言,还几乎是一个秘密。
关于AI超越人类的视角
后代很难想象,2022年之前的我们,需要从头开始做的很多"工作"是多么耗时耗力:比如写一篇营销文案、编一段程序实现一个功能、修一个图,拍一段视频……就像2022年的我们,很难想象几个世纪前的某些职业如此低效一样:复制一本书需要一个抄书人劳动几个月,穿一双皮鞋需要鞋匠手工长时间的手工缝制、送一封信需要邮差快马加鞭好几天……AIGC成熟后的世界,数以亿计的白领脑力进一步释放,配得上万亿级的市场规模。
3个"ChatGDP杀手"项目
GPTZero (普林斯顿大学的学生Edward Tian)、Detect GPT (斯坦福大学,论文见附录)、GPT-2 Output Detector (OpenAI和哈佛联合开发)。GPTZero更接近商业化, 原理是检测文本的「困惑度」(Perplexity)和「突发性」(Burstiness)这两项指标,并分别对其打分,判定文本是AI还是人类写的。
关于数字生命
《流浪地球2》中,最为震撼的是跨越2500年,100代人的流浪地球计划。刘慈欣获得克拉克奖的致辞:
从长远的时间尺度来看,在这无数可能的未来中,不管地球达到了怎样的繁荣,那些没有太空航行的未来都是黯淡的。
我期待有那么一天,像那些曾经描写过信息时代的科幻小说一样,描写太空航行的科幻小说也变得平淡无奇了,那时的火星和小行星带都是乏味的地方,有无数的人在那里谋生;木星和它众多的卫星已成为旅游胜地,阻止人们去那里的唯一障碍就是昂贵的价格。
但即使在这个时候,宇宙仍是一个大的无法想象的存在,距我们最近的恒星仍然遥不可及。浩瀚的星空永远能够承载我们无穷的想象力。
在普遍的工作重压下,如果我们还能重拾儿时最大胆的想象力,把日常工作关联到一个至少一代人时间尺度的愿景,会是多么幸运的一件事。
作者:David