编者按:很多人都预测年将是AI之年。但AI显然不是今年才开始爆发或者炒作起来的。但是2年图像生成工具以及聊天工具ChatGPT等消费者化是人工智能开始普及应用的标志,年这股趋势只会愈演愈烈。本文剖析了AI的用例与商业模式,也许我们将迎来继农业革命、工业革命以来的第三种通用技术的普及。文章来自编译。
现在AI令人兴奋的一点是平台层正在固化,这意味着应用层该出现了。换句话说,也就是你我每天都会接触到的东西该出现了。
过去这几个月的时间里,我已经写了好几篇与AI正在发生的事情有关的文章。鉴于这是我们进入年要面对的技术主题,在此我想把那些文章都整合一下,写一篇深度探讨的文章,然后进一步拓展。
其结果是这篇文章的篇幅要长很多,但在关于我们现在处在什么位置的事情上,我希望它能提供一份类似‘国情咨文’的快照,同时就“我们未来要去哪里”给出一些提示。
让我们开始吧。
每当我思考人工智能领域在发生着什么时,我往往会想到两部电影。一部是年前问世的老片,一部是10个月前问世的新片。
年上映的《超国度》(Hyperland)几乎已被人遗忘。这部科幻电影的导演是道格拉斯·亚当斯(DouglasAdams),他更出名的身份是《银河系搭车客指南》的作者。电影的假设是亚当斯对被动式的线性电视已经厌烦了,电影称就是“那种发生在你身上,而你就像一个沙发土豆一样坐在它面前的电视。”
为了寻找更具互动性的媒体形式,亚当斯把他的电视带到了一个垃圾场,在那里他遇到了汤姆(由汤姆·贝克饰演)。汤姆是一位软件代理——本质上属于一个数字管家,能够根据你的特定兴趣为你提供个性化的信息和娱乐饮食。汤姆带领我们的主人公穿行于一个超媒体的虚拟世界——一个由链接的文本、声音、图像和视频组成的世界。换句话说,汤姆带着亚当斯踏上了互联网之旅。(或者说得更具体一点,是穿行于一个漫长而曲折的兔子洞,跟维基百科类似——但比维基百科的出现早了11年)。
《超国度》,尤其是汤姆这个角色,让我想到了我们目前的现实:人工智能驱动的算法推荐引擎,根据我们独特的兴趣图谱塑造出的一个超个性化的互联网。这就是我所说的“一切都被TikTok化”。(DavidKarpf提出了一个很有智慧的看法,即超国度与现代之间有一个关键区别:在电影里面,是你在控制算法;当然,现如今的算法已经过优化,可以替开发和部署它们的公司赚钱。)
我想到的第二部电影面世的时间要近得多:2年月的《瞬息全宇宙》,在我看来,这有可能是今年奥斯卡最佳影片的潜在竞争者。在我最近的记忆中,《瞬息全宇宙》属于线索比较混乱的电影之一。这部电影讲述的是伊芙琳(杨紫琼饰)的故事,她是一名中国移民,经营着一家正在接受美国国税局审计的自助洗衣店。伊芙琳很快发现,她生活在无限宇宙里面的一个宇宙,她必须穿越多重宇宙才能拯救她的家人。
从很多方面来说,这部电影都是对互联网之乱的隐喻。在接受Slashfilm的采访时,电影导演之一的丹尼尔·谢纳特(DanielScheinert)是这么说的:“我们希望这部电影的极简主义能够与没完没了地刷屏的感觉建立关联”。
YouTuberThomasFlight(对这部电影做出了出色的分析)称《瞬息全宇宙》是第一批“后互联网”电影之一,因为它捕捉到了在线生活的怪异之处。生活在年的迷人的一点在于,我们的大脑与一个世纪前相比没有什么不同(事实证明,进化需要很长时间),但我们的世界在年内却发生了翻天覆地的变化。正如Flight所说的那样:“我们现在生活在这样一个时代,在一次0分钟TikTok狂欢里,我们体验到的有趣想法、概念、人物以及地方,就要比我们被困在当地目不识丁的祖先一辈子所经历过的东西都要丰富。”快速演变的数字混沌会如何扭曲我们缓慢进化的人类思维呢?
《瞬息全宇宙》里面的宇宙是多种多样的,而且非常非常的奇怪。在一个没有人类生命的宇宙里,每个人都是一动不动的石头。里面还有一个宇宙,这个宇宙里面每个人都是蜡笔画。另一个宇宙里,每个人的手指都变成了热狗(我告诉过你这很奇怪)。
《瞬息全宇宙》这部电影捕捉到了互联网的运动能量与无情的节奏。
不过,这部电影让我想到的不是互联网,而是生成式人工智能正在发生的事情。就像电影让主人公将她想象中的任何东西都转化为有形的现实一样,生成式AI也让我们将想法变成了文字、图像和视频。
这是当我输入提示“Apersonmadeentirelyoffruit”(一个完全由水果组成的人)时Midjourney生成的结果:
这是我输入“NewYorkCityskylineinthestyleofVanGogh”(梵高风格的纽约市天际线)时得到的结果:
我可以花几个小时(而且我已经花了几个小时)去试验这样的提示。
2年取得突破的生成式人工智能是自十多年前移动和云计算兴起以来最引人注目的技术。平台层正在钙化,我们正目睹着令人兴奋的应用层的萌芽——这些产品有可能成为数十亿人日常生活的一部分。
这篇文章的目的是研究AI这一时刻背后的“为什么是现在”,并探索初创企业可以如何利用AI来进行开发。本文内容将分为以下几部分:
搭好舞台
算法推荐系统
图像模型
语言模型
生成式人工智能的用例
商业模式
最后思考及待回答的关键问题
好了,让我们开始吧。
搭好舞台
在过去十年里,有两股重要力量推动了技术的发展:分别是移动和云计算。
移动促进了大型消费互联网公司的崛起:Uber与Lyft、Instagram与Snap、Robinhood与Coinbase。这些公司基本上都成立于年至年间。数字广告在0年代迅速转向移动设备,Facebook等桌面时代的公司不得不争先恐后地重塑业务。
明年移动应用内广告的支出预计将超过桌面广告-MarketingCharts
云计算则支撑了软件即服务(SaaS)的爆发式增长,并让数据变成企业最宝贵的资源(“数据就是新的石油”云云)。这一领域的新兴公司基本上也都成立于年至年之间,其中包括Slack与Airtable、Stripe与Plaid、Snowflake与Databricks等。
从5年到2年间,存储在云端的企业数据占比翻了一番:
存储在云端的企业数据;资料来源:Statista
这是过去10年AWS收入情况图,很少有图表比这幅图更令人印象深刻(利润率高达5%!):
AWS收入($B);资料来源:Statista
移动和云计算让0年代成为技术领域非常非常好的十年。但在过去的几年里,我们看到很多人都在嚷嚷接下来会发生什么。虚拟现实?增强现实?自动驾驶汽车?加密货币?Web?
这些技术个个都很有趣,原因各不相同,有趣的用例也各异,但都还非常非常早。整个VR行业仅相当于苹果1年营收的2%。(虽然随着苹果即将推出的混合现实头显,情况可能会有所改变。)围绕新技术的炒作太多,而源于对移动和云计算的焦虑的“平台转变”已经……过时了。AWS推出时间是年;iPhone在年问世。移动和云计算都还没有饱和,但它们的新机遇并不像以前那样成熟了。与此同时,我们看到前所未有的私有资本开始涌入,去追逐创业公司:
风投资金在1年激增至00亿美元
0年代最引人注目且最有可能推动技术发展的力量是什么?也许是人工智能。人工智能在过去几年中得到了显著改善。直到最近,Gmail的自动补充句子功能几乎还没法用;但现在已经好得吓人。Facebook用户将认识到AI在识别照片里面的朋友方面已变得有多么出色;实际上,Facebook的DeepFace引擎现在比人类还要擅长面部识别。就在去年夏天,我们看到了从StableDiffusion到Midjourney、ChatGPT到Lensa的一切事物的涌现。人工智能正在成为主流。
Facebook的DeepFace现在比人类还要擅长面部识别
我们正处在人工智能的转折点(原因稍后会详细介绍),这个转折点正在支撑起创新的寒武纪大爆发。年至年诞生了数十家由移动和云计算技术提供支持的变革型初创公司。未来几年这样的公司将再度涌现,但这次,人工智能将成为催化剂。
前一段时间,有位朋友问了我一个问题:AI是泡沫,还是下一个大事件?答案可能是两者兼而有之。
现在有很多令人兴奋的事情,其中很多是有理由的,但其中很多可能是非理性的、不成熟的,或者两者兼而有之。但是当你将画面拉远时就能发现,毫无疑问我们正处于一个激动人心的技术新时代的风口浪尖。
算法推荐系统
最近的大部分讨论都围绕着生成式人工智展开,但“传统”的人工智能仍有很大的发展空间。曝光度最高的人工智能应用是什么?也许没有比TikTok的ForYouPage(为你推荐)更高的了,对于《超国度》那个具有先见之明的超个性化的互联网来说,这可以说是它最好的现代类比。
TikTok沉浸式、算法性的ForYouPage开创了内容策划的新风尚。一开始,每个发布出去的视频都会被推送给一组的初始受众,然后根据他们观看了多长时间、是否喜欢视频、是否对视频发表了评论等等,对这些观众的反应进行评估。如果受众反应良好,视频就会被推送给更多的受众,如此循环往复。
TikTok的算法
我最近跟同事Martin讨论了一下移动和云计算之后技术的下一步会是什么。我们聊起了AI,并回想起十年前那张著名的“解绑Craigslist”的图表。
就是这张图:
将业务从Craigslist解绑出来诞生了大批初创企业,迄今为止这批企业的融资额达到了88.7亿美元资料来源:CBInsights
这里还有一张,要表达的概念是一样的,但更清晰:
平台Vs垂直领域及下一个大解绑
AndreessenHorowitz图片来源:AndrewParker
这些图有一个基本前提,那就是原先市场的主要品类正在被更专注、更好的产品所重塑。通常,颠覆者会利用某项新技术:比方说,Tinder是第一批只支持移动设备的约会app之一。
AI应用可能也会带来类似的清算。主要的品类——如约会、房地产、求职等——可能会因为有人能更好地利用人工智能而被彻底颠覆。当AI可以把跟你完美匹配的对象呈现出来时,为什么还要上Tinder没完没了地刷屏?十年之后,我们可能会看到上图有了一个新版本,里面出现的也许是全新的公司logo——AI优先的公司会重塑每一个品类。当然了,生成式人工智能一定会从中发挥作用,但类似TikTok的推荐系统也很强大;就数字世界将越来越适合我们的独特品味和偏好而言,我们仍处于早期阶段。
让我们看个例子——交易。
从很多方面来说,SHEIN都算是TikTok的姊妹公司。SHEIN与字节跳动(TikTok的母公司)都是中国公司,而且位列全球最有价值的三大初创公司之一(字节跳动排名第一,美国的SpaceX排名第二,SHEIN排名第三)。
就像TikTok渗透了美国的媒体一样,SHEIN也打入到美国的快时尚——
美国快时尚市场Shein占据了最大的份额-BloombergSecondMeasure
这张图换了个视角,把SHEIN与HM和Zara的销售额进行比较:
中国快时尚品牌Shein如何征服美国市场-Euromonitor.