
每一天的每一秒,世界各地的人们在谷歌上输入数以万计的查询,每年的搜索量总计达数万亿次。谷歌和其他一些搜索引擎是数十亿人浏览互联网的门户。包括谷歌(Google)、微软(Microsoft)和OpenAI在内的许多世界上最强大的科技公司,最近都发现了一个用生成式人工智能重塑这一门户的机会,它们正在竞相抓住这个机会。本周,人工智能搜索大战正如火如荼地进行着。
人工智能搜索栏的价值是直截了当的:与其打开和阅读多个链接,不如把你的问题输入聊天机器人,然后得到一个即时、全面的答案,这不是更好吗?不过,为了让这种方法发挥作用,人工智能模型必须能够从网上抓取相关信息。ChatGPT问世近两年后,随着用户越来越意识到许多生成型人工智能产品实际上是建立在窃取信息的基础上,科技公司正试图与提供这些机器所需内容的媒体机构友好相处。
今天早上,提供人工智能“答案引擎”的初创公司Perplexity宣布与《时代》、《财富》和其他几家出版商达成收入分成协议。展望未来,当Perplexity从引用合作伙伴内容的人工智能生成的答案中获得广告收入时,这些出版商将获得补偿。该网站目前还不投放广告,但将从今年秋天开始以赞助的“相关后续问题”的形式投放广告——运动品牌可以为一个关于贝比·鲁斯(Babe Ruth)的问题的后续问题付费,如果人工智能在回答中使用了《时代周刊》,那么《时代周刊》将从每次引用的广告收入中抽取一部分。OpenAI一直在建立自己的媒体合作伙伴名单,包括新闻集团(News Corp)、Vox media和《大西洋月刊》(The Atlantic),并于上周宣布了自己的人工智能搜索原型SearchGPT。(《大西洋月刊》的编辑部独立于业务部运作,业务部于今年5月宣布与OpenAI建立企业合作关系。)谷歌已经购买了使用Reddit内容来训练未来人工智能模型的权利,目前似乎是Reddit唯一允许展示其内容的主要搜索引擎。默认情况是,您将直接使用另一个人的工作;现在,人工智能可能会先咀嚼和反刍它,然后根据它不透明的底层算法确定你看到了什么。这也意味着,媒体机构目前向许多人类读者展示广告和销售订阅,他们访问出版商网站的理由将会减少。
科技公司过去曾与新闻媒体达成协议,向出版商付费,让他们使用Facebook Live和Snapchat Discover等产品,但这些人工智能搜索机器人有所不同。Facebook和Snapchat的核心是社交产品;你登录这些网站是为了查看其他人发布的内容,对许多用户来说,新闻内容可能是偶然的。相比之下,Perplexity和SearchGPT需要高质量、及时的内容来准确回答问题。
生成型人工智能模型除了训练数据之外没有任何内部信息,这些数据往往是几个月或几年前的。如果没有更近期的报道,这些产品将是有限的,无法传递有关H5N1、唐纳德·特朗普遇刺未遂、奥运会等的相关信息。例如,OpenAI最先进的模型于5月发布,但对2023年10月之后的事件一无所知。今年6月,当我第一次与Perplexity的首席商务官德米特里·舍维连科(Dmitry Shevelenko)交谈时,他告诉我,“我们长期成功的关键因素之一是,我们需要网络出版商不断创作充满事实的优秀新闻,因为如果你没有准确的原始材料,你就无法很好地回答问题。”
当然,现有的人工智能产品绝对充斥着出版商没有得到任何补偿的媒体。(舍甫连科告诉我,Perplexity不会停止引用收入分成协议之外的发行商,也不会对付费合作伙伴表现出任何偏好。)人工智能公司似乎并不把人类的文字、照片和视频视为手工作品或劳动产品;相反,他们将内容视为信息的采掘地。“人们来Perplexity不是为了消费新闻;“他们来到困惑是为了了解事实,”舍甫连科在今天宣布之前的一次采访中告诉我。“记者的内容是丰富的事实,经过验证的知识,这是它对人工智能回答引擎的效用功能。”对舍维连科来说,这意味着“困惑”和记者并不直接竞争——前者回答问题;后者是突发新闻或提供引人入胜的散文和想法。但即使是他也承认,人工智能搜索给媒体网站带来的流量将少于传统搜索引擎,因为用户点击任何链接的理由更少——机器人正在提供答案。
因此,越来越多的人工智能媒体交易是一种勒索。当然,Shevelenko告诉我,Perplexity认为收益分享是正确的做法。但人工智能正在抓取出版商的内容,无论他们是否愿意:媒体公司可以是笨蛋,也可以获得报酬。不过,这些交易的性质也表明,出版商的权力可能比看起来更大。例如,Perplexity和OpenAI为媒体合作伙伴提供了截然不同的激励措施,这意味着科技初创企业自己也在竞争赢得出版商的支持。所有这些产品都犯了一些基本错误,比如错误地引用来源和编造信息。让搜索机器人将自己置于人造的“经过验证的知识”中,可能有助于缓解这些问题,特别是对于人工智能模型没有训练过的近期事件。出版商至少也有一定的能力来限制人工智能搜索引擎读取其网站的能力。他们还可以拒绝签署或重新谈判协议,甚至起诉人工智能公司侵犯版权,正如《纽约时报》所做的那样。人工智能公司似乎有自己的方法绕过媒体公司的路障,但这是一场正在进行的军备竞赛,没有明确的赢家。
出版商现在可能会对人工智能公司产生影响,这些公司需要高质量的人工内容来回答用户的查询,或者训练未来的人工智能模型,比如GPT-5或GPT-6。《大西洋月刊》(the Atlantic)首席执行官尼古拉斯·汤普森(Nicholas Thompson)在接受科技记者尼莱·帕特尔(Nilay Patel)采访时表示,《大西洋月刊》与OpenAI的合同将在两年后到期,其目的是“在下一次谈判时创造更多的筹码”。Reddit最近切断了谷歌以外的搜索引擎对其网站的抓取;Reddit的一位发言人告诉The Verge,如果DuckDuckGo、Perplexity或Bing想要向用户展示Reddit上的新帖子,他们就必须“就使用Reddit内容做出可执行的承诺,包括使用人工智能。”(当然,Reddit有一个铁杆用户群,它不是一个传统的新闻机构——媒体公司一直在争夺关注,可能不太愿意关闭潜在的受众。)
换句话说,OpenAI、Perplexity、Google或其他公司能否赢得人工智能搜索大战,可能并不完全取决于它们的软件:媒体合作伙伴也是等式的重要组成部分。这种情况可能会改变。Shevelenko告诉我,他认为根据版权法,Perplexity使用出版商的内容是合法的,如果法官的裁决证明他是正确的,那么人工智能公司可能不再有动力向出版商付费。目前,这一决定还悬而未决,发行商正在利用这个小小的机会窗口。就Perplexity而言,它被指控抄袭了包括福布斯(Forbes)和康德纳仕(condnast)在内的出版商的内容,这可能会阻止其他出版商与这家初创公司合作;舍韦连科告诉《Semafor》,Perplexity不得不说服最初的合作伙伴忽略这些指控。今年6月,当舍维连科接受我采访时,该公司本应宣布其收入分成计划,但由于一波批评浪潮,该公司推迟了正式发布计划。现在,他说,“该轮到我们向出版商展示,我们是一个真诚的演员,采取了正确的、长期的行动。”
搜索大战试图改变人们浏览互联网的方式,而互联网是当今世界组织和传播知识的系统。但潜在的领域并没有改变:知识,无论其组织形式如何,仍然是人类的写作、艺术和思考的总和,而不是机器人的总和。



