Perplexity 基本上是高质量资源上的寻租中间人
Perplexity 正在 进行数亿美元融资的谈判,试图打造一个谷歌搜索的竞争对手。不过,Perplexity 不想打造一个“搜索引擎”,而是想打造一个“答案引擎”。其理念是,你不用再从一堆搜索结果中梳理信息,自己找到答案,而是直接获得 Perplexity 为你找到的答案。“我们关注的是准确性和真实性,” Perplexity 首席执行官 Aravind Srinivas 在接受《The Verge中文站》采访时表示。
这意味着 Perplexity 基本上是高质量资源上的寻租中间人。最初,搜索的价值主张是,通过抓取记者和其他人的工作成果,谷歌的搜索结果将流量引导到这些资源。但通过提供答案,而不是引导人们点击查看原始资源,这些所谓的“答案引擎”让原始资源失去了广告收入——把这些收入留给了自己。Perplexity 属于吸血鬼群,其中包括 Arc Search 和谷歌本身。
但 Perplexity 通过其 Pages 产品更进了一步,该产品会根据这些原始资源创建一份摘要“报告”。它不仅仅是引用一两句话来直接回答用户的问题——它是在创建一篇完整的聚合文章,而且它在准确性上的确切含义是,它 积极剽窃它所使用的资源。
《福布斯》发现 Perplexity 在 避开该出版物的付费墙,以便提供对该出版物对 前谷歌首席执行官埃里克·施密特无人机公司进行的调查的摘要。虽然《福布斯》对其部分作品采取了计量付费墙制度,但其高级内容,如调查报告,则设有硬付费墙。Perplexity 不仅设法绕过了付费墙,而且几乎没有引用原始调查,还窃取了原始艺术用于其报告。(对于那些在家追踪的人来说,艺术方面的行为属于侵犯版权。)
“别人也这样做” 对一个五岁小孩来说是合理的辩解
聚合并非什么新鲜事——但 Perplexity 可以聚合的规模,再加上使用原始艺术而侵犯版权的行为,相当,嗯,引人注目。为了平息众怒,该公司首席商务官到《Semafor》表示,Perplexity 正在与出版物商讨收入分成计划,天哪,为什么大家对一个仍在开发中的产品这么刻薄呢?
此时,《连线》跳了出来,证实了 Robb Knight 的发现:Perplexity 抓取《福布斯》作品并非个例。事实上,Perplexity 一直在无视 robots.txt 代码,该代码明确要求网络爬虫不要抓取网页。 Srinivas 在《快公司》的回应中称,实际上,Perplexity 并没有无视 robots.txt;它只是使用了无视它的第三方抓取器。Srinivas 拒绝透露第三方抓取器的名称,也没有承诺要求该抓取器停止违反 robots.txt。
“别人也这样做” 对一个五岁小孩来说是合理的辩解。仔细想想他的回应。如果 Srinivas 想做到道德,他当时有一些选择。选择一是终止与第三方抓取器的合同。选择二是试图说服抓取器遵守 robots.txt。Srinivas 没有承诺任何一个选择,在我看来,原因很明显。即使 Perplexity 本身没有违反该代码,但它依赖于其他人违反该代码才能使其“答案引擎”发挥作用。
更令人愤怒的是,Perplexity 剽窃了《连线》的文章,尽管《连线》在文本文件中明确禁止 Perplexity 抓取。关于剽窃的《连线》文章的很大一部分内容与法律补救措施有关,但我对 robots.txt 中发生的事情感兴趣。它是一个已经存在了几十年的真诚协议,由于不择手段的人工智能公司(没错,Perplexity 并非唯一一家),它正在瓦解——它们为了训练其胡说八道的模型,几乎抓取一切可获取的东西。还记得 Srinivas 说过他致力于“真实性”吗?我不确定是不是真的:据《福布斯》报道,Perplexity 现在 越来越多地显示由人工智能生成的结果和真实的错误信息。
在我听来,Srinivas 一直在吹嘘自己的谎言是多么有魅力和聪明
我们已经看到许多人工智能巨头为了获得想要的数据,采取了 存在法律问题的做法,而且可以说是不道德的。为了向投资者证明 Perplexity 的价值,Srinivas 建立了一个工具来抓取推特,假装是一位使用 API 访问权限进行研究的学术研究人员。“我给我的[假学术]项目起的名字就像 Brin Rank 以及所有这些东西,”Srinivas 在 Lex Fridman 的播客中表示。我猜,“Brin Rank” 是指谷歌联合创始人谢尔盖·布林;在我听来,Srinivas 一直在吹嘘自己的谎言是多么有魅力和聪明。
并非是我告诉你 Perplexity 的基础是撒谎来逃避维护网络的既定原则的。而是它的首席执行官告诉你的。这清楚地说明了“答案引擎”的真实价值主张。Perplexity 无法自行生成实际信息,而是依赖于其滥用政策的第三方。这个“答案引擎”是由那些觉得随时撒谎都更方便的人开发的,这种偏好是 Perplexity 工作原理所必需的。
所以这就是 Perplexity 在这里真正的创新之处:打破了构建互联网的信任基础。问题是 Perplexity 的用户或投资者是否关心这些问题。
6 月 27 日更正: 删除了对 Axios 的错误引用——该采访对象为《Semafor》。