Perplexity 的“盗窃”人工智能 – The Verge中文站

在每个炒作周期中,都会出现某些欺骗模式。在上一轮加密货币热潮中,是“庞氏骗局”和“拔地而起”。在自动驾驶汽车方面,则是“五年内就会实现!”。而在人工智能领域,则是看你能蒙混过关多少不道德的事情。

Perplexity 基本上是高质量资源上的寻租中间人

Perplexity 正在 进行数亿美元融资的谈判,试图打造一个谷歌搜索的竞争对手。不过,Perplexity 不想打造一个“搜索引擎”,而是想打造一个“答案引擎”。其理念是,你不用再从一堆搜索结果中梳理信息,自己找到答案,而是直接获得 Perplexity 为你找到的答案。“我们关注的是准确性和真实性,” Perplexity 首席执行官 Aravind Srinivas 在接受《The Verge中文站》采访时表示。

这意味着 Perplexity 基本上是高质量资源上的寻租中间人。最初,搜索的价值主张是,通过抓取记者和其他人的工作成果,谷歌的搜索结果将流量引导到这些资源。但通过提供答案,而不是引导人们点击查看原始资源,这些所谓的“答案引擎”让原始资源失去了广告收入——把这些收入留给了自己。Perplexity 属于吸血鬼群,其中包括 Arc Search 和谷歌本身。

但 Perplexity 通过其 Pages 产品更进了一步,该产品会根据这些原始资源创建一份摘要“报告”。它不仅仅是引用一两句话来直接回答用户的问题——它是在创建一篇完整的聚合文章,而且它在准确性上的确切含义是,它 积极剽窃它所使用的资源

《福布斯》发现 Perplexity 在 避开该出版物的付费墙,以便提供对该出版物对 前谷歌首席执行官埃里克·施密特无人机公司进行的调查的摘要。虽然《福布斯》对其部分作品采取了计量付费墙制度,但其高级内容,如调查报告,则设有硬付费墙。Perplexity 不仅设法绕过了付费墙,而且几乎没有引用原始调查,还窃取了原始艺术用于其报告。(对于那些在家追踪的人来说,艺术方面的行为属于侵犯版权。)

“别人也这样做” 对一个五岁小孩来说是合理的辩解

聚合并非什么新鲜事——但 Perplexity 可以聚合的规模,再加上使用原始艺术而侵犯版权的行为,相当,嗯,引人注目。为了平息众怒,该公司首席商务官到《Semafor》表示,Perplexity 正在与出版物商讨收入分成计划,天哪,为什么大家对一个仍在开发中的产品这么刻薄呢?

此时,《连线》跳了出来,证实了 Robb Knight 的发现:Perplexity 抓取《福布斯》作品并非个例。事实上,Perplexity 一直在无视 robots.txt 代码,该代码明确要求网络爬虫不要抓取网页。 Srinivas 在《快公司》的回应中称,实际上,Perplexity 并没有无视 robots.txt;它只是使用了无视它的第三方抓取器。Srinivas 拒绝透露第三方抓取器的名称,也没有承诺要求该抓取器停止违反 robots.txt。

“别人也这样做” 对一个五岁小孩来说是合理的辩解。仔细想想他的回应。如果 Srinivas 想做到道德,他当时有一些选择。选择一是终止与第三方抓取器的合同。选择二是试图说服抓取器遵守 robots.txt。Srinivas 没有承诺任何一个选择,在我看来,原因很明显。即使 Perplexity 本身没有违反该代码,但它依赖于其他人违反该代码才能使其“答案引擎”发挥作用。

更令人愤怒的是,Perplexity 剽窃了《连线》的文章,尽管《连线》在文本文件中明确禁止 Perplexity 抓取。关于剽窃的《连线》文章的很大一部分内容与法律补救措施有关,但我对 robots.txt 中发生的事情感兴趣。它是一个已经存在了几十年的真诚协议,由于不择手段的人工智能公司(没错,Perplexity 并非唯一一家),它正在瓦解——它们为了训练其胡说八道的模型,几乎抓取一切可获取的东西。还记得 Srinivas 说过他致力于“真实性”吗?我不确定是不是真的:据《福布斯》报道,Perplexity 现在 越来越多地显示由人工智能生成的结果和真实的错误信息

在我听来,Srinivas 一直在吹嘘自己的谎言是多么有魅力和聪明

我们已经看到许多人工智能巨头为了获得想要的数据,采取了 存在法律问题的做法,而且可以说是不道德的。为了向投资者证明 Perplexity 的价值,Srinivas 建立了一个工具来抓取推特,假装是一位使用 API 访问权限进行研究的学术研究人员。“我给我的[假学术]项目起的名字就像 Brin Rank 以及所有这些东西,”Srinivas 在 Lex Fridman 的播客中表示。我猜,“Brin Rank” 是指谷歌联合创始人谢尔盖·布林;在我听来,Srinivas 一直在吹嘘自己的谎言是多么有魅力和聪明。

并非是我告诉你 Perplexity 的基础是撒谎来逃避维护网络的既定原则的。而是它的首席执行官告诉你的。这清楚地说明了“答案引擎”的真实价值主张。Perplexity 无法自行生成实际信息,而是依赖于其滥用政策的第三方。这个“答案引擎”是由那些觉得随时撒谎都更方便的人开发的,这种偏好是 Perplexity 工作原理所必需的。

所以这就是 Perplexity 在这里真正的创新之处:打破了构建互联网的信任基础。问题是 Perplexity 的用户或投资者是否关心这些问题。

6 月 27 日更正: 删除了对 Axios 的错误引用——该采访对象为《Semafor》。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行二次审核删除:fireflyrqh@163.com。
(0)
上一篇 2024年6月28日 下午10:54
下一篇 2024年6月29日 上午1:01

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注