Reddit论坛屏蔽除谷歌以外的一切搜索引擎 由于它们不愿意付钱

09-04 938阅读 0评论

早前蓝点网说到我国常识问答社区知乎屏蔽了除百度和搜狗查找以外的一切查找引擎爬虫,制止这些爬虫抓取和索引知乎的内容,一起知乎还运用乱码成心搅扰这些查找引擎防止自己的内容被抓取用于练习人工智能模型。

现在全球闻名的 Reddit 论坛也采纳了相似办法,这段时刻 Reddit 论坛屏蔽了除谷歌以外的一切查找引擎爬虫,包含微软必应和 Yandex 等等,阻挠这些查找引擎抓取内容。

至于原因必定也是为了防止论坛帖子和谈论被抓取用于练习 AI 模型,答应谷歌持续抓取是由于谷歌此前与 Reddit 达到协议,每年付出 6,000 万美元能够实时获取 Reddit 上的一切帖子和谈论并用于练习人工智能。


                    Reddit论坛屏蔽除谷歌以外的一切搜索引擎 由于它们不愿意付钱

Reddit 官方讲话人称屏蔽其他查找引擎与谷歌达到的协议无关,屏蔽是由于这些查找引擎无法或许不愿意许诺它们抓取内容后不用于人工智能练习,这是屏蔽的根本原因。

也就是说假如查找引擎能够许诺抓取 Reddit 内容并编入索引,但不会将其数据和内容用于人工智能模型练习的话,那仍是能够和 Reddit 洽谈持续抓取内容的。

但现在这种状况对整个互联网来说都是个巨大的负面影响,无论是 Reddit 仍是知乎以及其他内容网站,为了防止数据被抓取用于人工智能练习,他们采纳的办法都是屏蔽,这就导致用户经过查找引擎获取的内容将会削减,实际上这并不利于互联网的开展。

另一方面互联网上呈现的由人工智能生成的废物内容越来越多,例如不少网站会运用人工智能批量生成驴头不对马嘴的内容并经过 SEO 手法招引查找引擎抓取,然而对用户来说这些废物内容不会发生任何协助,每次点击检查还会浪费时刻。

长时间以往互联网不再是越来越敞开,相反互联网会变得越来越关闭,人们或许会逐步抛弃运用查找引擎寻觅内容,转而运用各种人工智能对话机器人获取答案,而这些机器人给出的答复也有过错内容,用户或许都无法进行查验。

感谢蓝点网网友 Coje-He 共享的音讯

发表评论

快捷回复: 表情:
评论列表 (暂无评论,938人围观)

还没有评论,来说两句吧...

目录[+]