传 WordPress、Tumblr 运营方计划向 AI 公司出售用户数据,官方澄清不分享非公开内容

互联网资讯 互联网资讯 发布于 2个月前 7 浏览 0 回复

 3 月 1 日消息,近日外媒 404 Media 称,博客平台 WordPress、Tumblr 运营方 Automattic 计划向多家 AI 公司出售用户数据。Automattic 官方就此澄清,表示其默认屏蔽 AI 爬虫且不会分享非公开数据。

404 Media 指出,根据其掌握的内部文档,Tumblr 产品经理表示 Automattic 正为 OpenAI 和 Midjourney 准备数据集

而在这一包含 Tumblr 近十年所有公开帖子内容的数据集里,混入了大量不该向外部提供的部分,包括但不限于:

  • 公共博客上的私人帖子

  • 已删除 / 停用博客上发布的帖子

  • 私信回复

  • 合作伙伴拥有版权的付费推广内容

在 404 Media 的报道后,Automattic 发布了一份关于在快速发展的 AI 世界中“保护用户选择”的声明,表示其正在密切关注 AI 技术的最新进展,并努力在尊重用户隐私和数据控制的前提下研究如何与 AI 公司合作。

Automattic 称其目前默认阻止 AI 平台爬虫。WordPress 和 Tumblr 用户可通过设置阻止 AI 公司的数据抓取。燃领网注意到,Automattic 表示如果用户之前禁用了搜索引擎的爬取,则默认情况下新阻止选项会打开。

此外,Automatic 承认目前还没有法律强制 AI 爬虫遵守这种不抓取偏好。不过由于欧盟相关立法即将落地,这种情况可能很快就会改变。

该公司还证实,它正在直接与特定 AI 公司合作,仅提供 WordPress 和 Tumblr 上公开且用户未禁止向第三方公司分享的内容



同类文章推荐:

  • 一周连遇 3 个零日漏洞,谷歌紧急发布 Chrome 浏览器更新修复
  • 华为 WATCH FIT 3 智能手表海外发布:1.82 英寸 AMOLED 屏幕,159.99 欧元起
  • TIOBE 发布 5 月编程指数排行榜,Fortran 语言首次进入前 10 名
  • 分析公司:Java 17 仍为业界最常用 LTS 版本,Oracle JDK 占比逐渐下降
  • 谷歌上传系列补丁,删除安卓 ACK 内核对 RISC-V 架构的支持
  • 拆解显示:华为 Pura 70 手机零部件国产化率超 90%