当服务条款为人工智能培训让路时

2025-05-20 15:14来源:本站

  

  旧金山:去年7月,谷歌对其隐私政策进行了八个字的修改,这是其在构建下一代人工智能的竞赛中迈出的重要一步。

  谷歌在其文件中隐藏了数千个单词,对其如何为其产品使用数据的措辞进行了调整,并补充说,公共信息可用于训练其人工智能聊天机器人和其他服务。

  这种微妙的变化并不是谷歌独有的。随着公司希望在受隐私法保护的数据上训练他们的人工智能模型,他们正在仔细地修改条款和条件,以包括“人工智能”、“机器学习”和“生成式人工智能”等词汇。

  服务条款的一些变化就像几个字那么小。其他包括增加整个章节来解释生成人工智能模型如何工作,以及它们对用户数据的访问类型。例如,Snap警告其用户不要与其人工智能聊天机器人分享机密信息,因为它会在训练中使用人工智能聊天机器人;meta提醒欧洲用户,Facebook和Instagram上的公开帖子很快就会被用来训练其庞大的语言模型。

  这些长期以来被许多人忽视的条款和条件,现在正受到一些作家、插画家和视觉艺术家用户的质疑,他们担心自己的作品正被用来培训那些有可能取代他们的产品。

  YouTube名人、一家旅游推荐网站的联合创始人萨沙·延申(Sasha Yanshin)说,“我们已经被劣质内容彻底摧毁了,这些内容基本上都是在模仿我们的东西,现在我们正在被抛弃。”

  本月,由于Adobe更改了隐私政策,Yanshin取消了他的Adobe订阅。“卖给你画笔的五金店不能拥有你用它画的画,对吧?”他说。

  为了训练生成式人工智能,科技公司可以从公共和私人两个数据池中提取数据。任何人都可以在网上看到公共数据,而私人数据包括短信、电子邮件和私人账户发布的社交媒体帖子。

  公共数据是一种有限的资源,许多公司只需要几年的时间就能将所有公共数据用于他们的人工智能系统。但人工智能研究机构Epoch的副主任塔梅·贝西罗格卢(Tamay Besiroglu)说,像meta和谷歌这样的科技巨头所拥有的私人数据可能是公共数据的10倍。

  Besiroglu表示,这些数据可能在人工智能竞赛中构成“实质性优势”。问题是如何访问它。私人数据主要受到联邦和州隐私法的保护,这些法律赋予用户对他们在网上创建的内容的某种许可,未经同意,公司不能将其用于自己的产品。

  今年2月,联邦贸易委员会(Federal Trade Commission)警告科技公司,改变隐私政策以追溯旧数据可能是“不公平或具有欺骗性的”。

  人工智能训练最终可能会使用最私人的数据,比如发给朋友和家人的信息。谷歌发言人表示,一小部分用户在获得许可的情况下,允许谷歌在他们的个人电子邮件的某些方面训练其人工智能。

  一些公司一直在努力平衡对新数据的渴望与对用户隐私的担忧。今年6月,Adobe修改了隐私政策,加入了一个关于自动化的短语,许多客户将其解读为与人工智能抓取有关,随后该公司在社交媒体上遭到强烈反对。

  该公司在两篇博客文章中解释了这些变化,称客户误解了这些变化。6月18日,Adobe在其条款和条件的某些部分的顶部添加了解释。

  Adobe总法律顾问兼首席信托官达纳?拉奥(Dana Rao)在一份声明中表示:“我们从未在客户内容上训练生成式人工智能,从未对客户的作品拥有所有权,也从未允许在法律要求之外访问客户内容。”

  今年,Snap更新了有关My AI收集数据的隐私政策。My AI是Snap的人工智能聊天机器人,用户可以与之对话。

  Snap的一位发言人表示,该公司“提前通知”了如何使用数据来训练其人工智能,并让用户选择加入。

  今年9月,社交平台X在其关于机器学习和人工智能的隐私政策中添加了一句话。该公司没有回复置评请求。

  上个月,meta提醒其在欧洲的Facebook和Instagram用户,它将从周三开始使用公开的帖子来训练其人工智能,这引发了一些反弹。后来,在欧洲数字权利中心(European Center for Digital Rights)在11个欧洲国家对该公司提起诉讼后,谷歌暂停了这一计划。

  在隐私法不那么严格的美国,meta已经能够使用公开的社交媒体帖子来训练它的人工智能,而不需要发出这样的警报。该公司在9月份宣布,其大型语言模型的新版本是根据用户数据进行训练的,而之前的版本没有这样做。

  meta表示,它的人工智能不会读取朋友和家人在Messenger和WhatsApp等应用程序上发送的消息,除非用户在消息中标记了它的人工智能聊天机器人。

  meta发言人在一份声明中表示:“使用公开信息来训练人工智能模型是一种全行业的做法,而不是我们的服务所独有的。”

  许多公司还在使用条款中增加了一些措辞,以保护它们的内容不被抓取来训练竞争对手的人工智能。

  Yanshin表示,他希望监管机构能够迅速采取行动,保护像他这样的小企业免受人工智能公司的侵害,他的旅游网站自开始与人工智能聚合器竞争以来,访问量已经下降了95%。

  “人们会坐下来讨论窃取数据的利弊,因为这是一个很好的聊天机器人,”他说。“在3年、4年、5年的时间里,这个创意产业可能不会有完整的细分市场,因为我们将被摧毁。——《纽约时报

  ×

乐同网声明:未经许可,不得转载。