社交媒體平臺Reddit近日對人工智能公司Perplexity及其他相關(guān)企業(yè)提起訴訟,指控其未經(jīng)授權(quán)抓取網(wǎng)站數(shù)據(jù)用于人工智能模型訓(xùn)練。這起案件凸顯了當(dāng)前AI行業(yè)在訓(xùn)練數(shù)據(jù)獲取方式上存在的法律爭議。

根據(jù)向紐約聯(lián)邦法院提交的訴狀,Reddit將Perplexity AI、Oxylabs UAB、AWMProxy以及SerpApi四家公司列為被告。訴狀指出,這些公司通過技術(shù)手段繞過網(wǎng)站防護(hù)措施,擅自獲取Reddit平臺上的用戶評論和對話內(nèi)容。Reddit在聲明中強(qiáng)調(diào),其平臺作為全球規(guī)模最大、內(nèi)容最活躍的人類對話數(shù)據(jù)庫之一,已成為數(shù)據(jù)抓取行為的主要目標(biāo)。
被告方對相關(guān)指控予以否認(rèn)。Perplexity在回應(yīng)中表示,其數(shù)據(jù)處理方式始終秉持原則且具有社會責(zé)任感,致力于通過人工智能技術(shù)為用戶提供真實(shí)準(zhǔn)確的信息服務(wù)。該公司強(qiáng)調(diào)將堅(jiān)決維護(hù)公眾自由獲取公共知識的權(quán)利。與此同時(shí),Oxylabs則提出異議,認(rèn)為任何企業(yè)都不應(yīng)對公共數(shù)據(jù)形成壟斷,暗示部分企業(yè)可能通過控制數(shù)據(jù)資源謀取不當(dāng)利益。
值得關(guān)注的是,Reddit在訴訟文件中將數(shù)據(jù)抓取行為形象比喻為“無法進(jìn)入金庫,轉(zhuǎn)而搶劫運(yùn)輸車隊(duì)”。據(jù)悉,部分涉事公司通過規(guī)避谷歌安全防護(hù)并利用搜索引擎記錄的方式實(shí)施數(shù)據(jù)抓取。與此形成對比的是,谷歌和OpenAI已與Reddit達(dá)成正式數(shù)據(jù)使用協(xié)議,其中谷歌每年需支付6000萬美元獲取數(shù)據(jù)訪問權(quán)限。這一巨額費(fèi)用也讓業(yè)界關(guān)注到合法數(shù)據(jù)獲取的成本門檻。
需要指出的是,這已是Reddit今年內(nèi)第二次就類似事由提起訴訟。今年6月,該平臺曾對人工智能公司Anthropic提起過相關(guān)訴訟。這一系列法律行動反映出內(nèi)容平臺與AI技術(shù)公司在數(shù)據(jù)使用權(quán)方面的矛盾正日益凸顯。





























浙公網(wǎng)安備 33010502007447號