欧美大片专区,男人的天堂亚洲在线,黄色一区三区

內容治理是生成式AI監管的關注重點。一方面，基于客觀維度，生成式AI可能會生成不真實或無意義的內容，即具有“幻覺”傾向；另一方面，結合價值判斷，生成式AI還存在生成有害內容的問題。如本系列首篇《生成式AI（一）：嘗試參透監管的底層邏輯》所分析，生成式AI監管的底層邏輯在于引導對人類的良性影響。為了實現這一目標，監管規則對企業提出了一系列合規要求，旨在彌補生成式AI的固有缺陷，降低其應用風險。本文擬對我國生成式AI的監管規則進行體系化梳理，以期為企業的合規實踐提供指引。

一、模型訓練：確保來源合法、提升數據質量

（一）保障訓練數據來源的合法性

生成式AI的訓練通常需要TB級的海量數據。數據來源的合法性為生成式AI合規的基礎性要求，其包括但不限于知識產權、個人信息保護。

1.知識產權

《生成式人工智能服務管理辦法（征求意見稿）》（“《生成式人工智能服務辦法》”）第七條中明確要求，用于生成式AI產品的預訓練、優化訓練數據（“訓練數據”），應不含有侵犯知識產權的內容。

我國《著作權法》過去明確列舉了十二種“合理使用”的情形，并在2020年修改時新增了“法律、行政法規規定的其他情形”這一兜底條款，但企業為訓練生成式AI而使用他人作品通常無法符合“合理使用”的任一情形，如無授權則存在知識產權侵權風險。我國目前并未通過“柔性合理使用條款”（如日本法）等方式為生成式AI等新技術設置特殊的合理使用情形，亦未通過“四要素分析法”（如美國法）等方式僅規定合理使用的判斷因素而不對其適用情形作列舉限定。盡管我國司法實踐中確偶有突破《著作權法》額外創設“合理使用”情形的特例，但在現有規則體系下，如何取得作品使用授權/避免使用作品進行訓練，是相關大模型企業在目前無法回避的一個問題。

生成式AI訓練數據的知識產權問題已在境內外引起了諸多爭議，例如：美國AI繪畫軟件Stable Diffusion的開發商Stability AI即因未經授權爬取1200余萬張圖像用于大模型訓練而遭到起訴，該案正在進展中，合理使用問題系該案爭議焦點之一[1]；在可能成為中國“AI大模型數據被盜第一案”的筆神作文與學而思的糾紛中，亦涉及到著作權侵權的相關爭論。[2]

鑒于訓練數據的龐大規模，確保其中不含有任何侵犯知識產權的內容，對于相關企業來說存在相當高的實現難度。我國現有監管規則尚未對此提供更加細化的合規指引，但歐盟一周前剛剛通過的《人工智能法案》草案或可提供借鑒思路——其要求生成式AI的基礎模型提供者應針對其訓練模型所使用的任何受著作權保護的材料，記錄并公開披露詳細的使用情況摘要。這一透明度方案或可有效降低著作權人的維權難度，但也相應對開發者提出了更高的合規要求。

2.個人信息保護

《生成式人工智能服務辦法》第七條中明確要求，訓練數據包含個人信息的，應當征得個人信息主體同意或者符合法律、行政法規規定的其他情形。

OpenAI表示：“我們希望（模型）了解世界，而非了解個人”，并承諾將在可行的范圍內盡量刪除訓練數據集中所包含的互聯網上公開可獲得的個人信息。[3]與之相呼應，有觀點主張模型訓練不適用個人信息保護相關法規，或至少應從個人信息保護角度對模型訓練予以豁免。然而，僅從現行法的角度，在訓練數據包含個人信息的情況下，盡管其或并不旨在對自然人進行識別，但將數據用于模型訓練的行為通常仍被認為屬于《個人信息保護法》所規定的“處理”，因此需征得個人同意或具備其他合法性基礎。

針對訓練數據的個人信息保護要求并非中國所獨有，2023年3月，意大利數據監管機關Garante對ChatGPT發布了臨時禁令，原因之一即在于OpenAI的個人信息收集及以算法訓練為目的的處理活動缺乏合法性基礎。此后，OpenAI通過在網站公布訓練算法的個人信息處理情況、明確正當利益（legitimate interest）為利用用戶個人信息進行算法訓練的合法性基礎、允許歐盟個人以便捷方式選擇退出（opt-out）算法訓練等措施進行了整改，恢復了ChatGPT在意大利境內的運營。

3.關于數據來源合法性的爭議

數據來源的合法性要求盡管看起來“天經地義”，但之于生成式AI而言，過于絕對的合法性要求從理論上亦可能涉及以下問題：[4]

首先，數據質量和數據合法性之間存在矛盾。生成式AI的訓練需要海量數據，如果對預訓練數據的合法性作出要求，企業為了規避風險可能會采取過于謹慎的態度，大幅縮減訓練數據數量，甚至可能損害數據的客觀性和多樣性。

其次，訓練數據的合法性并非信息生成合法性的必要條件。最初輸入的訓練數據與最終輸出的生成內容并非直接對應關系，其中經歷了較為復雜的轉換過程。

最后，《生成式人工智能服務辦法》的規定在責任承擔方面存在問題。在該規定項下，數據來源合法性要求的義務主體為利用生成式人工智能產品提供聊天和文本、圖像、聲音生成等服務的組織和個人（“提供者”），然而，純粹的服務商可能并不參與模型的訓練開發，也并不具備相應的技術能力，要求其就該項義務承擔責任過于嚴苛。

針對以上問題，界定大模型訓練作為合理使用的情形、標準化解決內容創作者的補償問題、區分主體施以合規義務均為可以探討的解決方案。

（二）訓練數據應具備高質量

相較于“不證自明”的合法性要求，針對訓練數據的質量要求，通常被認為是生成式AI監管的特色規定。監管關注訓練數據質量的邏輯或在于，當人類已難以完全理解具有數百億參數大模型的推理過程時，要求企業采取措施增強訓練數據的真實性、準確性、客觀性、多樣性（例如，設計預訓練數據集時考慮偏遠地區、少數民族等因素，利用分類器及關鍵詞庫對數據集進行過濾等），就成為了為數不多有效可行的監管手段。其原理近似于，當家長無法控制孩子的行為時，至少應確保所教導傳授的內容是積極向善的。

針對訓練數據的質量問題，《生成式人工智能服務辦法》主要存在兩方面的重點考量：一方面，提供者應在算法設計、訓練數據選擇、模型生成和優化、提供服務等過程中，采取措施防止歧視。另一方面，提供者應保證訓練數據的真實性、準確性、客觀性、多樣性。

此外，根據《生成式人工智能服務辦法》的要求，為了加強數據質量管理，提供者如果采用了人工標注的方式訓練生成式AI，應當制定清晰、具體、可操作的標注規則，對標注人員進行必要培訓，抽樣核驗標注內容的正確性。實踐中建議企業留存相應的培訓和抽樣核驗記錄，以證明履行了合規義務。

二、運營管理：內容治理為核心，以人為本是基調

（一）內容治理

1.內容治理的多元要求

《生成式人工智能服務辦法》對生成內容的監管要求主要體現在三個方面：首先，生成內容應當體現社會主義核心價值觀，不得含有反動、色情、暴力等內容。該要求與《互聯網信息服務管理辦法》《網絡信息內容生態治理規定》《互聯網信息服務算法推薦管理規定》（“《算法推薦管理規定》”）《互聯網信息服務深度合成管理規定》（“《深度合成管理規定》”）一脈相承。其次，生成內容不得帶有歧視性。最后，生成內容應當真實準確，提供者應采取措施提高生成內容的準確性和可靠性、防止生成虛假信息。

2.治理措施的多樣手段

首先，“幻覺”目前通常被認為是大模型技術的固有缺陷，目前無法實現100%的準確可靠。如何減少幻覺是大模型研究應用的重點之一，但恐怕難以一蹴而就。例如，根據OpenAI發布的GPT-4技術報告，GPT-4在科技、歷史、商業等各類主題測試集中，其準確率普遍介于60-80%之間，而這已是GPT-4相較于GPT-3.5幻覺程度顯著降低后的結果。

除了前文所提及的提升訓練數據的質量，建立適當的內容審核機制也是彌補該缺陷的方式之一。此處與《深度合成管理規定》和《算法推薦管理規定》的監管要求相銜接：一方面，服務提供者應當加強內容管理，采取技術或者人工方式對服務使用者的輸入數據和合成結果進行審核；另一方面，服務提供者應當建立健全用于識別違法和不良信息的特征庫，完善入庫標準、規則和程序，記錄并留存相關網絡日志。

其次，提供者應依法對生成的圖片、視頻等內容進行標識。標識分為隱式與顯式兩類，兩者并行不悖、不存在替代關系：

隱式標識：提供者應當采取技術措施添加不影響用戶使用的標識，并保存相關日志信息以便進行識別追溯；
顯式標識：對于可能導致公眾混淆或誤認的服務，應由提供者在生成內容的合理位置、區域進行顯著標識；對于前述以外的其他服務，應由提供者提供顯式標識功能，并提示使用者可以進行顯式標識。

標識義務為生成式AI合規的難點問題之一，“可能導致公眾混淆或誤認”的判斷標準、不同模態下的具體標識方案等問題均有待進一步明晰。業界正在內容標識領域不斷探索,例如，抖音于2023年5月發布《抖音關于人工智能生成內容標識的水印與元數據規范》，一方面確定了統一的水印樣式和位置，在提示用戶的同時盡可能減少觀感不適；另一方面規范了人工智能生成內容的元數據格式，在相關圖片和視頻元數據中寫入信息，以達到行業通用識別的效果。[5]

最后，對于模型生成的不當內容，除采取內容過濾等措施外，提供者還應通過模型優化訓練等措施進行整改、防止再次生成。

（二）通用運營管理

1.保護用戶不因使用生成式AI受害

首先，提供者應對用戶輸入信息和使用記錄承擔保護義務，不得將其非法留存、用于用戶畫像或向他人提供，除非法律法規另有規定。

其次，提供者應當明確并公開其服務的適用人群、場合、用途，采取適當措施防范用戶過分依賴或沉迷生成內容。然而《生成式人工智能服務辦法》中的防依賴沉迷條款[6]，究竟是適用于全部用戶的普適要求，還是旨在保護兒童、老人等弱勢群體的特殊要求，目前尚不明確。但從體系解釋的角度，結合《生成式人工智能服務辦法》的防依賴沉迷條款與《算法推薦管理規定》的未成年人保護條款[7]，我們理解，建立未成年人保護機制是前者的應然之義，但是否還需建立其他機制則需持續觀察監管傾向及市場實踐的發展變化。

在境外，生成式AI服務的年齡過濾機制已受到了監管者的格外關注。2023年2月，意大利數據監管機關Garante就人工智能聊天工具Replika發布了臨時禁令，要求其停止處理意大利人的數據，主要原因之一即在于Replika所提供的虛擬情感關系服務可能會對未成年人造成傷害，但其并未設置年齡驗證機制，致使未成年人可以輕松訪問并使用該服務。[8]以此為鑒，盡管年齡門檻不盡相同，但OpenAI、Google和Microsoft均為用戶注冊和使用其大模型服務設定了一定的年齡限制。

最后，提供者應當建立用戶投訴接收處理機制，及時處置個人關于更正、刪除、屏蔽其個人信息的請求；發現、知悉違法和不良信息時，應當采取措施、停止生成、保存記錄并向監管部門報告，防止危害持續。

2.管理用戶不能使用生成式AI作惡

首先，提供者應當對用戶的真實身份進行驗證。該項規定有助于后續快速識別不良用戶，提高平臺管理能力。其次，提供者應當指導用戶正當使用人工智能生成內容。最后，提供者發現用戶使用生成式AI產品過程中存在違反法律法規，違背商業道德、社會公德行為時，包括從事網絡炒作、惡意發帖跟評、制造垃圾郵件、編寫惡意軟件，實施不正當的商業營銷等，應當暫停或者終止服務。

當前，國內已出現多起利用生成式AI發布虛假新聞的違法案例。例如，2023年4月，甘肅公安發現有不法分子散播題為“今晨甘肅一火車撞上修路工人致9人死亡”的虛假文章，而后查明該文為洪某利用ChatGPT所編輯的內容。洪某散布虛假信息的行為已涉嫌尋釁滋事罪，目前已被警方采取刑事強制措施，該案仍在進展之中。[9]

三、監管工具：算法備案與安全評估并駕齊驅

具有輿論屬性或社會動員能力的互聯網信息服務和相關新技術新應用是監管部門的重點關注對象。《生成式人工智能服務辦法》規定，利用生成式AI產品向公眾提供服務前，應當按照《具有輿論屬性或社會動員能力的互聯網信息服務安全評估規定》向國家網信部門申報安全評估（即“安全評估”、“雙新評估”），并按照《算法推薦管理規定》履行算法備案和變更、注銷備案手續（即“算法備案”）。

需要注意的是，上文所提及的大多為《生成式人工智能服務辦法》這一特殊法對于生成式AI的特殊合規要求，但除此之外提供者還應當同時落實《深度合成管理規定》、《算法推薦管理規定》作為一般法所提出的通用合規要求，包括但不限于落實信息安全主體責任、建立健全用戶注冊、算法機制機理審核、應急處置等一般性管理制度。該等通用合規要求的落實對于企業順利完成算法備案、安全評估有著顯著影響，切不可忽視。

除此之外，提供者負有配合監督檢查的義務。特別地，《生成式人工智能服務辦法》對算法透明度作出要求，提供者應當根據監管部門的要求，提供可以影響用戶信任、選擇的必要信息，包括預訓練和優化訓練數據的來源、規模、類型、質量等描述，人工標注規則，人工標注數據的規模和類型，基礎算法和技術體系等。實踐中建議企業留存前述相關內容的產品文檔、評估報告、日志記錄等，做好響應配合監督檢查的準備。

[1] https://arstechnica.com/tech-policy/2023/04/stable-diffusion-copyright-lawsuits-could-be-a-legal-earthquake-for-ai/

[2] https://mp.weixin.qq.com/s/aRYJbh1UO9RYEJdhL-nivQ

[3] https://openai.com/blog/our-approach-to-ai-safety

[4] https://mp.weixin.qq.com/s/DXgyb-8I2YLoXWN8j0QzAg

[5] https://www.douyin.com/rule/billboard?id=1242800000050

[6] 《生成式人工智能服務辦法》第十條：“提供者應當明確并公開其服務的適用人群、場合、用途，采取適當措施防范用戶過分依賴或沉迷生成內容。”

[7] 《算法推薦管理規定》第十八條：“算法推薦服務提供者向未成年人提供服務的，應當依法履行未成年人網絡保護義務，并通過開發適合未成年人使用的模式、提供適合未成年人特點的服務等方式，便利未成年人獲取有益身心健康的信息。

算法推薦服務提供者不得向未成年人推送可能引發未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好等可能影響未成年人身心健康的信息，不得利用算法推薦服務誘導未成年人沉迷網絡。”

[8] https://www.silicon.co.uk/e-innovation/artificial-intelligence/replika-italy-ban-497135

[9] https://mp.weixin.qq.com/s/_Wfe-EV13O6uBM65jZDzdg

*感謝趙雅澤對本文的突出貢獻

作者信息

楊建媛

反腐敗與合規，數據合規與網絡安全

一本色道久久综合亚洲精品高清_亚洲第一毛片_国内在线观看一区二区三区_午夜精品国产_欧美午夜视频在线_99精品久久_性刺激综合网_欧美日韩一区二区视频在线 _国产一区二区三区四区hd_在线观看一区欧美

生成式AI（二）：體系化構建合規指南

作者信息