瞭望 上海設立人工智能安全護欄
《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》的創(chuàng)新之處在于設立了“激發(fā)創(chuàng)新活力”的專門條款,對處于探索階段的新業(yè)態(tài)給予一定的制度探索和試錯空間
頭部企業(yè)如騰訊、螞蟻集團等互聯(lián)網(wǎng)企業(yè)成立AI倫理委員會,建立定期審查機制;百度構建可信AI技術體系,參與全球規(guī)則對話……企業(yè)正逐步將治理要求轉化為競爭優(yōu)勢,為上海AI治理打下堅實基礎
“我用AI寫文章,其中有些案例很好用,但沒想到居然是胡編亂造的?!薄拔艺褹I幫我推薦樓盤,它說得有理有據(jù),結果發(fā)現(xiàn)根本沒有這個項目?!薄@些用戶反饋,反映出人工智能技術快速發(fā)展帶來的治理難題。
隨著AI大模型、生成式AI等技術在各領域的廣泛應用,幻覺輸出、數(shù)據(jù)偏見、隱私泄露等風險也在凸顯。如何在使用AI技術提升效率的同時,確保其安全可靠運行,成為全球范圍內(nèi)亟待解決的重大治理課題。
作為中國人工智能產(chǎn)業(yè)高地,上海在AI治理領域率先探索,通過政策規(guī)范、企業(yè)協(xié)同與技術驅動,逐步構建起貫穿全生命周期的AI安全治理體系。從全國首部AI地方性法規(guī)的出臺,到企業(yè)自主治理實踐的創(chuàng)新,再到技術治理工具的研發(fā),上海的探索為全國AI治理提供了重要參考。
人工智能的健康發(fā)展離不開制度保障。2022年10月,《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》(以下簡稱《條例》)正式施行,成為我國人工智能領域的首部省級地方性法規(guī)。這部法規(guī),在制定過程中也曾面臨諸多挑戰(zhàn)?!爱敃r國際上還沒有一個國家專門針對人工智能進行立法,因為太難、太新了?!鄙虾J腥舜筘斀?jīng)委立法監(jiān)督處處長張震回憶道。
該《條例》創(chuàng)新之處在于設立了“激發(fā)創(chuàng)新活力”的專門條款,對處于探索階段的新業(yè)態(tài)給予一定的制度探索和試錯空間。張震解釋道:“在立法調(diào)研期間,從事AI研究的科研工作者反映,最大的困擾是缺乏明確邊界。往往是成果披露后,才被告知違規(guī)?!睘榇?,《條例》設立人工智能領域輕微違法行為免罰清單,為創(chuàng)新松綁。
此后,上海又相繼出臺《上海市推動人工智能大模型創(chuàng)新發(fā)展若干措施(2023—2025年)》《關于人工智能“模塑申城”的實施方案》等配套政策。2023年12月,國務院印發(fā)《全面對接國際高標準經(jīng)貿(mào)規(guī)則推進中國(上海)自由貿(mào)易試驗區(qū)高水平制度型開放總體方案》,進一步要求,圍繞推動上海自貿(mào)區(qū)制度型開放,借鑒國際經(jīng)驗,研究建立人工智能技術的倫理道德和治理框架。
受訪者認為,近年來,上海在人工智能應用尤其是在新應用的機遇探索上,取得了顯著成果。人工智能治理方面,上海逐漸形成獨特認知,體現(xiàn)了通過安全和治理實現(xiàn)穩(wěn)健發(fā)展的理念。
在政策落地方面,上海網(wǎng)信部門相關負責人介紹,該部門深入發(fā)揮大模型合規(guī)指導服務中心作用,多次走進模速空間、模力社區(qū)等人工智能產(chǎn)業(yè)社區(qū),主動為150余家企業(yè)上門提供一對一合規(guī)指導、備案輔導、現(xiàn)場受理等服務,先后組織開展了12場大規(guī)模法規(guī)政策宣貫和專場輔導會,對300余家重點企業(yè)提供了針對性的合規(guī)指導“服務包”,保障人工智能大模型產(chǎn)業(yè)的健康發(fā)展。
截至2025年6月底,上海已累計完成82款大模型備案,并完成了95款生成式人工智能應用登記。
頭部科技企業(yè)展現(xiàn)出“技術+治理”的雙輪驅動能力。以商湯科技為例,2023年,其發(fā)布了SenseTrust治理平臺,提供從數(shù)據(jù)治理到應用治理的全鏈路解決方案。
該平臺在三個關鍵環(huán)節(jié)表現(xiàn)突出:在數(shù)據(jù)預處理階段,對有毒數(shù)據(jù)的檢測率超過95%;在模型訓練環(huán)節(jié),能有效識別數(shù)據(jù)偏見;在應用部署時,其提供的“AI防火墻”工具對抗樣本的綜合檢出率達到98%。
“治理不是創(chuàng)新的掣肘,而是確保不走彎路的指南針?!鄙虦笨偛谩I倫理與治理委員會主席張望認為,AI治理既能引導技術研發(fā)和產(chǎn)品開發(fā)走向正確的方向,也能夠及時制止AI創(chuàng)新往錯誤的方向發(fā)展。該公司還積極參與國內(nèi)外標準制定,主導編制200余項國際國內(nèi)標準,并成為新加坡監(jiān)管機構IMDA旗下-“AI VerifyFoundation”的成員單位,體現(xiàn)了其在合規(guī)建設方面的探索。
另有大模型企業(yè)從技術源頭入手提升安全性。在MiniMax稀宇極智總編輯、副總裁彭韜看來,底層模型能力的提升是AI安全治理的根本。該公司通過應用線性注意力機制混合MoE架構,使新版模型的幻覺率顯著降低。此外,MiniMax采用“技術治理技術,模型對抗模型”的安全治理思路,研發(fā)專門的安全審核模型進行內(nèi)容過濾。
“安全合規(guī)正從外部要求轉化為企業(yè)內(nèi)生動力?!迸眄w表示。這一觀點也得到了行業(yè)普遍認同。頭部企業(yè)如騰訊、螞蟻集團等互聯(lián)網(wǎng)企業(yè)成立AI倫理委員會,建立定期審查機制;百度構建可信AI技術體系,參與全球規(guī)則對話……企業(yè)正逐步將治理要求轉化為競爭優(yōu)勢,為上海AI治理打下堅實基礎。
技術適配性不足是首要難九游娛樂-官方入口題?!艾F(xiàn)有治理手段主要針對大語言模型,對多模態(tài)模型、Agent應用等效果有限?!迸眄w說,更棘手的是,隨著人工智能技術向AGI(通用人工智能)發(fā)展,可能出現(xiàn)全新的風險類型,現(xiàn)有的治理框架存在失效風險。
對此,彭韜建議要強化技術驅動的治理工具研發(fā),完善“AI治理AI”的模式,“相比于傳統(tǒng)產(chǎn)業(yè),AI領域的技術迭代迅速,應考慮利用AI的能力賦能AI治理,‘用魔法打敗魔法’?!?
微軟亞洲研究院全球研究合伙人謝幸認為,應進一步完善人工智能評測標準體系,使人工智能始終與人類價值觀保持一致。
記者了解到,謝幸所在的微軟亞洲研究院正開發(fā)構建“價值觀羅盤”,嘗試將人類倫理標準轉化為機器可識別的參數(shù)。
此外,跨學科人才短缺制約治理深度。謝幸發(fā)現(xiàn),AI企業(yè)中同時具備技術和社會科學背景的治理人才占比較低。這種人才結構失衡,導致倫理治理研究難以深入,特別是在價值觀對齊、算法公平性等前沿領域,缺乏既懂技術又懂倫理的復合型人才。
針對這一痛點,上海多所高校嘗試創(chuàng)新培養(yǎng)模式。例如,上海交通大學凱原法學院開設了“人工智能治理與法律”微專業(yè);復旦大學聯(lián)合浙江大學、南京大九游娛樂-官方入口學、上海交通大學、中國科學技術大學共同建設“AI+X”微專業(yè)項目。這些探索旨在打破傳統(tǒng)學科與人工智能技術的學科壁壘,通過多學科融合教學,培養(yǎng)具有跨學科思維和綜合能力的專業(yè)人才。
“人工智能的治理體系適用于‘木桶原理’,任何一塊短板都會影響整體效果?!鄙虾J腥斯ぶ悄苄袠I(yè)協(xié)會秘書長鐘俊浩認為。隨著技術迭代演進,上海將繼續(xù)完善政策、技術、倫理三位一體的治理體系,在確保安全的前提下充分釋放創(chuàng)新活力,為AI治理貢獻“上海方案”?!龇祷厮押?,查看更多