瞭望上海設立人工智能安全護欄

欄目：魔術資訊作者：小編時間：2025-07-07 21:21:46 閱讀：次

(圖1)

　　《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》的創(chuàng)新之處在于設立了“激發(fā)創(chuàng)新活力”的專門條款，對處于探索階段的新業(yè)態(tài)給予一定的制度探索和試錯空間

　　頭部企業(yè)如騰訊、螞蟻集團等互聯(lián)網(wǎng)企業(yè)成立AI倫理委員會，建立定期審查機制；百度構建可信AI技術體系，參與全球規(guī)則對話……企業(yè)正逐步將治理要求轉化為競爭優(yōu)勢，為上海AI治理打下堅實基礎

　　“我用AI寫文章，其中有些案例很好用，但沒想到居然是胡編亂造的?！薄拔艺褹I幫我推薦樓盤，它說得有理有據(jù)，結果發(fā)現(xiàn)根本沒有這個項目?！薄@些用戶反饋，反映出人工智能技術快速發(fā)展帶來的治理難題。

　　隨著AI大模型、生成式AI等技術在各領域的廣泛應用，幻覺輸出、數(shù)據(jù)偏見、隱私泄露等風險也在凸顯。如何在使用AI技術提升效率的同時，確保其安全可靠運行，成為全球范圍內(nèi)亟待解決的重大治理課題。

　　作為中國人工智能產(chǎn)業(yè)高地，上海在AI治理領域率先探索，通過政策規(guī)范、企業(yè)協(xié)同與技術驅動，逐步構建起貫穿全生命周期的AI安全治理體系。從全國首部AI地方性法規(guī)的出臺，到企業(yè)自主治理實踐的創(chuàng)新，再到技術治理工具的研發(fā)，上海的探索為全國AI治理提供了重要參考。

　　人工智能的健康發(fā)展離不開制度保障。2022年10月，《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》（以下簡稱《條例》）正式施行，成為我國人工智能領域的首部省級地方性法規(guī)。這部法規(guī)，在制定過程中也曾面臨諸多挑戰(zhàn)?！爱敃r國際上還沒有一個國家專門針對人工智能進行立法，因為太難、太新了?！鄙虾Ｊ腥舜筘斀?jīng)委立法監(jiān)督處處長張震回憶道。

　　該《條例》創(chuàng)新之處在于設立了“激發(fā)創(chuàng)新活力”的專門條款，對處于探索階段的新業(yè)態(tài)給予一定的制度探索和試錯空間。張震解釋道：“在立法調(diào)研期間，從事AI研究的科研工作者反映，最大的困擾是缺乏明確邊界。往往是成果披露后，才被告知違規(guī)?！睘榇?，《條例》設立人工智能領域輕微違法行為免罰清單，為創(chuàng)新松綁。

　　此后，上海又相繼出臺《上海市推動人工智能大模型創(chuàng)新發(fā)展若干措施（2023—2025年）》《關于人工智能“模塑申城”的實施方案》等配套政策。2023年12月，國務院印發(fā)《全面對接國際高標準經(jīng)貿(mào)規(guī)則推進中國（上海）自由貿(mào)易試驗區(qū)高水平制度型開放總體方案》，進一步要求，圍繞推動上海自貿(mào)區(qū)制度型開放，借鑒國際經(jīng)驗，研究建立人工智能技術的倫理道德和治理框架。

　　受訪者認為，近年來，上海在人工智能應用尤其是在新應用的機遇探索上，取得了顯著成果。人工智能治理方面，上海逐漸形成獨特認知，體現(xiàn)了通過安全和治理實現(xiàn)穩(wěn)健發(fā)展的理念。

　　在政策落地方面，上海網(wǎng)信部門相關負責人介紹，該部門深入發(fā)揮大模型合規(guī)指導服務中心作用，多次走進模速空間、模力社區(qū)等人工智能產(chǎn)業(yè)社區(qū)，主動為150余家企業(yè)上門提供一對一合規(guī)指導、備案輔導、現(xiàn)場受理等服務，先后組織開展了12場大規(guī)模法規(guī)政策宣貫和專場輔導會，對300余家重點企業(yè)提供了針對性的合規(guī)指導“服務包”，保障人工智能大模型產(chǎn)業(yè)的健康發(fā)展。

　　截至2025年6月底，上海已累計完成82款大模型備案，并完成了95款生成式人工智能應用登記。

　　頭部科技企業(yè)展現(xiàn)出“技術+治理”的雙輪驅動能力。以商湯科技為例，2023年，其發(fā)布了SenseTrust治理平臺，提供從數(shù)據(jù)治理到應用治理的全鏈路解決方案。

　　該平臺在三個關鍵環(huán)節(jié)表現(xiàn)突出：在數(shù)據(jù)預處理階段，對有毒數(shù)據(jù)的檢測率超過95%；在模型訓練環(huán)節(jié)，能有效識別數(shù)據(jù)偏見；在應用部署時，其提供的“AI防火墻”工具對抗樣本的綜合檢出率達到98%。

　　“治理不是創(chuàng)新的掣肘，而是確保不走彎路的指南針?！鄙虦笨偛谩I倫理與治理委員會主席張望認為，AI治理既能引導技術研發(fā)和產(chǎn)品開發(fā)走向正確的方向，也能夠及時制止AI創(chuàng)新往錯誤的方向發(fā)展。該公司還積極參與國內(nèi)外標準制定，主導編制200余項國際國內(nèi)標準，并成為新加坡監(jiān)管機構IMDA旗下-“AI VerifyFoundation”的成員單位，體現(xiàn)了其在合規(guī)建設方面的探索。

　　另有大模型企業(yè)從技術源頭入手提升安全性。在MiniMax稀宇極智總編輯、副總裁彭韜看來，底層模型能力的提升是AI安全治理的根本。該公司通過應用線性注意力機制混合MoE架構，使新版模型的幻覺率顯著降低。此外，MiniMax采用“技術治理技術，模型對抗模型”的安全治理思路，研發(fā)專門的安全審核模型進行內(nèi)容過濾。

　　“安全合規(guī)正從外部要求轉化為企業(yè)內(nèi)生動力?！迸眄w表示。這一觀點也得到了行業(yè)普遍認同。頭部企業(yè)如騰訊、螞蟻集團等互聯(lián)網(wǎng)企業(yè)成立AI倫理委員會，建立定期審查機制；百度構建可信AI技術體系，參與全球規(guī)則對話……企業(yè)正逐步將治理要求轉化為競爭優(yōu)勢，為上海AI治理打下堅實基礎。

　　技術適配性不足是首要難九游娛樂-官方入口題?！艾F(xiàn)有治理手段主要針對大語言模型，對多模態(tài)模型、Agent應用等效果有限?！迸眄w說，更棘手的是，隨著人工智能技術向AGI（通用人工智能）發(fā)展，可能出現(xiàn)全新的風險類型，現(xiàn)有的治理框架存在失效風險。

　　對此，彭韜建議要強化技術驅動的治理工具研發(fā)，完善“AI治理AI”的模式，“相比于傳統(tǒng)產(chǎn)業(yè)，AI領域的技術迭代迅速，應考慮利用AI的能力賦能AI治理，‘用魔法打敗魔法’?！?

　　微軟亞洲研究院全球研究合伙人謝幸認為，應進一步完善人工智能評測標準體系，使人工智能始終與人類價值觀保持一致。

　　記者了解到，謝幸所在的微軟亞洲研究院正開發(fā)構建“價值觀羅盤”，嘗試將人類倫理標準轉化為機器可識別的參數(shù)。

　　此外，跨學科人才短缺制約治理深度。謝幸發(fā)現(xiàn)，AI企業(yè)中同時具備技術和社會科學背景的治理人才占比較低。這種人才結構失衡，導致倫理治理研究難以深入，特別是在價值觀對齊、算法公平性等前沿領域，缺乏既懂技術又懂倫理的復合型人才。

　　針對這一痛點，上海多所高校嘗試創(chuàng)新培養(yǎng)模式。例如，上海交通大學凱原法學院開設了“人工智能治理與法律”微專業(yè)；復旦大學聯(lián)合浙江大學、南京大九游娛樂-官方入口學、上海交通大學、中國科學技術大學共同建設“AI+X”微專業(yè)項目。這些探索旨在打破傳統(tǒng)學科與人工智能技術的學科壁壘，通過多學科融合教學，培養(yǎng)具有跨學科思維和綜合能力的專業(yè)人才。

　　“人工智能的治理體系適用于‘木桶原理’，任何一塊短板都會影響整體效果?！鄙虾Ｊ腥斯ぶ悄苄袠I(yè)協(xié)會秘書長鐘俊浩認為。隨著技術迭代演進，上海將繼續(xù)完善政策、技術、倫理三位一體的治理體系，在確保安全的前提下充分釋放創(chuàng)新活力，為AI治理貢獻“上海方案”?！龇祷厮押?，查看更多

標簽：魔術基礎教學