【
儀表網 行業標準】按照中國電子工業標準化技術協會團體標準制修訂項目工作安排,標準起草組已完成《人工智能 計算機
視覺系統可信賴技術規范》團體標準(項目號:CESA-2021-1-001)征求意見稿的編制工作。現按照中國電子工業標準化技術協會《團體標準制修訂程序(試行)》的要求,公開征求意見。
計算機視覺技術領域主要研究集圖像采集、處理、分析過程涉及的硬件、軟件、算法、系統等的設計、制造、應用和維護。計算機視覺技術是典型的人工智能領域,其技術及應用發展歷經多年,也是AI技術使用最多的技術領域之一,其應用行業涵蓋國防、軍事、科技、經濟、教育、工業生產、農業、服務業等幾乎所有重要行業。在人工智能技術使用在該領域之前,就有相關比較成熟的應用、工具組件(如opencv)、標準(如JTC1 SC24及信標委SC24)。在人工智能技術應用后,為計算機視覺領域帶來了革命性的變化,以往因為準確率而不能獲得實際應用的場景,出現了相當規模的實踐,其中不乏成熟度較高的實踐(如人臉識別、工業質檢、金融業光學字符識別等)。隨著人工智能技術的飛速發展,已有更多的先進解決方案涌現。
AI可信賴是AI的一個研究領域,也是未來影響AI使能應用效果的重要方面。瞄準AI技術應用最多、最廣泛的計算機視覺領域,制定AI可信賴技術規范,從方法論層面指引計算機視覺系統AI可信賴建設,提出計算機視覺系統可信賴技術要求及測試方法。在產業內傳播有益經驗,對計算機視覺產業的整體安全可信賴水平提升及健康發展有重要意義,影響深遠。
當前,國際上對AI應用的科研、生產、標準化的重點之一是AI可信賴。各標準化組織或國際組織,如ISO/IEC, IEEE, ETSI, ITU-T, AIIA, EU的工作聚焦在AI可信賴技術能力方面。各計算機視覺或相關解決方案廠商也大力研究發展AI可信賴技術,研制具備可信賴能力的產品。可預期的是,在不久的未來,AI可信賴技術將成為各領域AI應用的必要項。AI可信賴能力的要求也將是各領域發展不可回避的問題。計算機視覺是AI應用最廣泛的領域,但缺乏針對核心AI部件(組件)的可信賴技術要求,普適AI可信賴技術在計算機視覺產業落地的問題,亟待解決。
本文件按照GB/T 1.1—2020《標準化工作導則 第1部分:標準化文件的結構和起草規則》的規定起草。
本文件規定了基于人工智能的計算機視覺系統的可信賴技術要求和測試方法。本文件適用于基于人工智能的計算機視覺系統及其硬件、軟件和模型等部件的可信賴設計及測試, 為計算機視覺相關研制機構、測試機構、服務提供機構及用戶提供參考。
可信賴概念要求:
1.可靠性
計算機視覺系統,符合以下可靠性要求:
a) 應能對附錄 B 中規定的圖像、視頻輸入給出反饋;
b) 附錄 B 中規定的圖像、視頻輸入,應不致使系統進入異常或無法持續服務的狀態;
c) 對不在附錄 B 中規定的圖像、視頻輸入,其中間或最終處理、分析結果應可用;
d) 訓練過程應能保存斷點,在訓練因故障停止后,從斷點繼續訓練,宜能自動重啟訓練。
2.公平性
計算機視覺系統,符合以下公平性要求:
a) 圖像、視頻處理、分析結果不應對個體、社群造成歧視性傷害;
注:對視覺業務需求本身要求的情況除外(如某醫療視覺業務本身要求從步態判別殘障及恢復狀態,則不屬于歧視性傷害)。
b) 在未得到法律授權時,圖像、視頻處理、分析過程對同類數據應采用相同的自動決策邏輯;
c) 對特殊人群(如殘障人群),宜實現特別的信息處理或傳遞方式,使該群體能使用系統的功能。
示例:某視覺系統識別輸入圖像輸出對圖像的解釋音頻,但對聾啞人群提供解釋音頻的文本以便閱讀。
隱私保護要求:
計算機視覺系統隱私數據保護應滿足以下要求,包含但不限于:
a) 明確隱私數據保護在數據生命周期管理內的工作和要求,形成方案體系,內容應符合法律、行政法規、部門規章和其他規范性文件的強制性要求(包括 GB/T 35273—2020 要求)。隱私數據保護的方案體系,內容應至少覆蓋:
1) 涉及隱私數據存儲時,應履行告知義務、獲取同意隱私數據存儲請求及相應安全管理措施;
2) 業務目標完成或圖像、視頻采集、處理分析計算設施更換、報廢時,刪除用戶隱私數據并實施防恢復措施;
3) 可再分配資源(視頻、圖像云空間)再分配之前,刪除原有用戶隱私數據并實施防恢復措施;
4) 隱私數據留存方案應對用戶透明,明確界定需要留存的用戶隱私數據范圍、留存時間、目的及用戶告知機制。
b) 控制用戶隱私數據可見范圍,宜使用以下方法,包含但不限于:
1) 主動隱私提醒;
2) 隱私符號;
3) 透明日志。
c) 控制數據關聯性,宜使用解關聯方法,包含但不限于:
1) K 匿名,L 多樣性,T 接近性;
2) 數據屏蔽(如數據掩碼、數據截斷等);
3) 隨機化(如使用圖像、視頻加噪、置換等);
4) 同態加密;
5) 安全多方計算。
d) 增強基本安全性,宜使用安全加密方法,包含但不限于:
1) 可搜索加密;
2) 基于身份認證的訪問控制;
3) 安全加密傳輸。
e) 檢查數據完整性,宜使用完整性檢測技術,包含但不限于:
1) 數字簽名;
2) 遠程證明。
f) 確保對數據的可干預性,宜使用數據存取干預技術,包含但不限于:
1) 圖像、視頻數據溯源;
2) 細粒度訪問控制;
3) 隱私風險度量;
4) 用戶(圖像、視頻數據主體)同意機制及工具。
g) 提高用戶身份標識數據安全性,宜實施數據脫敏,包含但不限于:
1) 將居民身份證、銀行卡、刑事證據、用戶面部、行為動作、病灶、傷殘部位的圖像、視頻數據與用戶身份標識數據分離存儲;
2) 使用動態脫敏技術,確保數據從數據庫中取出時已脫敏;
3) 針對用戶身份標識數據設計脫敏算法和混淆冗余數據,抗重識別,滿足以下要求;
? 在不慎泄露部分圖像、視頻數據及部分用戶身份識別數據時,用戶身份不被重識別;
? 在不慎泄露部分身份標識數據時,用戶身份不被重識別;
? 在不慎泄露部分敏感屬性數據時,用戶身份不被重識別。
h) 宜采用差分隱私技術,保護訓練數據中的個人信息;
i) 宜采用聯邦學習,使訓練數據不被泄露。