近日, 中科院合肥研究院智能所先進制造技術研究中心王紅強研究員團隊提出了一種新型目標檢測人工智能框架,為快速高精度實時在線目標識別提供了新的解決方案。相關工作發表在計算機科學及
工程技術領域頂刊 Expert Systems With Applications 上。
近年來,深度學習理論驅動了人工智能技術飛躍式發展,基于深度學習的目標檢測技術在許多產業應用中取得巨大成功,其中快速實時目標檢測是人工智能技術產業應用的重要需求。一直以來快速實時目標檢測研究主要依賴研發輕量型神經網絡模型(或邊緣計算等)提高目標檢測速度,但效率與精度往往不能兼顧,成為當前目標檢測前沿研究與產業應用的重要挑戰之一。此外,由于深度學習自身的特性, 檢測精度再提升往往伴隨著巨大的計算代價和時間開銷, 造成在許多場景下部署和再升級瓶頸。
科研團隊通過研究分析發現,基于深度學習的目標檢測技術主要缺陷之一在于重復的特征提取與融合深度網絡結構,產生不必要的計算代價。為此,科研人員提出一種多輸入單輸出目標識別框架(MiSo),區別于傳統的多輸入多輸出模式,具有降低模型復雜度與推理時間開銷的巨大潛力。同時,在此框架下,科研團隊基于早期提出的eRF檢測理論,設計了感受野調節機制、殘差注意力自學習機制、基于eRF動態平衡抽樣策略三種新的學習機制,實現了更加簡潔高效地提取熱點特征信息。在
標準數據集上以同樣29FPS的速率下獲得高出現有基準2.6個百分點,驗證了該模型的優越性。該方法為目標檢測前沿研究與產業應用提供了新的思路。
王琦進博士生為文章的第一作者,王紅強研究員為通訊作者。該研究工作得到了國家自然科學基金項目、中科院設備開發、安徽省重點研究與開發計劃以及橫向企業委托開發等科研項目的支持。