近日,中國科學院合肥物質院智能所智慧農業研究中心王儒敬研究員團隊提出了一種基于多尺度空間特征的水下圖像增強方法。相關研究成果發表在計算機科學領域期刊 Journal of King Saud University - Computer and Information Sciences 上。
水下圖像的高質量獲取一直是漁業監測、環境保護及物種保護等領域的關鍵技術難題。水下圖像往往呈現出模糊、色彩失真等問題,嚴重影響了圖像的可用性和后續分析的準確性。近年來,雖然深度學習技術在圖像增強領域取得了顯著進展,但大多數現有方法對于計算資源和內存的需求較高,難以在水下設備平臺上有效應用。為了解決這個問題,團隊提出了一種名為多尺度特征調制網絡(MFMN)的新方法,以更好地實現模型效率和重構性能之間的權衡。具體來說,科研團隊在一個類似于視覺變壓器(VIT)的模塊上開發了一個多尺度調制模塊,在該模塊中使用多尺度空間特征模塊提取輸入圖像的特征,動態選擇圖像特征空間中的代表性特征;此外,由于多尺度空間特征模塊從圖像的空間角度來處理圖像特征缺乏通道特征信息,團隊進一步引入了通道混合模塊來執行通道混合。
實驗結果表明,該方法在網絡參數方面比目前最先進的水下圖像增強方法要小8.5倍,同時實現了基本相同甚至更優的圖像增強效。這意味著,在保持高性能的同時,該方法顯著降低了對計算資源的需求,為水下圖像增強技術的實際應用提供了新的可能性。
鄭世健博士生為論文第一作者,汪六三副研究員為論文通訊作者。該項研究工作得到了國家自然科學基金、國家重點研發計劃的支持。
圖1 MFMN網絡結構