近日,中國科學院合肥物質院智能所智慧農業研究中心王儒敬研究員團隊提出了一種可學習全頻變壓器雙生成對抗網絡方法,可顯著提升水下成像質量。相關研究成果發表在海洋科學領域TOP期刊Frontiers in marine science上。
水下成像面臨著一系列嚴峻的挑戰,如顏色失真、噪聲干擾和低對比度問題,這些問題極大地削弱了圖像的視覺質量。為了攻克這些難題,科研團隊提出了一種創新的方法——可學習全頻變壓器雙生成對抗網絡(LFT-DGAN)。該方法首先引入了一種基于可逆卷積的圖像分解技術,能夠將水下圖像的信息精準地分解為低頻、中頻和高頻域,有助于更全面地提取圖像特征;然后,利用圖像通道和空間之間的相似性,構建了一個可學習的全頻域變壓器,促進不同信息分支之間的交流與融合;最后,開發了一種功能強大的雙域鑒別器,具備學習水下圖像空間特征的能力,能夠深入捕捉其頻域特征。
在UIEB數據集上,通過LFT-DGAN方法增強后的圖像質量在PSNR、SSIM、UQIM、UCIQE指標上比最先進算法(CWR、Semi-UIR、RCT等)分別平均提高4.3%、9.4%、21.6%、24.7%。
鄭世健博士生為論文第一作者,汪六三副研究員為論文通訊作者。該項研究工作得到了國家自然科學基金、國家重點研發計劃的支持。
LFT-DGAN網絡的整體架構
生成器框架