近期,中國科學院合肥物質科學研究院智能機械研究所離子束生物工程與綠色農業研究中心研究員吳躍進課題組圍繞
近紅外光譜分析技術,提出基于組合移動窗口和智能優化算法相結合的變量選擇算法。相關研究結果在線發表在Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy上。
近年來,隨著光譜技術的發展,光譜數據呈現數量高、維度高、復雜度高等特點。光譜數據中包含大量的噪聲和干擾變量,且當樣本數量遠小于變量數量時,尋找最優變量子集將成為NP-hard問題,對光譜數據挖掘和光譜定量分析提出挑戰。提取關鍵變量信息、減少數據維度,不僅可以提高光譜定量分析能力,而且可以選取特征光譜,降低儀器研發成本,提高經濟效益。
該研究改進傳統粒子群算法(PSO),提出變維度的粒子群算法(VDPSO),結合組合移動窗口策略,實現光譜數據變量的快速選擇。該算法可在不同維度搜索數據空間,降低限入局部極值和過擬合的風險。通過與四種高性能變量選擇算法BOSS、VCPA、iVISSA和IRF比較,發現該算法可選擇出最優的光譜信息,提升模型的預測能力,有望進一步應用于基因組學、蛋白質組學、代謝組學和定量構效關系(QSAR)等學科數據分析中。
研究工作得到安徽省重點研究開發計劃、中科院戰略性先導科技專項和國家自然科學基金等的支持。