東北地理所提出基于LLM與VLM融合重塑植物脅迫表型分析的AI新范式
在全球氣候變化與糧食安全需求提升的雙重壓力驅(qū)動(dòng)下,精準(zhǔn)識(shí)別生物與非生物脅迫對(duì)作物影響的植物脅迫表型分析技術(shù)正經(jīng)歷快速的技術(shù)變革。近期發(fā)表于《Plant Phenomics》的綜述,系統(tǒng)性闡釋了大語(yǔ)言模型(LLMs)與視覺-語(yǔ)言模型(VLMs)的融合應(yīng)用,提出了一套新型研究框架,有望推動(dòng)農(nóng)業(yè)向規(guī)模化、精準(zhǔn)化的智慧農(nóng)業(yè)模式加速轉(zhuǎn)型。
傳統(tǒng)植物脅迫檢測(cè)方法高度依賴人工評(píng)估或單模態(tài)視覺模型,這類方法存在主觀性強(qiáng)、可擴(kuò)展性有限的問(wèn)題,且在復(fù)雜或復(fù)合脅迫場(chǎng)景下檢測(cè)性能不佳。與之相比,大語(yǔ)言模型與視覺模型的融合在作物脅迫檢測(cè)中展現(xiàn)出顯著優(yōu)勢(shì)。盡管如此,這類系統(tǒng)仍存在模型幻覺、對(duì)數(shù)據(jù)集質(zhì)量依賴性強(qiáng)、需針對(duì)特定領(lǐng)域進(jìn)行提示詞工程設(shè)計(jì)或?qū)σ曈X模型開展微調(diào)等局限性。
大語(yǔ)言模型與視覺-語(yǔ)言模型的協(xié)同融合,能夠?qū)崿F(xiàn)對(duì)多模態(tài)數(shù)據(jù)的深度解析。視覺-語(yǔ)言模型融合圖像與文本編碼器,可聯(lián)合處理高分辨率作物影像與田間記錄,突破單視覺模型的泛化能力局限。同時(shí),大語(yǔ)言模型憑借其在語(yǔ)義推理與少樣本學(xué)習(xí)方面的優(yōu)勢(shì),可完成文獻(xiàn)挖掘、性狀描述與標(biāo)注、診斷報(bào)告生成等任務(wù)。檢索增強(qiáng)生成技術(shù)(RAG)的融入,進(jìn)一步提升了結(jié)果的可靠性,緩解了模型幻覺問(wèn)題。
盡管該技術(shù)具備巨大應(yīng)用潛力,但其實(shí)際落地仍面臨諸多挑戰(zhàn):高質(zhì)量農(nóng)業(yè)多模態(tài)數(shù)據(jù)集匱乏、模型訓(xùn)練計(jì)算成本高昂、跨區(qū)域與跨語(yǔ)言的適配能力有限,且難以在復(fù)雜的田間環(huán)境中復(fù)現(xiàn)實(shí)驗(yàn)室級(jí)別的檢測(cè)準(zhǔn)確率。為解決上述問(wèn)題,該綜述提出了一系列解決方案,包括利用生成對(duì)抗網(wǎng)絡(luò)(GANs)生成合成數(shù)據(jù)、優(yōu)化輕量級(jí)模型架構(gòu)、將知識(shí)圖譜(KGs)與神經(jīng)符號(hào)推理相融合等。
作為該新興領(lǐng)域最早的綜合性綜述之一,本研究提出的大語(yǔ)言模型-視覺-語(yǔ)言模型融合框架,為抗逆作物育種與田間精準(zhǔn)管理提供了跨學(xué)科研究新視角。隨著模型的持續(xù)優(yōu)化與數(shù)據(jù)集的標(biāo)準(zhǔn)化建設(shè),人工智能驅(qū)動(dòng)的表型分析技術(shù)有望進(jìn)一步突破“檢測(cè)-推理-決策”全流程的技術(shù)瓶頸,為可持續(xù)農(nóng)業(yè)發(fā)展與全球糧食安全提供核心技術(shù)支撐。
中國(guó)科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所為論文第一完成單位,大豆分子設(shè)計(jì)育種重點(diǎn)實(shí)驗(yàn)室ElshanMusazade特別研究助理為第一作者,馮獻(xiàn)忠研究員為通訊作者。研究得到生物育種國(guó)家科技重大專項(xiàng)(2023ZD040360301)和國(guó)家自然科學(xué)基金(U21A20215和32488102)的支持。

基于LLMs和VLMs的AI驅(qū)動(dòng)植物脅迫管理框架
附件下載:
吉公網(wǎng)安備22017302000214號(hào)