2022年4月26日,廣東省科學院微生物研究所吳清平院士團隊與暨南大學食品科學與工程系丁郁教授合作,提出了一種基于代謝組學和深度學習的單增李斯特菌快速鑒定新方法。相關研究成果以題為“Novel method for rapid identification of Listeria monocytogenes based on metabolomics and deep learning”發(fā)表在食品領域國際期刊《Food Control》(中科院1區(qū)Top期刊,IF=6.652)上。
成果簡介
單核細胞增生李斯特菌是一種重要的食源性病原體,可導致免疫功能低下的個體、孕婦、胎兒、新生兒和老年人爆發(fā)李斯特菌病。李斯特菌病的死亡率為 20-30%,單核細胞增生李斯特菌是與食物中毒相關的第三大致死病因。因此,快速識別和檢測李斯特菌對食品安全至關重要?;谫|(zhì)譜法的代謝組學可以作為檢測病原體和腐敗微生物的平臺。然而,基于質(zhì)譜的低分子量生物標志物的準確定量通常受到同位素標記標準和復雜規(guī)程的限制,不利于大規(guī)模應用。
本文開發(fā)了一種將代謝組學與深度學習相結合的新方法來鑒定單核細胞增生李斯特菌。建立了單核細胞增生李斯特菌三種潛在生物標志物的卷積神經(jīng)網(wǎng)絡(CNN)模型,預測準確率為82.2%。此外,使用偽靶向代謝組學方法獲得了由29種代謝產(chǎn)物組成的代謝指紋,在層次聚類分析中可以成功區(qū)分六種常見李斯特菌。本研究中建立的CNN模型的二元分類器和多分類器,用于識別單核細胞增生李斯特菌和常見病原體,預測準確率分別為96.7%和96.3%。
實驗流程
圖1. 本研究方法工作流程圖。
研究亮點
● 結合代謝組學和深度學習的平臺用于病原體鑒定。
● 篩選了三個代謝潛在生物標志物用于單核細胞增生李斯特菌的鑒定。
● 建立了基于代謝指紋的CNN模型。
● 與傳統(tǒng)的 LC-MS 方法相比,檢測時間縮短至 12 分鐘。
圖文賞析
圖2. 過程質(zhì)量控制。(A) 正離子模式下質(zhì)量控制(QC)樣品的TIC圖;(B) 正離子模式下質(zhì)控樣品的內(nèi)標響應;(C) 六種常見李斯特菌的主成分分析;(D) QC樣品的標準偏差。
圖3. 單變量和多變量分析。(A) VIP值的柱狀圖;(B) 單核細胞增生李斯特菌與其他菌株的火山圖,其中紅色和藍色的點符合P≤ 0.05和log2(FC)>1;(C)具有顯著代謝物的OPLS-DA模型的S圖,其|p(corr)|>0.5和|p|>0.1;(D)候選生物標記物相關含量的箱線圖。
圖4. 通過t檢驗生成的前50個代謝物的層次聚類熱圖。圖中的每個彩色單元格對應于數(shù)據(jù)表中的濃度,行表示樣本,列表式化合物。右側的代謝物編號與表S2中代謝物的編號相對應。
圖5. 基于三種潛在生物標志物的卷積神經(jīng)網(wǎng)絡(CNN)模型的混淆矩陣圖和接收器工作特性(ROC)曲線。(A) 測試集的ROC曲線(曲線下面積(AUC)為0.92);(B) 以混淆矩陣表示的測試集的預測結果;預測準確率為82.2%。
圖6. 基于29個代謝特征作為代謝指紋的卷積神經(jīng)網(wǎng)絡(CNN)模型的混淆矩陣圖和接收器工作特性(ROC)曲線。(A) 測試集的ROC曲線(曲線下面積(AUC)為0.98);(B)以混淆矩陣表示的測試集的預測結果。
圖7. 常見病原體測試集(30%樣本)的卷積神經(jīng)網(wǎng)絡分類混淆矩陣圖。
圖8. 參與前四條通路的代謝物豐度變化。
表1. 內(nèi)標響應差異。
表2. 單增李斯特菌候選生物標志物的單變量和多變量分析結果。
表3. 經(jīng)過LC-QQQ-MS確證后的單增李斯特菌候選生物標記物的單變量分析結果。
表4. 通路分析結果。
研究結論
本研究開發(fā)了一種新的病原體識別方法,包括使用基于特征代謝物LC-QQQ-MS指紋的深度學習模型,并使用偽靶向代謝組學進行潛在生物標記物驗證。該策略是代謝組學領域的一個新發(fā)展。篩選了9種差異代謝物作為候選生物標記物,并使用LC-QQQ-MS驗證了3種代謝物是可以在物種水平上識別單核細胞增生李斯特菌的潛在生物標記物?;谌N潛在生物標志物的CNN模型的最高預測準確率為82.2%。然后選取29個代謝特征作為代謝指紋,并將其與深度學習識別技術相結合,預測準確率提高到96.7%。此外,作者利用CNN模型對常見病原菌進行了鑒定,預測準確率為96.3%。
原文鏈接:https://doi.org/10.1016/j.foodcont.2022.109042