徠卡顯微系統公司有機會與 Lundberg 教授探討了運用人工智能 (AI) 和機器學習技術進行顯微圖像分析。她在實驗室開發的人工智能和機器學習模型有助于改進圖像采集以及隨后的處理和分析。例如,與使用傳統的分析方法相比,科學家們可以采用更高效的方法識別細胞和蛋白質。此外,人工智能對于圖像分割也非常有用,圖像分割可幫助科學家獲得更好的定量數據并進行可靠的統計分析,并且在成像過程中進行幾乎實時的分析以便檢查動態細胞事件。這些模型還可以利用特定格式的空間信息,這些格式可與蛋白質組學數據或單細胞測序數據等其他類型數據輕松整合。詳情請閱讀以下采訪。
Emma Lundberg 教授
瑞典 KTH 理工學院細胞生物學蛋白質組學教授
她還是細胞圖譜項目的總監,該項目是瑞典人類蛋白質圖譜(HPA)項目*的組成部分,后者是用于研究人類蛋白質組的開源資源。細胞圖譜項目是 HPA 的一部分,提供人類細胞系中 RNA 和蛋白質的表達及時空分布的高分辨率圖像。Lundberg 教授因其在繪制人蛋白質組圖方面的創新研究而榮獲瑞典國家化學工程師協會(SKR)2017年度大獎。她還是瓦倫堡青年院士(技術類別,2017-2021 年)。
您能否給我們介紹一下您目前的研究工作?
Lundberg 教授:我是人類蛋白質細胞圖譜(HPA)項目的總監,該項目涉及繪制人類細胞中的蛋白質分布圖。在這個大型項目中,我們生成了許多高分辨率共聚焦圖像,目的是解釋蛋白質在細胞中的模式和分布。這項工作相當重要,因為大約一半的人蛋白存在于兩個或多個細胞區室中,因此通常是兩種不同模式的混合。我們還研究數十種不同的細胞系,這些細胞系具有不同的形態,呈現細胞器的方式也略有不同。在啟動該項目時,我們手動進行所有標注,然后逐漸建立機器學習模型,對蛋白質分布模式進行分類。
您的研究工作如何在顯微成像中運用人工智能和機器學習技術?它能帶來哪些優勢?
Lundberg教授: 使用機器學習模型可以節省大量時間,但是我相信真正的成功將取決于我們開發的模型能夠將空間信息嵌入到一種格式中,將其與其他類型的分子測量數據整合,例如蛋白質組學數據或單細胞測序數據。機器學習算法的另一個主要優點是進行更加無偏性的圖像分析。例如,它可以幫助我們僅憑外觀就找到非常相似的細胞,或者我們可以通過異常檢測來發現罕見的細胞。
在 HPA 項目中,我們繪制了大多數人類蛋白質的亞細胞分布圖,現在,我們開始研究那些在鄰近細胞之間的分布上容易發生變化的時間動力學和蛋白質。為此,我們需要能夠在單細胞水平上量化空間模式的可靠模型,幫助我們了解細胞形態的細微變化。生物過程由某些蛋白質的相互作用驅動,而且微小的空間重排可能有非常顯著的功能性后果,因此我們希望能夠識別并量化這些細微的差異。
在實時圖像分析方面,我希望新的顯微鏡可以擴大我們的視野,例如幫助我們預測細胞的周期位置,或者哪些細胞將進入凋亡階段,或者從明視場圖像預測細胞膜標簽和 DAPI 染色,以便能將所有這些增強特性實時添加到顯微鏡視圖中。我希望我們最終也會在數據驅動的圖像采集與人工智能驅動的圖像分析之間形成某種閉環。
能否請您再介紹一下,在采集圖像的同時能夠分析數據有何好處?
Lundberg 教授:在 HPA 項目中,我們有時會檢查罕見事件,例如特定的酶易位到罕見細胞的細胞核中,而它們的功能未知。當我們檢查細胞中的這些罕見的空間重新排列時,需要在成像過程中進行近實時的分析。這樣,我們可以根據事件具體調整圖像,尤其在研究動態事件時。進行頻繁的延時成像時,通過這種方法還可以進行稀疏成像以避免光毒性,而當我們探測到要研究的罕見事件時,我們可以選擇性地對該細胞成像。
相反,如果我們采用手動分析圖像的方法來分析這些罕見事件,就必須停止實驗、進行分析,然后重復實驗。
既然你們是自己開發這些技術,那么你們是否利用這些技術獲得實時結果呢?
Lundberg 教授:我們有一些可以實時運行的輕量級模型。不過,我們尚未實現閉環,也沒有完成整合,但是我們希望在不久的將來實現這一目標。例如,我們開發了一種能夠從明視場圖像預測細胞膜染色的模型,通過該模型,我們能夠實現細胞的高精度實時分割。這意味著我們可以在顯微成像過程中實時測量分割后細胞中的熒光。
圖像來源(人類細胞):人類蛋白質圖譜
人工智能和機器學習技術可以為日常顯微成像工作帶來的主要價值是什么?
Lundberg 教授:人工智能驅動的分析可以優化和簡化顯微圖像處理,可以改善信噪比、將圖像去卷積或大幅度增高分辨率。它在提高圖像質量方面具有巨大的潛力,*改變了顯微成像領域。
在分析方面,機器學習算法可以為分析大型數據集創造全新的機會。使用現代顯微成像技術,我們可以生成非常大的顯微鏡數據集,而人工智能輔助分析則使我們能夠高效、準確地分析這些數據。
此外,我認為在成像方面,人工智能對圖像分析中常用的分割方法非常有用。良好的分割非常有幫助,能讓用戶獲得更好的定量數據,進行可靠的統計分析。人工智能驅動并不總那么困難,它可以包括從細胞分割等一般模型到高級算法的各種方法。大多數生物學家很可能會發現機器學習算法在圖像分析中非常有用,沒有理由不去嘗試一下。
無需處理超大型圖像數據集的研究人員也能受益于人工智能輔助分析嗎?
Lundberg 教授:當然可以。我認為細胞分割將是他們肯定能從中受益的可用工具之一。機器學習算法還可在模式識別方面提供很大幫助,例如用于識別無標志物的特定細胞器。
未來,機器學習模型可用于挖掘開放的圖像存儲庫。此外,它還使我們有機會根據現有數據分析我們自己的成像數據。例如,即使您生成小型數據集,也可以看到您的表型是否與數據庫中的另一個表型匹配。
目前,將人工智能應用于顯微成像的圖像分析是否存在挑戰?
Lundberg 教授:是的,當然存在。有多種挑戰:共享和管理海量的圖像數據集,滿足用于訓練人工智能模型的計算需求,以及為不習慣使用人工智能模型的研究人員開發易于使用的界面。可能會有許多障礙,具體要看專業領域。人工智能專家很可能希望開發更好的模型,而不習慣使用人工智能模型的顯微鏡工作者可能想要了解如何使用它們。我認為在機器學習算法的使用上有許多方面可以改進。
您認為是否有研究人員抗拒采用人工智能輔助分析?
Lundberg 教授:總的來說,我認為影像學界已很好地接受了基于人工智能的工具。我認為有些阻力是正常的,因為出現新的分析工具時總會出現這種情況。人工智能輔助圖像分割等迭代工具能夠讓用戶在手動修正時隨時了解最新情況,在訓練期間與模型交互,有助于研究人員對模型充滿信心,因為他們可以看到模型如何逐漸改進。但是,用戶當然必須認識到模型要進行數據訓練,如果輸入了錯誤數據,模型就可能會提供不可靠的輸出結果。當然,也不應該盲目相信人工智能驅動的分析。
您是否認為監督式機器學習可以降低對人工智能輔助圖像分析法的接受障礙?
Lundberg 教授:當然可以。通常,監督式機器學習需要對數據進行某種標注,而這是我們在成像中已經習慣的事情。例如,當用戶想在組織病理學載玻片中標記細胞或標記出感興趣區域時——這種實況數據的生成經常會形成瓶頸。只要掌握了數量足夠的真實情況數據,就可以訓練出良好的人工智能模型,但仍需要依靠專家來生成這種實況數據。真實情況的質量反過來又會決定模型的質量。我相信,如果實現這個循環并進行迭代分析,我們可以在專家的指導下訓練出更好的模型,改善模型的薄弱環節。這也是一種進步,能夠幫助真正的生物學專家增加對模型的信心,他們可以看到模型如何漸漸得到改進。這種“人在回路"方法是一種意義重大的進步。
您認為圖像分析的未來會如何?
Lundberg 教授:我認為人工智能模型將真正幫助我們理解和挖掘圖像數據的所有豐富內涵。此外,人工智能還可以幫助我們更智能地制定圖像采集方案,使我們收集到更好的數據。人工智能工具將幫助我們超解析、還原和處理圖像,從而生成更快、更智能、更高質量的數據,并且為解釋圖像數據和根據圖像數據做出預測等提供新的可能性。
我們還需要克服哪些限制,才能使計算分析方法被廣泛接受?
Lundberg 教授:我認為一個很大的限制是缺乏免費的公共開放圖像存儲庫,以及用于共享顯微成像人工智能模型的模型庫。如果我們可以共享所有針對顯微成像開發的人工智能模型,并且可以獲取所有已采集的圖像,那么您就可以訓練所有類型的模型,可以研究各種科學問題!
您會對研究人員說些什么來讓他們感興趣并考慮使用人工智能驅動的分析?
Lundberg 教授:現在的時機很合適——市場上有許多很好的工具,即使不是專家,也可以學習如何使用它們。沒有理由不接受人工智能驅動的分析方法,因為它可以提供更好的圖像和更好的圖像分析。大多數顯微鏡工作者在計劃和設置實驗上投入大量時間。那么,為什么不同樣花一些時間采用這種新技術來改進分析呢?
如果想了解人工智能驅動的圖像分析,有一個非常友好、很有幫助的社群。此外,還有許多關于這個方面的開源工具和論壇,所以沒有理由不去嘗試一下。
目前,在 HPA 數據庫中,我們每年擁有大約 1000 萬張圖像和 120 多萬用戶。到目前為止,我們只允許用戶從我們這里下載數據。也許,在未來的某個時候,我們能允許用戶上傳自己的圖像數據,并且除了文字外還能通過圖像查詢我們的數據庫。這是個非常切實的目標,我認為人工智能會帶來很多這樣的機會。
了解更多:徠卡顯微
立即詢價
您提交后,專屬客服將第一時間為您服務