欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

紐約大學團隊開發用于基因組學的神經網絡,并解釋了它如何實現準確的預測 - IT思維

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

公眾號/? ScienceAI(ID:Philosophyai)

編輯 | 蘿卜皮

紐約大學團隊開發用于基因組學的神經網絡,并解釋了它如何實現準確的預測 - IT思維

機器學習方法,特別是在大型數據集上訓練的神經網絡,正在改變科學家進行科學發現和實驗設計的方式。然而,當前最先進的神經網絡因其不可解釋性而受到限制:盡管他們具有出色的準確性,但他們無法描述他們是如何得出預測的。

紐約大學的研究團隊使用「可解釋的設計」方法,提出了一種神經網絡 模型 ,它揭示了神經網絡(驅動人工智能和 機器學習 的引擎)功能的原因。該模型可以深入了解 RNA 剪接,這是將基因組信息轉移到功能性 RNA 和蛋白質產物的基本過程。

「許多神經網絡都是黑匣子,這些算法無法解釋它們的工作原理,引發人們對其可信度的擔憂,并阻礙理解基因組編碼的潛在生物過程的研究進展。」紐約大學庫朗數學科學研究所計算機科學教授 Oded Regev 說。

該研究以「Deciphering RNA splicing logic with interpretable machine learning」為題,于 2023 年 10 月 5 日發布在《PNAS》。

紐約大學團隊開發用于基因組學的神經網絡,并解釋了它如何實現準確的預測 - IT思維

機器學習算法,特別是神經網絡,捕獲輸入和輸出之間復雜的定量關系。然而,由于神經網絡通常是黑匣子,因此很難提取事后洞察來了解它們是如何做到的。此外,它們很容易捕獲訓練 數據 中的偽影或偏差,通常無法推廣到用于訓練和測試的數據集之外,并且一般不會深入了解底層流程。

近年來,神經網絡已被用來解決具有挑戰性的生物學問題。基因組學中的一個突出問題是理解 RNA 剪接的調控邏輯,它在信息從 DNA 到功能性 RNA 和蛋白質產物的基本轉移中發揮著關鍵作用。剪接去除內含子并將外顯子連接在一起形成成熟的RNA轉錄本。雖然一些規范序列特征對于外顯子定義是必要的(在內含子去除過程中使用的界定外顯子和分支點的剪接位點),但外顯子序列也有助于外顯子定義。

盡管近期使用神經網絡預測剪接結果取得了成功,但了解外顯子序列如何決定包含或跳過仍然是一個開放的挑戰。剪接邏輯的敏感性進一步凸顯了這一挑戰,其中沿著外顯子的幾乎所有單核苷酸變化都會導致剪接結果的巨大變化。

為了實現科學進步,機器學習模型不僅應該準確預測結果,還應該描述它們如何得出預測。在這里,紐約大學的研究人員證明了「可解釋設計」模型在不犧牲可解釋性的情況下實現了預測準確性,捕獲了統一的決策邏輯,并揭示了以前未表征的剪接特征。

紐約大學團隊開發用于基因組學的神經網絡,并解釋了它如何實現準確的預測 - IT思維

圖示:數據生成和可解釋的設計機器學習模型。(來源:論文)
「通過利用一種提高機器學習訓練數據數量和質量的新方法,我們設計了一種可解釋的神經網絡,可以準確預測復雜的結果并解釋它是如何得出預測的。」Regev 說。

模型的可解釋性使人們能夠系統地理解 RNA 剪接邏輯,包括識別兩個候選外顯子跳躍特征,并隨后進行實驗驗證。該模型能夠量化特定特征對單個外顯子剪接結果的貢獻,對于一系列醫療和生物技術應用具有巨大的潛力,包括對目標外顯子進行基因組或 RNA 編輯以糾正剪接行為或指導基于 RNA 的療法(如反義寡核苷酸)的合理設計。

此外,模型識別的特征暗示了值得進一步研究的新生化機制。例如,剪接決策通過附加量很好地建模,這一事實支持涉及 SR 和 hnRNP 蛋白核空間組織的生化機制。

Regev 指出:「我們的模型表明,RNA 中的一種小型發夾狀結構可以減少剪接。」

圖示:發卡結構的驗證。(來源:論文)

另外,該模型還發現了兩個不尋常的外顯子跳躍特征。這些特征可能被未表征的 RNA 結合蛋白或復合物識別。或者,引入高度結構化或非結構化區域可能會改變剪接位點之間的物理距離,從而增強外顯子跳躍。這些懸而未決的問題進一步強調了可解釋設計模型如何通過幫助假設生成來推進科學發現。

該模型在來自永生化細胞系的合成數據集上表現良好,但需要進一步的工作來捕獲發育調節剪接邏輯的動態。重要的是,剪接結果的變化取決于細胞類型特異性 RNA 結合蛋白的表達水平。這些問題可以通過在發育相關的細胞類型中生成額外的合成剪接數據集以及捕獲細胞類型特異性調控特征的可解釋設計模型來解決。

除了剪接的背景之外,可解釋的設計框架還可用于破譯決定生物分子加工的多個、復雜和重疊的代碼。重要的是,許多豐富的合成數據集已經生成,涉及 RNA 非翻譯 5′ 和 3′ 區域調控、甲基化和小 RNA 生物發生。研究人員認為,額外的數據生成工作與可解釋的設計框架相結合將促進更廣泛地理解生物密碼的進步。

論文鏈接:https://www.pnas.org/doi/10.1073/pnas.2221165120

相關報道:https://techxplore.com/news/2023-10-neural-network-genomics-accurate.html

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 在线韩日| 四虎永久在线精品免费影视 | 九九在线免费观看视频 | 欧美性猛交xxxx免费看久久 | 亚洲精品大片 | 亚洲精品国产福利一区二区三区 | 奇米影视7777久久精品 | 欧美一级片网 | 国产999在线观看 | 爱爱小视频免费体验区在线观看 | 99精品一区二区免费视频 | 精彩视频一区二区三区 | 中文字幕在线亚洲 | 久久久久久9 | 欧美一级毛片片免费孕妇 | 欧美24video| 尤物视频在线观看视频 | 亚洲精品国自产拍影院 | 国内精品伊人久久久影院 | 伊人影院在线观看视频 | 色欧洲| 福利姬在线播放 | 五月天 亚洲 | 久久综合偷偷噜噜噜色 | 99精彩视频在线观看 | 欧美日韩免费做爰视频 | 四虎影永久在线观看精品 | 日本色综合网 | 精品亚洲综合在线第一区 | 亚洲免费区 | 久热精品在线视频 | 激情综合网五月婷婷 | 国产护士资源总站 | 午夜精品久久久久久 | 国产情侣普通话刺激对白 | 久热免费在线观看 | 国产精品美女久久久久网 | 欧美色欧美亚洲高清在线视频 | 99久久免费精品 | 97国产在线视频公开免费 | 久久久久久久久久久9精品视频 |