欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

紐約大學團隊開發用于基因組學的神經網絡，并解釋了它如何實現準確的預測 - IT思維

IT思維 ? 1年前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

公眾號/? ScienceAI（ID：Philosophyai）

編輯 | 蘿卜皮

機器學習方法，特別是在大型數據集上訓練的神經網絡，正在改變科學家進行科學發現和實驗設計的方式。然而，當前最先進的神經網絡因其不可解釋性而受到限制：盡管他們具有出色的準確性，但他們無法描述他們是如何得出預測的。

紐約大學的研究團隊使用「可解釋的設計」方法，提出了一種神經網絡模型，它揭示了神經網絡（驅動人工智能和機器學習的引擎）功能的原因。該模型可以深入了解 RNA 剪接，這是將基因組信息轉移到功能性 RNA 和蛋白質產物的基本過程。

「許多神經網絡都是黑匣子，這些算法無法解釋它們的工作原理，引發人們對其可信度的擔憂，并阻礙理解基因組編碼的潛在生物過程的研究進展。」紐約大學庫朗數學科學研究所計算機科學教授 Oded Regev 說。

該研究以「Deciphering RNA splicing logic with interpretable machine learning」為題，于 2023 年 10 月 5 日發布在《PNAS》。

紐約大學團隊開發用于基因組學的神經網絡，并解釋了它如何實現準確的預測 - IT思維

機器學習算法，特別是神經網絡，捕獲輸入和輸出之間復雜的定量關系。然而，由于神經網絡通常是黑匣子，因此很難提取事后洞察來了解它們是如何做到的。此外，它們很容易捕獲訓練數據中的偽影或偏差，通常無法推廣到用于訓練和測試的數據集之外，并且一般不會深入了解底層流程。

近年來，神經網絡已被用來解決具有挑戰性的生物學問題。基因組學中的一個突出問題是理解 RNA 剪接的調控邏輯，它在信息從 DNA 到功能性 RNA 和蛋白質產物的基本轉移中發揮著關鍵作用。剪接去除內含子并將外顯子連接在一起形成成熟的RNA轉錄本。雖然一些規范序列特征對于外顯子定義是必要的（在內含子去除過程中使用的界定外顯子和分支點的剪接位點），但外顯子序列也有助于外顯子定義。

盡管近期使用神經網絡預測剪接結果取得了成功，但了解外顯子序列如何決定包含或跳過仍然是一個開放的挑戰。剪接邏輯的敏感性進一步凸顯了這一挑戰，其中沿著外顯子的幾乎所有單核苷酸變化都會導致剪接結果的巨大變化。

為了實現科學進步，機器學習模型不僅應該準確預測結果，還應該描述它們如何得出預測。在這里，紐約大學的研究人員證明了「可解釋設計」模型在不犧牲可解釋性的情況下實現了預測準確性，捕獲了統一的決策邏輯，并揭示了以前未表征的剪接特征。

紐約大學團隊開發用于基因組學的神經網絡，并解釋了它如何實現準確的預測 - IT思維

圖示：數據生成和可解釋的設計機器學習模型。（來源：論文）
「通過利用一種提高機器學習訓練數據數量和質量的新方法，我們設計了一種可解釋的神經網絡，可以準確預測復雜的結果并解釋它是如何得出預測的。」Regev 說。

模型的可解釋性使人們能夠系統地理解 RNA 剪接邏輯，包括識別兩個候選外顯子跳躍特征，并隨后進行實驗驗證。該模型能夠量化特定特征對單個外顯子剪接結果的貢獻，對于一系列醫療和生物技術應用具有巨大的潛力，包括對目標外顯子進行基因組或 RNA 編輯以糾正剪接行為或指導基于 RNA 的療法（如反義寡核苷酸）的合理設計。

此外，模型識別的特征暗示了值得進一步研究的新生化機制。例如，剪接決策通過附加量很好地建模，這一事實支持涉及 SR 和 hnRNP 蛋白核空間組織的生化機制。

Regev 指出：「我們的模型表明，RNA 中的一種小型發夾狀結構可以減少剪接。」

圖示：發卡結構的驗證。（來源：論文）

另外，該模型還發現了兩個不尋常的外顯子跳躍特征。這些特征可能被未表征的 RNA 結合蛋白或復合物識別。或者，引入高度結構化或非結構化區域可能會改變剪接位點之間的物理距離，從而增強外顯子跳躍。這些懸而未決的問題進一步強調了可解釋設計模型如何通過幫助假設生成來推進科學發現。

該模型在來自永生化細胞系的合成數據集上表現良好，但需要進一步的工作來捕獲發育調節剪接邏輯的動態。重要的是，剪接結果的變化取決于細胞類型特異性 RNA 結合蛋白的表達水平。這些問題可以通過在發育相關的細胞類型中生成額外的合成剪接數據集以及捕獲細胞類型特異性調控特征的可解釋設計模型來解決。

除了剪接的背景之外，可解釋的設計框架還可用于破譯決定生物分子加工的多個、復雜和重疊的代碼。重要的是，許多豐富的合成數據集已經生成，涉及 RNA 非翻譯 5′ 和 3′ 區域調控、甲基化和小 RNA 生物發生。研究人員認為，額外的數據生成工作與可解釋的設計框架相結合將促進更廣泛地理解生物密碼的進步。

論文鏈接：https://www.pnas.org/doi/10.1073/pnas.2221165120

相關報道：https://techxplore.com/news/2023-10-neural-network-genomics-accurate.html

隨意打賞

可編程芯片首次用光訓練神經網絡

砍柴網 ? 9分鐘前

4 月 21 日消息，據最新一期《自然?光子學》雜志報道，美國賓夕法尼亞大學的工程師們開發了首款能夠利用光進行非線性神經網絡訓練的可編程芯片。該芯片可以使用光來訓練非線性神經網絡 —— 這一突破可以顯著加快 AI 訓練速度，減少能耗，甚至為全光計算機鋪平道路。▲ 芯片內部的圖像 —— 白色虛線框是輸入，黃色虛線框是輸出
新加坡國立大學賴載興教授專訪：用混沌邊緣改善神經網絡，與上帝擲骰子

雷鋒網 ? 8月前

2021年，諾貝尓獎委員會決定將物理獎頒發給復雜系統研究領域、以喬治·帕里西（George Parisi）為首三位科學家。當時不僅物理學界，許多計算神經科學家或理論機器學習學者表達了對帕里西的祝賀和感激，認為他的理論成果極大地推動了神經網絡理論研究這一跨學科領域的蓬勃發展。在新加坡國立大學，Choy
車路云一體化建設：三旺通信TSN方案構建智能交通神經網絡

砍柴網 ? 9月前

前言一個多霧的早晨，高速公路上能見度極低，智能感知設備檢測到這一情況后，立即通過V2I通信向所有車輛發送警報，車載系統自動調整至智能引導模式，確保安全行駛。同一時間，一輛故障車停在應急車道，通過V2I模塊自動向監控中心求助，救援車輛迅速響應，并通過V2V通信向周邊車輛發出預警，有效預防次生事故。與此同時，一輛超速車輛觸
用擴散模型生成神經網絡？NUS 尤洋團隊：這不是開玩笑

雷鋒網 ? 1年前

作者：賴文昕編輯：郭思、陳彩嫻說起擴散模型生成的東西，你會立刻想到什么？是OpenAI的經典牛油果椅子？是英偉達Magic3D生成的藍色箭毒蛙？還是斯坦福大學和微軟Folding Diffusion生成的蛋白質結構？這些都是擴散模型的魔法展示，而近期，關于擴散模型的研究又進行了一次全新的升級。由新加坡國立大學尤洋團隊、
微美全息研究基于混合循環神經網絡架構的人機協作意圖識別

砍柴網 ? 1年前

在當今科技發展迅速的時代，人機協作已經成為一個重要的研究話題。隨著人工智能技術的不斷進步，人機協作的應用范圍也越來越廣泛，其在智能交通、智能家居和智能機器人等領域已經得到了廣泛的應用。在實際應用中，人機協作的意圖識別是一個關鍵問題。要實現高效的人機協作，機器需要準確地理解人類用戶的意圖，以
微美全息創新突破利用群體智能算法優化人工神經網絡

砍柴網 ? 1年前

人工神經網絡（Artificial Neural Network，ANN）已成為機器學習領域的核心算法之一，推動了自然語言處理、計算機視覺、無人駕駛、語音識別、醫療診斷和推薦系統等多個領域的技術進步。近年來，人工神經網絡在眾多領域得到了廣泛應用。在應用人工神經網絡之前，需要確定網絡結構并對其進行訓練。網絡結構的選擇通常
華為等靠激光雷達推自動駕駛！特斯拉不屑全力拋棄：開始依賴神經網絡

砍柴網 ? 1年前

11月29日消息，據國內媒體報道稱，當其他車企還在依賴激光雷達等類型的傳感器為用戶推出輔助/自動駕駛功能時，特斯拉已經開始依賴神經網絡和人工智能進行所謂的完全自動駕駛。從目前的情況看，特斯拉的完全自動駕駛（FSD）V12版本放棄代碼（30多萬代碼降至2000行），使用神經網絡進行車
使用卷積神經網絡從相關 Moiré 超晶格的STM數據中學習有效的理論模型 - IT思維

IT思維 ? 1年前

公眾號/? ScienceAI（ID：Philosophyai）編輯 | 蘿卜皮現代掃描探針技術，例如掃描隧道顯微鏡，可以獲取編碼量子物質基礎物理的大量數據。斯圖加特大學（Universit?t Stuttgart）的研究人員展示了如何使用卷
一種新型神經網絡正在幫助物理學家應對數據分析的艱巨挑戰 - IT思維

IT思維 ? 1年前

公眾號/ ScienceAI（ID：Philosophyai）編輯 | 綠蘿假設你有一本一千頁的書，但每一頁只有一行文字。你使用掃描儀提取書中包含的信息，這個特定的掃描儀系統地掃描每一頁，一次掃描一平方英寸，要花很長時間才能讀完整本書，而且大部分時間會浪費在掃描空白處。這就是許多

評論

提交建議