欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

NIH對中國關閉核心數據庫,科學家們最擔心什么?

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

“You access to dbGaP has been suspended”,上周許多生物醫學領域的學者都收到來自大洋彼岸的這樣一封郵件。


4月2日,美國國立衛生研究院 (NIH) 發布了一份《實施更新:增強?NIH?受控訪問數據的安全措施》文件,宣布從2025年4月4日起,禁止位于中國 (含中國香港和中國澳門、不含中國臺灣) 、俄羅斯、伊朗、朝鮮、古巴、委內瑞拉的機構訪問NIH受控訪問數據庫及其相關數據。


時隔一年,NIH最終宣布對中國關閉了21個受控訪問數據庫,其中最具代表性的有基因組-表型數據庫dbGaP和部分癌癥基因組圖譜TCGA數據。 其承載了全球最核心的人類基因組、表型信息和疾病研究數據, 其中后者是一項涵蓋33種癌癥類型、11000名患者具有里程碑意義的癌癥基因組學計劃。


值得注意的是,NIH的數據平臺分為受控數據庫 (controlled-access data repositories) 和開放數據庫 (open access) ,其中開放數據庫 (如PubMed生物醫學文獻數據庫、GenBank核酸序列數據庫等) 并未受到限制。在禁令之前,受控數據庫中的數據只需申請人提交申請,如無特殊原因,一般都會被通過。


這項禁令,早在2024年2月28日拜登政府簽署的《關于防止受關注國家獲取美國人大量敏感個人數據和美國政府相關數據的行政令》便意有所指, 其核心目標是限制特定國家獲取、分析與交易美國公民的基因組、健康等敏感數據, 一位生物信息學教授表示,“落地只是時間問題”。


我國的《人類遺傳資源管理條例實施細則》于2023年7月施行,明確規定了遺傳資源的利用規范,強調跨境數據傳輸必須經過嚴格審批,建立了相比國際通行規則更為嚴格的保護壁壘。時至今日,兩扇大門相互都關上了。


人們將此舉比作科研領域的“卡脖子”,不過許多人表示,這還遠沒有到最糟糕的時刻。如果收縮進一步擴大到全球最大的生物醫學文獻數據庫PubMed、全球最大的生物樣本庫UK bioBank、全球最大的公開核酸序列數據庫GenBank、全球高通量基因表達數據的權威存儲平臺GEO等傳統的“基礎設施”, 科學家們將面臨不得不集體“搬家”,只是很有可能沒有“新家”供他們選擇。


對中國的限制是大趨勢?


訪問渠道關閉后影響幾何,學術界的看法不盡相同。前述生物信息學教授表示,“受控的主要是關于人類基因組信息,大部分生物醫學研究都會受影響,不論是生命科學的基礎研究、生物信息挖掘還是藥物開發、疫苗研發等”。


王亞力 (化名) 是國內一生物醫學大數據中心主任,他表示,“此次政策調整對于大部分科學研究和臨床研究不會產生直接沖擊。 受影響的集中于基因組學、癌癥、遺傳學等前沿領域, 比如腫瘤基因組學研究、疾病相關的全基因組關聯分析研究等,體現在數據獲取渠道受限、研究連續性中斷以及國際合作受阻等方面,對研究深度和廣度都會造成一定制約”。


然而,不論觀點如何,大家都表達了同一種憂慮,也包括一些不受此次政策影響的研究者。“ 個人基因組信息現在敏感度越來越高了, 對中國有限制是大趨勢。任何能追溯到個人的信息,美國從國家安全角度,歐洲從隱私保護角度,都會采取更多針對中國接觸的限制,這個趨勢不會變了”,?阿拉巴馬大學伯明翰分校遺傳學博士周葉斌介紹道。


最為緊張的是UK bioBank的用戶。這項于2006年由英國發起的,收集了約50萬名參與者的遺傳、影像、健康及生活方式數據的生物樣本庫,相比于dbGaP和TCGA擁有更多的用戶和更廣泛的影響力。截止2024年9月,全球超過90個國家/地區的19000名研究者使用其數據,發表了超過13000篇出版物,也包括了大量中國研究者。


去年7月, UK Biobank Community宣布不再提供原始數據,而是要求研究者云端進行分析。 這被視為降低數據泄露和濫用風險的舉措,但也有業內人士提到,其中還涉及數據下載不便和營收的考量。


有替代之法嗎?


沒有了研究數據,研究者們的解決方式無外乎兩類,但都不可避免地被掣肘。


上海科技大學生命學院助理教授張力燁解釋道,“第一可以去聯系數據所有者本人,請求其共享,好處是不存在任何法律風險,但可能得通過一些私人渠道或者關系非常好。另一重困難在于,如果涉及到數據量非常龐大,例如PB級別,大量數據點對點傳輸和獲取并不容易。第二,即便非常幸運在禁令之前保存了數據,但在發表文章中也不能公開使用,因為涉及到數據使用權限的問題”。


遺憾的是, 目前國內能夠實現完全替代的數據集并不存在。


前述生物信息學教授表示,“本次受限的數據庫收錄的數據大都是NIH資助項目產出的, 數據標準化做得非常好,數據集質量都比較高。 國內收上來的數據,很多都缺乏統一的數據標準,質量也參差不齊。另一方面,國內數據庫擁有的數據量相對還是較少,大家愿意貢獻出來的數據不多”。


在“數據脫鉤”的態勢下,過去幾年,國內各類基因組數據庫一直在嘗試建立NIH下屬美國國家生物技術信息中心 (National Center for Biotechnology Information, NCBI) 公開數據的鏡像和本地備份,以備不時之需。以國家基因組科學數據中心 (NGDC) 為例,其已備份了十余個NCBI數據庫。


但問題依舊沒有得到解決,一旦禁令嚴格執行,這些數據也 “面臨公開使用違法了,國際論文發表會受影響的局面,敏感人物出國會有風險” ,王亞力表示。


前述生物信息學教授則表示該種情形出現的可能性不大,他介紹道,NCBI早在2005年便與歐洲生物信息學研究所 (European Bioinformatics Institute, EBI) 和日本DNA數據庫 (DNA Data Bank of Japan, DDBJ) 達成協議,建立了國際核酸序列數據庫合作聯盟 (International Nucleotide Sequence Database Collaboration, INSDC) ,每天交換更新數據和信息,涵蓋測序原始數據、組裝序列和注釋信息、以及相關的元信息,促進生物信息大數據匯交共享。


但凡這三家共享的信息都不應當受到控制和關閉, 并且INSDC也是希望在全球建立多個鏡像,方便世界各地的研究人員獲取并使用他們的數據”。


本土數據庫公開之難


雖然NIH數據禁令屬有限制措施,但其象征意義與潛在影響值得警惕。


王亞力解釋道,“ 該事件表現了國際科研合作壁壘愈發實體化, 全球生物醫學領域正經歷從‘數據國際共享’到‘數據主權化’的重大轉變,關鍵技術‘卡脖子’風險顯性化。我國亟需構建系統性應對方案,以應對潛在的全面數據封鎖風險”。


二十年前,一些有識之士就開始呼吁建立本土數據庫, 但開放氛圍的缺失難倒了各位英雄好漢。“國內真正愿意分享自己數據的研究人員比例大概不會超過20%”, 前述生物信息學教授表示。


行政命令是國內數據公開的重要推手,科技部“重點研發計劃”明確要求上傳數據庫,基金委等部分項目也在試點中。但上有政策下有對策,效果并不理想,數據交成什么樣,交到哪里完全能糊弄過去。


2022年,《知識分子》曾報道科技部重點研發計劃“精準醫學專項”隊列研究時,一位專家提到,“20個國家科學數據中心,立項時并沒有規定交到其中哪一個,所以理論上 (精準醫學專項的數據) 交到比如地震數據中心或者氣象數據中心都是可以的,盡管這聽起來有些不可思議。”


另一方面,即使將數據完整上傳至數據庫, 能否使用依舊要看上傳者的“臉色”。 ?張力燁介紹道,NCBI人類遺傳相關數據庫dbGap有一個專門的委員會,由第三方來管理數據是否能夠共享給申請者,這提升了用戶的體驗。


而國內以及歐洲類似數據庫 (ENA) 的數據權限則直接由上傳者審核的方式,一些人可能因為潛在的競爭關系而拒絕提供或者拖延,此外也不排除部分數據管理人沒有足夠重視導致的忘記審核,以及由于一些技術原因 (如數據審核人離職電子郵箱作廢) 導致審核拖延和無法進行。因此,基于數據提交者審核系統整體獲得數據難度往往要高于dbGap數據評審委員會。


瀏覽國家生物信息中心的網站會發現,滿分五顆星,3806組數據中,共享率達到四星及以上的數據僅6.1%。


數據共享率低是國內數據庫建設長期以來都面臨的困難。“現在各個地方都號稱自己有數據庫,大家都號稱自己公開,但其實都不公開, 也不是有什么限制,主要就是不想 ”,一位遺傳學教授介紹道,“就算在機構內部,共享也很難實現。假如一個科室很大,每個老師都有一個自己的小隊列,但彼此都沒有辦法拿到。國外現在都是幾十萬的隊列,我們還在一兩萬的隊列在做”。


假共享、真封閉、數據庫閑置、零散瑣碎……解決數據依賴必須要跨過“公開共享”這道鴻溝。


“這些年國內也做了很多人群隊列研究,產出了不少序列,但大多分散在各個單位、各個醫院,如果能把這些統籌好了,我想也不會比國外差很多”,前述生物信息學教授表示,“好多人擔心把自己的數據公開了,別人分析能力特別強,發了文章搶了他的東西,等于他就白辛苦了。他干了這么多,把寶貴的病人樣本資源聚集起來,花了錢測了序,結果什么也沒得到,他們考慮的也不是完全沒有道理。所以從這個角度來講, 我們怎么能夠建立一些激勵機制,給數據貢獻者一些甜頭或好處? 但是這里的利益分配也牽扯很多事情,不是簡單能解決的”。


“國外人家想的就是,我拿了NIH的錢,數據共享是天經地義,不會打一些小九九,非得我自己分析。他們的想法就是讓大家都能把數據用起來,這是價值所在,而不見得一定要發文章。 但國內目前的各種考核評價體系還是看重文章,這種指揮棒下,觀念很難改變 ”。


在中美科技競爭持續深化的背景下,下一步國內數據庫該如何建設?前述生物信息學教授表示,“一方面把大家的數據整合起來,不要散落在各地。另一方面數據收起來以后也要開放共享。如果把這兩個做好,短期內就能解決一部分的問題,不能說很大程度上,但至少能解決一部分問題了”。


本文來自微信公眾號: 知識分子 ,作者:嚴勝男

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 中国女人和老外的毛片 | 99视频在线播放 | 日日操日日射 | 青娱乐91视频 | 久久久久久久蜜桃 | 日韩成人免费在线视频 | 日本永久视频 | 亚洲一区二区三区在线免费观看 | 欧美精品亚洲一区二区在线播放 | 欧美一级欧美三级 | 精品日产一区二区 | 中文字幕在线观看亚洲 | 九九热视频免费在线观看 | 久久久精品久久视频只有精品 | 好吊妞乱淫欧美 | 在线观看日本一区 | 亚欧成人在线 | 新久草在线 | 欧美成a | 国产亚洲综合久久 | 久久国产一久久高清 | 九九啪| 色综合天天综合网国产成人网 | 日日操美女 | 日本中文字幕一区二区有码在线 | 亚洲国产精品日韩高清秒播 | 一级特黄aaa大片大全 | 欧美日韩性猛交xxxxx免费看 | 免费一级毛片麻豆精品 | 夜色私人影院永久地址入口 | 国产精品一区二区四区 | 欧美成人性做爰网站免费 | 久久在线免费 | 久99久视频 | 久久最近最新中文字幕大全 | 四虎国产精品永久地址99新强 | 成人亚洲视频 | 日本黄页网址 | 伊人久久综合视频 | 日韩中文字幕精品免费一区 | 曰本女人视频69xxx |