蝴蝶中文综合娱乐网2-最好看十大无码AV-成人亚洲精品久久久久软件-日产精品码2码三码四码区-51精品国自产在线-好看AV中文字幕在线观看-久久AV国产麻豆HD真实-一二三四社区在线中文视频

科研進(jìn)展
您當(dāng)前的位置 :

924日,國際學(xué)術(shù)期刊Genome Biology在線發(fā)表了中國科學(xué)院上海營養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心張國慶研究員與南方科技大學(xué)生命科學(xué)學(xué)院系統(tǒng)生物學(xué)系王澤峰講席教授團(tuán)隊(duì)的合作論文A foundation language model to decipher diverse regulation of RNAs”。該研究構(gòu)建了一種基于深度神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練模型,可微調(diào)預(yù)測(cè)pre-mRNA的剪接位點(diǎn)、mRNA的翻譯效率、mRNA的降解率和內(nèi)部核糖體進(jìn)入位點(diǎn)(Internal Ribosome Entry Site,IRES)等多個(gè)RNA調(diào)控相關(guān)的下游任務(wù),揭示了RNA中調(diào)控元件的序列特征并鑒定新型翻譯調(diào)控元件,為理解RNA調(diào)控機(jī)制和優(yōu)化RNA的生物醫(yī)學(xué)應(yīng)用提供了新工具和新思路。

在真核生物中,RNA轉(zhuǎn)錄、剪接、翻譯和降解等生物學(xué)過程受到順式調(diào)控元件、RNA結(jié)構(gòu)和反式作用因子的嚴(yán)格調(diào)控。解析RNA的多層次調(diào)控對(duì)于研究基因表達(dá)分子機(jī)制和設(shè)計(jì)RNA藥物具有重要意義。然而由于調(diào)控的復(fù)雜和數(shù)據(jù)量的不足,目前構(gòu)建RNA調(diào)控的預(yù)測(cè)模型仍然面臨挑戰(zhàn)。

為了突破上述瓶頸,研究團(tuán)隊(duì)設(shè)計(jì)并訓(xùn)練了基于多層transformer編碼器架構(gòu)的RNA語言模型LAMAR。研究首先下載處理約1500萬條哺乳動(dòng)物和病毒的基因和轉(zhuǎn)錄本序列,通過掩碼學(xué)習(xí)進(jìn)行無監(jiān)督預(yù)訓(xùn)練,預(yù)先提取RNA的序列特征之后使用含有標(biāo)簽的數(shù)據(jù)集微調(diào)模型,實(shí)現(xiàn)RNA調(diào)控高效預(yù)測(cè)。

研究測(cè)試了LAMAR模型在多個(gè)下游任務(wù)中的性能。其中,LAMAR模型在mRNA翻譯效率和降解率預(yù)測(cè)任務(wù)中分別取得0.660.65Spearman相關(guān)系數(shù)指標(biāo),相比最優(yōu)基線模型提升7%8%。另外,LAMAR模型在剪接位點(diǎn)預(yù)測(cè)任務(wù)中取得0.96PR-AUC指標(biāo),與最優(yōu)基線模型SpliceAI的性能相當(dāng)。

研究還使用公開數(shù)據(jù)集微調(diào)模型預(yù)測(cè)病毒和真核IRES,取得0.985AUROC指標(biāo)。研究進(jìn)一步預(yù)測(cè)RNA病毒基因組中潛在的新IRES,并在多個(gè)細(xì)胞系中測(cè)試其中305條序列驅(qū)動(dòng)環(huán)形RNA翻譯的效率。研究發(fā)現(xiàn)序列的預(yù)測(cè)概率與翻譯活性呈正相關(guān),提示模型模擬篩選新型調(diào)控元件的能力。

目前,LAMAR模型已上傳至Githubhttps://github.com/rnasys/LAMAR),供科研人員預(yù)測(cè)pre-mRNA的剪接位點(diǎn)、mRNA翻譯效率、降解率和IRES,或使用自己的數(shù)據(jù)集微調(diào)模型。

中國科學(xué)院上海營養(yǎng)與健康研究所張國慶研究員南方科技大學(xué)生命科學(xué)學(xué)院王澤峰教授、美國北卡羅萊納大學(xué)教堂山分校胡玥博士為論文共同通訊作者。中國科學(xué)院上海營養(yǎng)與健康研究所博士研究生周翰文、美國北卡羅萊納大學(xué)教堂山分校胡玥博士為論文共同第一作者。該研究得到了科技部國家重點(diǎn)研發(fā)計(jì)劃、國家自然科學(xué)基金、中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(B類)、上海市科技創(chuàng)新行動(dòng)計(jì)劃、上海市市級(jí)科技重大專項(xiàng)等項(xiàng)目的資助。

論文鏈接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03752-x


圖1:LAMAR模型架構(gòu)及研究流程圖:模型首先使用大量基因和轉(zhuǎn)錄本序列進(jìn)行無監(jiān)督預(yù)訓(xùn)練,再使用含有標(biāo)簽的數(shù)據(jù)集進(jìn)行微調(diào)解決RNA調(diào)控下游任務(wù)。


推送單元:生物醫(yī)學(xué)大數(shù)據(jù)中心、科技規(guī)劃與任務(wù)處

附件:
    久久精品黄色一级视频| 精品一区二三区| 国产微拍精品一区| 亚洲天堂精品视频| 在线中文字幕午夜| 婷婷综合久久之中文字幕| 国产精品久久久久久久久久电影院| 精品九九| 天天伊人狠狠久久中文av| 人妻va精品va欧美va免费| 69精品久久久日| 久久精品视频爱情电影片| 1区2区3区产品精品东南亚7| 好吊色精品| 国产精品第44页| 96久久精品欧美| 国产精品美女视频18| 91精品熟妇视频| 国产精品日韩熟女| 日韩精品一区二区三区四区视频| 九一精品国产|