010-51503294/51503293
科研进展
植物miRNA百科全书数据库(PmiREN)上线
日期:2020-04-28|来源:农业生物技术研究中心|浏览量:880次

由生物中心的杨效曾研究员课题组和北京大学生命科学学院李磊教授课题组共同开发的植物microRNA(miRNA)百科全书数据库于2019年5月6日正式上线。

        miRNA是一类长度多为20-22个碱基的非编码RNA,通过对靶基因的mRNA的调控,miRNA可以在转录后水平实现对基因的表达调控。之前的研究表明,miRNA广泛存在于几乎所有的物种当中,与动植物的形态建成、生长发育、激素分泌以及抗逆响应等各项生命活动紧密相关,是一类非常重要的调控因子。在作物研究领域,已经发现miRNA与很多重要的农艺性状相关,成为增加产量、抗性等农艺性状的目标基因。

        然而目前学术界并没有专业的植物miRNA数据库。普遍使用的几个miRNA数据库都存在很多问题,比如miRBase作为最为广泛使用的miRNA数据库之一存在:1)数据来源不一,大量噪音;2)数据完整性差;3)功能单一等缺陷。这些问题在一定程度上限制了miRNA的研究,比如对miRNA功能及演化的研究。基于以上原因,我们对现有已经测序的植物基因组,同时具有小RNA(sRNA)高通量测序数据的物种进行大尺度的miRNA挖掘。需要指出的是我们采用的统一的注释方法,即miRDeep-P2(miRDP2)。miRDP2是miRDeep-P的升级版本,同样由杨效曾研究员课题组和李磊教授课题组共同开发(分别于2012和2018年发表在bioinformatics杂志上),该方法在过去的几年中得到的广泛的应用(40多个植物物种的miRNA由该方法注释,2012年以来的引用次数达到了168次)。

        上线的植物miRNA百科全书数据库(PmiREN)具有以下特点:
 
I.完整的miRNA信息

        涵盖了从水生植物到被子植物88个物种,20388个miRNA loci(MIRs),5757个miRNA家族,1365条miRNA簇信息,1668条miRNA共线性信息,141327个预测靶基因。数据的完整性得到了空前的提升,如下图是与miRBase数据完整性的一个比较(选取了最为保守的30个miRNA家族)。


1-20042Q41K0928.jpg

 
II. 全面、详实、直观的信息呈现

        通过综合的数据挖掘,获得了大量与个体miRNA相关的信息,包括miRNA序列、二级结构、基因组位置信息、miRNA基因簇信息、表达信息、共线性分析结果、靶基因预测结果和PARE-seq数据验证等丰富、详实的信息,并进行了直观的呈现。如下图是大豆中miR408的表达信息和番茄中两个miRNA靶基因的PARE-seq验证数据。


 
1-20042Q34453603.png大豆miR408表达信息

1-20042Q41931a0.jpg番茄miRNA及靶基因PARE-seq验证实例
 
III.强大的搜索和方便友好的数据下载

        PmiREN提供了多种数据库检索和搜索的方式。通过物种分类信息或者快捷入口可以很快访问到用户感兴趣的物种,进一步通过层级分布可以访问到具体单个的miRNA。更为重要的是提供了8个功能强大的搜索引擎:1)全数据库关键字搜索;2)miRNA ID等关键词搜索;3)BLAST序列搜索;4)基因组位置搜索;5)miRNA簇信息搜索;6)miRNA表达信息搜索;7)共线性搜索;8)靶基因搜索。

        同时用户可以方便下载数据库中所有的数据。PmiREN提供了三种下载模式:1)FTP下载(传统的批量下载方式);2)用户自定义下载(可自定义物种、数据类型、miRNA家族等进行下载);3)模式植物miRNA gff3格式文件快捷下载入口。

 
1-20042Q4203Da.jpg数据库使用流程
 

        通过构建植物miRNA百科全书数据库(PmiREN),我们希望能够更好地服务植物miRNA研究社区,加速植物miRNA的相关研究。
 
        真诚地欢迎大家访问、使用PmiREN数据库,并期盼您对数据库的改进和进一步完善提出宝贵的意见。请通过Email: Contact@PmiREN.com联系我们。