美格基因|病毒数据库2024年全新升级!
发布时间:
2024-01-19
宏病毒组是应用特殊方法把特定环境中所有病毒与其他微生物分开,然后提取的病毒核酸,用高通量技术进行病毒核酸测序,最后将测序结果与现有的核酸文库进行比对,并运用软件分析处理后最终得到研究样品中病毒群落的组成信息。作为美格基因的王牌产品,宏病毒组自2019年3月上线至今已经顺利开展了上千个项目,辅助客户发表的宏病毒组相关文献的影响因子累计已超过300!而美格基因持续对宏病毒组产品进行迭代更新,目前基于病毒数据库V3.0版本(点击查看:美格基因·产品升级|宏病毒组数据库全面再升级!),按照严格的标准纳入更多公共数据库和高分前沿文章的病毒基因序列,整合成最新的美格基因病毒数据库V4.0!
美格基因病毒数据库V4.0新增序列源自于:1)从LucaProt软件自带的从各类资源中鉴定到的RNA病毒序列;2)来源于ICTV官网Virus Metadata Resource;3)收录自2023年04月10日~2023年09月15日新增的病毒序列。通过对待收录的病毒基因序列数据进行清洗、聚类和去冗余后,最终病毒数据库V4.0的收录量达到了347,207条病毒基因序列,相比于V3.0版本(病毒基因序列收录为226,417条)实现了收录数量大幅度提高!

图1. 病毒数据库V4.0版数据来源
注:
(1)MagiVirusDB-v4.0:美格基因病毒数据库v4.0版;
(2)LucaProt:LucaProt软件自带的从各类资源中鉴定到的RNA病毒序列(https://github.com/alibaba/LucaProt);
(3)ICTV VMR_MSL38_v2:来源于ICTV官网Virus Metadata Resource(VMR: Virus exemplars for every species);
(4)NCBI GenBank:收录2023.04.10~2023.09.15新增的病毒序列。
美格基因病毒数据库
从V3.0版本升级优化到V4.0版本
实现了收录数量、质量和多样性三方面的提升!
接下来就一起揭开
美格基因病毒数据库V4.0的神秘面纱!
01本次数据库更新亮点
(1)加入由LucaProt软件自带的鉴定出的RNA病毒序列。
(2)加入由ICTV官方认证的各物种代表序列。
(3)加入NCBI GenBank库新增的病毒序列。
(4)病毒序列的物种鉴定采用ICTV(2022.v3)最新发布的病毒分类信息。
注:新增序列主要为RNA病毒序列。
02 V4.0数据库总体特征
面对越来越高的病毒鉴定要求,美格基因病毒数据库V4.0采取一贯的严格收录标准,对应的N50达到了48,019bp,病毒基因序列最长达到2,473,870 bp,统计还包含了多节段RNA病毒的segment,以及类病毒序列。
表1. 基本特征

注:统计包含多节段RNA病毒的segment,以及类病毒序列。

图2. 病毒序列长度分布图(包含分节段的RNA病毒序列)
相比于V3.0版本,美格基因病毒数据库V4.0在RNA病毒和非噬菌体病毒上的收录数量有大幅度提高,丰富了V4.0版本的收录多样性。
表2. 核酸类型统计

表3. 噬菌体统计

03 DNA宏病毒组项目测试结果
选取了土壤、海水、人类粪便和小鼠粪便4种项目的数据,使用v3版和v4版病毒数据库分别分析,两者结果高度一致。
表4. DNA宏病毒组项目测试比对分数


图3. DNA宏病毒组项目测试比对分数箱线图
04 RNA宏病毒组项目测试结果
选取了垃圾渗滤液、蜱虫、候鸟粪便和海水养殖场4种项目的数据,使用v3版和v4版病毒数据库分别分析,性能提升明显。
表5. RNA宏病毒组项目测试比对分数


图4. RNA宏病毒组项目测试比对分数箱线图
各位对美格基因病毒相关产品感兴趣的客户
快通过以下方式联系您身边的美格基因销售同事
获取第一手咨询!
点击下方获取销售经理联系方式
更多新闻
美格基因
美格科服
联系我们
地址:广东深圳国际创新谷三期7栋B座13层
地址:广州国际生物岛官洲生命科学中心A栋第28层
地址:广州佳德科技园B栋3层
Copyright © 2023 广东美格基因科技有限公司

