扩增子测序与宏基因组测序的区别?
扩增子测序是针对微生物核糖体小亚基的特定高变区或功能基因区域进行PCR扩增,反映物种的进化关系及群落多样性。该技术物美价廉,实用性高。宏基因组测序测定整个环境中所有微生物的基因组。在数据分析上又可以分为基因集分析和基因组组装。基因集分析可以进行功能分析GO pathway,关注环境样本中的物种组成、功能组成及代谢通路等信息;基因组组装可以获得新的,甚至是不可纯培养的微生物基因组序列。
宏基因组测序对样品的生物学重复有什么要求?如何避免重复性较差的问题出现?
土壤、水体等生态环境样本建议5个或5个以上的生物学重复;取样时每个样品均需多点取样后混匀,降低单个样本特异性。人和动物样本因个体特异性较大,建议10个以上生物学重复;肠道、瘤胃或粪便样本因含有较多厌氧菌,要快速取样、迅速低温保存,针对较难富集微生物的样品,如各种物体表面,可采用缓冲液洗脱或棉签擦拭等方法。样品取好后避免长时间放置,需尽快进行DNA提取,送样测序。
对于宏基因组项目,怎么排除宿主污染?
取样时,尽量不要取靠近组织的部位;提取的时候采用相应的试剂盒;若有参考基因组,可通过比对分析去除宿主基因组污染。
宏基因组Miseq平台和Hiseq 2000平台上每个样品分别推荐多少G数据量比较合适,这两个平台做宏基因组de novo测序,各自优势在哪里?
如果宏基因组de novo测序项目使用较多的平台是Illumina HiSeq 2000(2*100bp),一般单个样本的测序数据量为8G左右。相比Illumina Miseq,HiSeq 2000测序质量更好,数据更准确可靠,因此如果需要对宏基因组de novo进行拼接,Illumina HiSeq 2000更合适。
为什么进行混合组装?
首先,根据单样品多k-mer进行组装,选取最适Scaffolds,将质控后的Clean data比对至各样品Scaftigs,获取各样品未被利用的PE reads混合后组装。这样既充分利用数据,又能挖掘低丰度物种信息。
KEGG 能注释哪些基因?
对所有我们拼接出的基因进行注释,默认提供C、N、P、S这四个循环的KEGG通路图,也可以指定自己关注的部分。