当前位置:首页>产品中心>三代测序>三代全长转录组测序

三代全长转录组测序

产品介绍

    三代全长转录组测序

    简介



    PacBio Sequel的长读长可实现全长转录本测序,并使基因可变剪接形式的识别成为可能,因此可以对新基因及其Iso-form进行更全面的研究。同时,长读长不再需要对RNA-SeqReads进行组装,因此可以更完整的对基因模型和转录的基因进行更全面的注释,用以改进参考基因组中的基因注释信息。


    技术流程



    1


    文库构建流程



    PacBio Sequel系统使用的全长转录组建库有SMARTer?SuperScript®两种方式。使用Clontech公司的SMARTer® PCR cDNA Synthesis Kit进行建库时,PolyA+RNA最少需要1 ng,总RNA最少需要2 ng;采用Life Technologies(旗下Invitrogen)公司的SuperScript® Full-length cDNA Library Construction Kit进行建库,建库时间至少是SMARTer?两倍,PolyA+RNA最少需要10 µg



    2

      

    相比前代RS系列测序仪,Sequel系统在SMRT Cell片段长度偏好性方面已经有很大改进,4 kb以下的建库无需进行片段大小选择。目前Sequel系统一般采用SMARTer?建库方式。经过我们对仪器和试剂的调试,也推荐效率更高的SMARTer?建库方式。当然,如果想要追求更精准的研究结果,仍可采用分段建库的方式获得更好的测序结果,其流程可参考下图:


    3


     

    一般而言,对于初步研究一个物种的转录组序列情况通常推荐三个Cell的数据量(6 G),也就是建库片段长度1 ~ 2 kb一个Cell2 ~ 3 kb一个Cell3 ~ 6 kb测一个Cell。当然也有一些高分文章测了几十个Cell,此类文章中通常是对不同组织部位或者不同时间点的组织进行测序,由此增加了测序所需的Cell数。数据量可以根据样本电泳情况调整,多倍体建议数据量加大保证数据准确性。由于3' UTR + 5' UTR长度>1 kb,所以不构建<1 kb文库。

     

    分析流程




    4


    数据分析内容



    Iso-seq分析包含4个主要的步骤,分别是CCSClassifyClusterSubset(可选)。

    5

     

    ·             CCS步骤:该步骤主要基于来自同一条Polymerase Read中的Subreads序列构建CCS序列。

    ·             Classify步骤:该步骤通过分析CCS序列,输出两个文件。一个文件包含全长非嵌合体序列(Full-length Non-chimeric Reads)和非全长序列。在该过程中,Classify步骤会去除CCS序列中包含的PolyA/T TailsPrimer序列,去除污染序列,但是会保留PCR引起的嵌合体序列。

    ·             Cluster步骤:该步骤基于全长非嵌合体序列和非全长序列,进行质量校正处理,生成Polished高质量的一致性序列和低质量一致性序列。

    ·             Subset步骤:这是一个可选步骤,主要用于从输出文件中将指定类型的序列输出出来,比如非嵌合体Reads等。

     

    转录组分析根据物种是否有已知的参考基因组和基因注释文件,分为有参转录组测序和无参转录组测序。无参转录组测序常常需要基于测序得到的Reads根据Overlap信息进行组装,得到Unigene并进行下面的分析。对于全长转录组测序来讲,根据物种是否有参,在分析策略上同意也分析有参和无参全长转录组测序。由于测序上的先进性,无参全长转录组测序分析时不用软件进行组装,只需要在进行初级质控后就可以进行注释。

     

    无参转录组




    主要包含序列特征鉴定和功能注释两大方面:

    (1)   序列特征预测包含:CDS预测、SSR预测、lncRNA预测等;

    (2)   功能注释包括:NR注释、Swissport注释、COG/KOG注释、GO注释和KEGG注释等。

    *无参转录组测序不能做可变剪接分析。

    6


    有参转录组




    对于有参全长转录组分析,因为加入了与参考序列比对,所以分析内容上相对无参转录组有很大提升。


    7