多种单细胞RNA测序方法的快速发展,为科学家们建立大规模单细胞RNA图谱的工作提供了强大的助力。当然,多种单细胞RNA测序方法之间,还需要经过系统和全面的基准测序。
Broad研究所的Joshua Levin团队,专门对7种单细胞RNA测序方法进行了系统的比较,为科学家们了解每种方法的优点和局限性提供了严谨的参考数据。
01
参与比较的7种测序方法
1、Smart-seq2
微孔板;低通量
2、CEL-Seq2
微孔板;低通量
3、sci-RNA-seq
微孔板的组合,标识细胞;高通量
4、10x Chromium
微流控产生,油包水,带 barcode 微珠;高通量
5、Drop-seq
微流控产生,油包水,带 barcode 微珠;高通量
6、Seq-Well
微孔芯片,带 barcode 微珠;高通量
7、inDrops
微流控产生,油包水,带 barcode 微珠;高通量
02 实验样品的种类及实验设计
<实验样品>
1、样品类型一:
把人的HEK293培养细胞、和小鼠的NIGH3T3培养细胞,进行等比例混合,把混合细胞作为检测样本。
之所以用两个物种的混合细胞,是想检测一个细胞Barcode中混有多个细胞的情况,以及单个细胞中混有别的细胞的RNA的情况。
2、样品类型二:
人的外周血单核细胞,也就是PBMC细胞。
因为外周血中的细胞天然是分离的,细胞与细胞之间没有粘连,这可以排除用组织样本做实验时,会引入的细胞消化的问题。
3、样品类型三:
小鼠的脑皮层的细胞核。
一方面是想看一下各种检测方法对细胞核的检测效果,因为小鼠的脑皮层的细胞核样本,已经被广泛鉴定过,有好的学术研究背景;另一方面,是因为小鼠的脑皮层的细胞中有许多是长条形的,也有星型的、多角型的形状的,所以用圆球形的细胞核,来代替形状各异的细胞做单细胞实验,是一种较为方便的方法。
03 对比的关键指标 在一个实验中心的六个独立实验室中生成了36个文库进行测,开发统一的计算管道,并消除了各种方法之间各自计算通道之间引入的处理差异,把多种scRNA-seq方法进行统一分析。
<统一的计算管道>
作者通过几个关键指标来评估这7种方法:
1.reads比对到基因组的结构,有多少是比对到外显子的,有多少是比对到内含子的,有多少是比对到基因间的位置的以及其它的序列。
<分别是:混合细胞、PBMC细胞、脑皮层的细胞核> 结果:在混合细胞样本的实验中,Smart-Seq2 的两个重复实验,和 inDrops 的一个实验,得到了比例最高的外显子 reads,这三个的外显子 reads 数达到 50% 以上。而 sci-RNA-seq 表现最差,外显子的比例是 28.7% 和 29.4%。 与混合细胞样本相比,PBMC 的外显子比例较低,只有 inDrops 的一个实验达到了 46%。 脑皮层的细胞核的样本,得到的 reads 中,内含子相对于外显子的比例,要更高。这和作者的预期是一致的。因为细胞核中包含了更多的没有经过剪切的转录本。 2、捕捉RNA分子的敏感性,也就是从一个细胞中能捕捉到多少个UMI,和多少种基因。 <6种方法每个细胞中UMI的数量统计> 总体来看,因为 Smart-seq2 方法本身没有 UMI,所以这张图里面没有 Smart-seq2 的结果。我们看这张图,CEL-Seq2 方法,因为输入的细胞数少,所以每个细胞得到的 UMI 数量明显多于其它几种方法。在剩下的 5 种高通量方法中,10x Chromium 的方法,得到的每个细胞的 UMI 数量是最多的。 <混合样品中各种方法检测到的每个细胞中UMI的数量> 混合样品中:Smar-seq2 和 CEL-seq2 这两个低通量的方法检测到的每个细胞中的基因数最多。剩下的 5 种方法中10x Chromium 方法得到的基因数量最多。Indrops 和 Drop-seq 方法得到的基因数量最少。 <左图:PBMC单个细胞的UMI数量分布 右图:PBMC个细胞基因数量分布> PBMC细胞中的结果:和前面混合细胞的情况是差不多的。低通量的办法,每个细胞可以测到更多的 UMI 数量和更多的基因数量。在高通量的办法中,10x Chromium 的方法可以测到更多的 UMI 数量和更多的基因数量。 小鼠脑皮质细胞核中的结果:低通量Smart-seq2每个细胞检测到了最多的基因数量。高通量10x chromium得到了最多的UMI数量和最多的基因数量。 <相同测序深度每个细胞中检测到的基因数量> <每个细胞中测到的 UMI 数量与测到的基因数量的关系> 各个方法,在每个细胞取相同的测序深度下,每个细胞中能够检测到的基因数量进行比较。左边的两张图是两个低通量方法的结果,两个低通量方法的结果差别不太大,右边的两张图是高通量方法的结果。在高通量方法中,10x Chromium 的方法,在相同的测序深度条件下,可以测到更多的基因。且每个细胞中测到的UMI数量与测到的基因数量有线性关系。 3.混合细胞样本的实验中一个细胞Barcode对应到多细胞的出现比例 <混合细胞> 混合细胞中的结果:通过检测一个细胞 barcode 中,是否包含两个物种的序列,来判断多细胞的情况。所有的检测结果,多细胞的比例都低于 3.5%,除了一个 inDrops 的实验结果是 8.0%。 4、估计基因表达方面的技术精度、和重现性。 <混合样品中重现性> CEL-Seq2、inDrops 和 Drop-seq 始终具有相对较低的超出泊松分布之外的变异系数。三种方法的实验结果可重复性较高。Smart-seq2实验结果可重复性较低。 5、在对细胞进行聚类,找出各种细胞类型的能力。 在 scRNA-seq 研究的众多生物学特征中,最突出的实用例子之一,就是通过聚类 scRNA-seq 来识别不同的细胞类型。 <PBMC t-SNE图> PBMC细胞中的结果:10x Chromium 和 inDrops 的表现良好。通常,大多数方法成功地找出了 PBMC 中丰富的细胞类型。但是,对于稀有的细胞类型,如浆细胞样树突细胞、和血小板,这些细胞在不同的方法中,以不同的比例被捕获。 <小鼠皮层t-SNE图> 小鼠皮层细胞中的结果:也具有明确定义的多种细胞类型。3 种方法找到了要找的各种细胞类型。而 sci-RNA-seq 这个方法,没有找到全部的细胞类型。 04 对比结论 1、低通量的两个方法,有更好的检测敏感度,在每个细胞中找到了更多的基因。 2、在5个高通量的方法中,10x Chromium是检测敏感度最高的方法,并且有最高的找出各种细胞类型的能力。 3、在所有的方法中,因为10x Chromium是经过商业化包装的,所以易用性最好。
下一篇:没有了!