测序数据质量及初步的聚类和降维分析.
用数据的前十个PCs重新做聚类分析和t-SNE降维展示.
PS:对比两次结果,t-SNE在二维水平上都不能完全把不同的细胞群体区分开来,形成一个大团,跟C1数据的降维结果类似,是iPS数据的正常体现。
但应注意到大团内部,不同区域细胞的特异基因有很大差异,把数据噪音考虑进去可以对细胞的异质性做更深入的探索。
比对到小鼠基因组的基因表达数据。数据质量很好,t-SNE分群明显,是否代表着不同类型的血液细胞?
比对到人基因组的基因表达数据。结果与小鼠的类似。
Align to human and mouse reference
比对到10x公司提供的小鼠和人混合reference(这个reference应该是用来评价单细胞分选能力的)。GEM(油滴)捕获到多个细胞的概率为8.8%,官方数据为8%左右。ANALYSIS中给出了散点图,灰色的点 (multiplet)代表一个GEM混合了多个细胞或多个单细胞GEM共用一个细胞barcode序列:
A multiplet represents either a GEM inferred to have encapsulated >1 cell or a barcode sequence that was shared by multiple single-cell GEMs