单细胞数据分析内部最基础的即是降维聚类分群,参考前边的例子:东谈主东谈主齐能学会的单细胞聚类分群扫视 ,这个环球基本上问题不大了,使用seurat程序经由即可,不外它默许出图并不颜面,详见往时咱们作念的投票:可视化单细胞亚群的象征基因的5个武艺,底下的5个基础函数确信环球齐是照旧烂熟于心了:
VlnPlot(pbmc, features = c("MS4A1", "CD79A"))FeaturePlot(pbmc, features = c("MS4A1", "CD79A"))RidgePlot(pbmc, features = c("MS4A1", "CD79A"), ncol = 1)DotPlot(pbmc, features = unique(features)) + RotatedAxis()DoHeatmap(subset(pbmc, downsample = 100), features = features, size = 3)上几期的推文给环球分享了我对于用热图可视化及好意思化marker基因的本色
Doheatmap常用参数及好意思化使用Complexheatmap好意思化热图Scillus包好意思化热图接下来一齐来了解一下Dotplot可视化Marker基因吧。
Dotplot放胆图解析在进行细胞亚群扫视的技巧,不错使用Dotplot可视化网罗整理的基因集,来赞助咱们进行细胞亚群的判断
图片
(PS : 不错看到咱们网罗整理的基因的特异性齐十分好,绝大部分齐有单细胞亚群的排他性 ,比如9群是CPA3代表的mast细胞,它在mast亚群内部的险些是百分百抒发,然而在其他亚群齐是不抒发!)
要是讲理单个基因的话,也不错只查察单个基因在不同亚群的抒发情况,在单细胞水平看指定基因的抒发量互异情况分享的著述中就有对某个基因进行可视化展示
DotPlot(sce.all.int, features = c("MTIF2"), group.by = "celltype") 图片
(PS ; 因为MTIF2这个基因并不是已知的各个单细胞亚群特征基因,是以不错看到它很难有排他性,并且它即使是在肝细胞内部也即是30%的抒发比例,只不外是肉眼看起来大概是跟前边的百分比相同的成果,是以环球务必属目图例!)
Dotplot放胆图上会展示出来Average Expressed以及Percent Expressed,及基因的平均抒发量(点的神色)以及抒发的百分比(点的大小)
通过将绘图放胆保存为一个变量,不错看到内部的保存的用于绘制的数值
p = DotPlot(sce.all.int, features = c("MTIF2"), group.by = "celltype") View(p)图片
其中data数据中就包含了Average Expressed、Percent Expressed以及Average Expressed scaled
图片
在推文务为有补于世 | 单细胞之DotPlot的抒发量哪来的?整理了平均抒发量Average Expressed的野心武艺
图片
1. 苟简尝试野心平均抒发量-Average Expressed:查察B细胞亚群内部MTIF2基因的平均抒发量
取出B细胞亚群,得到B细胞亚群内部MTIF2基因原始抒发矩阵,野心平均抒发量
#average expressedsce.B = sce.all.int[, sce.all.int$celltype %in% c( 'Bcell')]gene_expression <- sce.B[["RNA"]]$counts["MTIF2", ]# 野心平均抒发量,忽略NA值average_expression <- mean(gene_expression/sce.B$nCount_RNA*10000, na.rm = TRUE)
图片
图片
2. 野心基因在不同亚群内部的抒发百分比Percent Expressed
统计并整理基因在不同细胞亚群的抒发与否情况,然后野心抒发数目占全部细胞亚群数目的百分比
#pct.express野心形势MTIF2 = sce.all.int@assays$RNA$data["MTIF2",]>0t(table(MTIF2,sce.all.int$celltype))data <- data.frame( CellType = c("Bcell", "cycle", "endothelial", "epithelial", "hepatocytes", "macrophages", "mast", "myeloids", "myofibroblasts", "Tcell"), MTIF2_FALSE = c(3053, 1810, 3609, 1975, 6294, 5509, 186, 10335, 1131, 7414), MTIF2_TRUE = c(355, 411, 448, 446, 3040, 1154, 7, 1370, 144, 503))# 野心每个细胞亚群中总细胞数data$TotalCells <- data$MTIF2_FALSE + data$MTIF2_TRUE# 野心每个细胞亚群中MTIF2的抒发占比,并添加到data表格中data$PercentExpressed <- (data$MTIF2_TRUE / data$TotalCells)*100图片
图片
在绘制展示的labels中,x轴是咱们遴荐展示的基因,y轴identity是细胞亚群,点的大小是由pct.exp决定的,神色是由avg.exp.scaled决定的
图片
对于avg.exp.scaled的野心莫得去尝试,环球感敬爱的不错看一下Dotplot函数的具体野心形势
图片
Dotplot常用参数图片
除了输入数据(object)、基因集(features)以及分组信息(group.by)和分割参数(split.by)这些常用参数外,还有一些和点的神色大小以及scale限度关系的参数
点的神色及缩放大小cols: 绘图神色——不错是RColorBrewer包中的调色板称呼,也不错是自界说的渐变的两种神色,或者是界说多个渐变的三种以上神色(要是成立了split.by)。
col.min: 缩放后平均抒发的神色最小阈值。
col.max: 缩放后平均抒发的神色最大阈值。
图片
dot.min: 绘制最小点的细胞分数(默许为0),总共抒发给定基因的细胞组少于此分数的将不绘制点。dot.scale: 气泡大小的缩放比例,雷同于cex参数,默许是6,不错通过这个参数退换各个气泡大小之间互异进程图片
scale: 细目数据是否缩放,TRUE为默许。scale.by: 通过'size'或'radius'两种形势缩放点的大小,默许为"radius"。scale.min: 成立缩放的下限,使用NA为默许值。scale.max: 成立缩放的上限,使用NA为默许值。使用默许参数绘图具体绘图及好意思化照旧使用pbmc-3k的扫视分群后的示例数据,使用FindAllMarkers查找并得到top5的Marker基因进行可视化
#top5 marker基因得到pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25, verbose = FALSE)top5 = pbmc.markers %>% group_by(cluster) %>% top_n(n = 5, wt = avg_log2FC)g = unique(top5$gene)
不错先望望径直使用默许参数,不退换展示的情况
DotPlot(pbmc, features = g)
图片
不错看到features展示列全部挤在了一齐,未便于阅读。是以不错对秉承参数歪斜展示基因,或者将基因和细胞亚群疏导位置
1. 退换features的胪列角度
DotPlot(pbmc, features = g) + RotatedAxis()
图片
2.将features和identity疏导位置
DotPlot(pbmc, features = g) + coord_flip()+ RotatedAxis()
图片
小结这期苟简了解了一下Dotplot展示的Average Expressed以及Percent Expressed野心形势,以及Dotplot常用参数
终末苟简的使用默许参数展示了top5的marker基因,使用参数歪斜展示基因,或者将基因和细胞亚群疏导位置对放胆图进行苟简的诊治
Dotplot可退换的点还有许多,下期一齐来了解一下基于Dotplot函数可视化的好意思化(以及它的多种变形操作,比如底下的图E就不错径直使用上头的dotplot函数的数据 )
图片
文末友情宣传要是你也思作念单细胞转录组数据分析,最佳是有我方的野神思资源哦,比如咱们的2024的分享工作器交个一又友福利价仍然是800,并且还需要有基本的生物信息学基础,也不错望望咱们的生物信息学马拉松讲课,你的生物信息学初学课。
本站仅提供存储工作,总共本色均由用户发布,如发现存害或侵权本色,请点击举报。