咱公眾號也不能只做一個(gè)系列,所以經(jīng)過深思熟慮,打算將來慢慢增加一些內(nèi)容,主要有以下幾個(gè)系列
TCGA數(shù)據(jù)分析系列
GEO數(shù)據(jù)分析系列
"老板給一個(gè)基因,我該怎么辦"系列
文獻(xiàn)閱讀系列
R語言學(xué)習(xí)系列
Python學(xué)習(xí)系列
前段時(shí)間我們更新過一篇推文
熱圖系列1,隸屬R語言學(xué)習(xí)系列,今天我們繼續(xù)熱圖系列2
導(dǎo)入數(shù)據(jù)
library(pheatmap)TEST=read.csv("TEST.csv",sep = ',',header = T,row.names=1)繪制默認(rèn)熱圖
pheatmap(TEST)
歸一化
我們的示例數(shù)據(jù)基因差異很明顯,而且沒有離群值,當(dāng)有一個(gè)極大值的時(shí)候,就不會(huì)有這樣的效果,比如
TEST1=TESTTEST1[1,20]<-1000pheatmap(TEST1)
這樣完全看不出差異了,所以這個(gè)時(shí)候需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化
#scale = "row"參數(shù)對行進(jìn)行歸一化#clustering_method參數(shù)設(shè)定不同聚類方法,默認(rèn)為"complete",可以設(shè)定為#'ward', 'ward.D', 'ward.D2', 'single', 'complete', 'average', 'mcquitty', 'median' or 'centroid'pheatmap(TEST1,scale = "row")#按照行進(jìn)行均一化
這樣就可以看清基因表達(dá)之間的差異了
聚類
pheatmap(TEST1,scale = "row",clustering_distance_rows = "correlation")#表示行聚類使用皮爾森相關(guān)系數(shù)聚類,默認(rèn)為歐氏距離"euclidean"
#可以對行,列聚類,cluster_row行 ,cluster_col列pheatmap(TEST,scale = "row",cluster_row=T,cluster_col=T)
設(shè)定cell 的大小
pheatmap(TEST, cellwidth = 10, cellheight = 5, fontsize = 10)#寬10,長5,字體大小10
設(shè)定 text
#display_numbers = TRUE參數(shù)設(shè)定在每個(gè)熱圖格子中顯示相應(yīng)的數(shù)值,#number_color參數(shù)設(shè)置數(shù)值字體的顏色,#fontsize_number設(shè)置數(shù)字的大小pheatmap(TEST, display_numbers = TRUE,number_color = "black",fontsize_number=6)
#設(shè)定展示條件pheatmap(TEST, display_numbers = matrix(ifelse(TEST > 6, "*", ""), nrow(test)))#圖8#展示大于6的為*
設(shè)置 legend
#legend_breaks參數(shù)設(shè)定圖例顯示范圍,legend_labels參數(shù)添加圖例標(biāo)簽pheatmap(TEST, legend_breaks = -3:3)
#也可以去掉legendpheatmap(TEST, legend= F)
設(shè)定 color
#自定義顏色 colorRampPalette pheatmap(TEST, color = colorRampPalette(c("navy", "white", "firebrick3"))(100))
每一種顏色在R里面都有代碼,如下圖,我們可以不斷的嘗試直到畫出自己滿意的
顏色代碼網(wǎng)址:https://www.114la.com/other/rgb.htm
設(shè)置邊框
# border_color參數(shù)設(shè)定每個(gè)熱圖格子的邊框色# border=TRIUE/FALSE參數(shù)是否要邊框線pheatmap(TEST, border=FALSE)#不要邊框
設(shè)置注釋
#生成列的注釋colnames(TEST)annotation_col= data.frame(Type=factor(c(rep('cancer',10),rep('normal',10))))rownames(annotation_col) =colnames(TEST)#畫圖pheatmap(TEST, annotation_col = annotation_col)
設(shè)定gap
pheatmap(TEST,scale = "row", annotation_col = annotation_col,gaps_row = 25,cluster_rows = FALSE)
pheatmap(TEST,scale = "row", annotation_col = annotation_col,gaps_col = 10,cluster_cols = FALSE)
pheatmap(TEST,scale = "row", annotation_col = annotation_col,gaps_col = 10,cluster_cols = FALSE,gaps_row = 25,cluster_rows = FALSE)
展示行或者列的label
labels_row = c("gene1", "", "", "","", "", "", "","", "", "", "", "","", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "","", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "gene50")pheatmap(TEST, annotation_col = annotation_col, labels_row = labels_row,cluster_rows = FALSE)
自己又只做了一個(gè)數(shù)據(jù),得到下面的圖
library(pheatmap)TEST=read.csv("中國加油.csv",sep = ',',header = T,row.names=1)pheatmap(TEST,cluster_cols=F,cluster_rows=F,show_colnames=F,show_rownames=F,legend = F)
下面是pheatmap包常見的函數(shù)
color表示顏色,賦值漸變顏色調(diào)色板colorRampPalette屬性
kmeans_k繪制熱圖的行聚類數(shù),如果是NA,那么行不會(huì)聚類
scale表示值均一化的方向,或者按照行或列,或者沒有,值可以是"row", “column” 或者"none"
cluster_rows表示進(jìn)行行的聚類,值可以是FALSE或TRUE
cluster_cols表示進(jìn)行列的聚類,值可以是FALSE或TRUE
clustering_method表示聚類方法,值可以是hclust的任何一種,如"ward.D",“single”, “complete”, “average”, “mcquitty”, “median”, “centroid”, “ward.D2”
border_color表示熱圖上單元格邊框的顏色,如果不繪制邊框,則使用NA
cellwidth表示每個(gè)單元格的寬度,若選擇NA則表示適應(yīng)窗口
cellheight表示每個(gè)單元格的高度,若選擇NA則表示適應(yīng)窗口
cutree_rows
基于層次聚類(使用cutree)劃分行的簇?cái)?shù)(如果未聚集行,則忽略參數(shù))
cutree_cols基于層次聚類(使用cutree)劃分列的簇?cái)?shù)(如果未聚集行,則忽略參數(shù))
treeheight_row行的樹的高度,
treeheight_col列的樹的高度
legendTRUE或者FALSE,表示是否顯示圖例
legend_breaks設(shè)置圖例的斷點(diǎn)
legend_labelslegend_breaks對應(yīng)的標(biāo)簽例
annotation_row行的分組信息
annotation_col列的分組信息
annotation_colors用于手動(dòng)指定annotation_row和annotation_col track顏色的列表
annotation_legend
是否顯示圖例的名稱
annotation_names_row
是否顯示行注釋的名稱
annotation_names_col是否顯示列注釋的名稱
show_rownames是否顯示行名
show_colnames是否顯示列名
main圖的名字
fontsize圖的字體大小
fontsize_row行名的字體大小,默認(rèn)與圖的字體大小相同
fontsize_col列名的字體大小,默認(rèn)與圖的字體大小相同
angle_col列標(biāo)簽的角度,可選擇 (0, 45, 90, 270 and 315)
display_numbers表示是否將數(shù)值顯示在熱圖的格子中
number_format設(shè)置顯示數(shù)值的格式,較常用的有"%.2f"(保留小數(shù)點(diǎn)后兩位),"%.1e"(科學(xué)計(jì)數(shù)法顯示,保留小數(shù)點(diǎn)后一位)
number_color設(shè)置顯示內(nèi)容的顏色
fontsize_number設(shè)置顯示內(nèi)容的字體大小
labels_row代替行名的自定義標(biāo)簽
labels_col代替列名的自定義標(biāo)簽
na_col缺失值的顏色