从pheatmap无缝迁移至ComplexHeatmap
pheatmap是一個非常受歡迎的繪制熱圖的R包。ComplexHeatmap包即是受之啟發而來。你可以發現Heatmap()函數中很多參數都與pheatmap()相同。在pheatmap的時代(請允許我這么說),pheatmap意思是pretty heatmap,但是隨著時間推進,技術發展,各種新的數據出現,pretty is no more pretty,我們需要更加復雜和更有效率的熱圖可視化方法對龐大的數據進行快速并且有效的解讀,因此我開發并且一直維護和改進著ComplexHeatmap包。
為了使龐大并且“陳舊”的(對不起,我不應該這么說)pheatmap用戶群能夠迅速并且無痛的遷移至ComplexHeatmap,從2.5.2版本開始,我在ComplexHeatmap包中加入了一個pheatmap()函數,它涵蓋了pheatmap::pheatmap()所有的功能,也就是說,它提供了和pheatmap::pheatmap()一模一樣的參數,并且生成的熱圖的樣式也幾乎相同。同時,ComplexHeatmap::pheatmap()函數也能使用ComplexHeatmap獨有的功能,比如對行和列進行切分,加入自定義的annotation,多個熱圖和annotation的連接,或者創建一個互動的熱圖(interactive heatmap, 通過ht_shiny()函數)
ComplexHeatmap::pheatmap()包含了pheatmap::pheatmap()中所有的參數,這意味著,當你從pheatmap遷移至ComplexHeatmap時,你無需添加任何額外的步驟,你只需要載入ComplexHeatmap而不是pheatmap包,然后重新運行你原始的pheatmap代碼。剩下的你只是去見證奇跡的發生。
注意如下五個pheatmap::pheatmap()的參數在ComplexHeatmap::pheatmap()中被忽視:
kmeans_k:在pheatmap::pheatmap()中,如果這個參數被設定,輸入矩陣會進行k均值聚類,然后每個cluster使用其均值向量表示。最終的熱圖是k個均值向量的熱圖。此操作改變了原始矩陣的大小,而且每個cluster的大小信息丟失了,直接解讀均值向量可能會造成對數據的誤解。我不贊成此操作,因此我沒有支持這個參數。在ComplexHeatmap中,row_km和column_km參數可能是一個更好的選擇。
filename:如果這個參數被設定,熱圖直接保存至指定的文件中。我認為這只是畫蛇添足(沒有貶低pheatmap的意思,只是最近在給小孩講成語故事,然后想在這里使用一下)的一步,ComplexHeatmap::pheatmap()不支持此參數。
width:filename的寬度。
height:filename的長度。
silent: 是否打印信息。
在pheatmap::pheatmap()中,color參數需要設置為一個長長的顏色向量(如果你想用100種顏色的話),比如:
pheatmap::pheatmap(mat,?color?=?colorRampPalette(rev(brewer.pal(n?=?7,?name?=?"RdYlBu")))(100) )在ComplexHeatmap::pheatmap()中,你可以簡化無需使用colorRampPalette()去擴展更多的顏色,你可以直接簡化為如下,顏色會被自動插值和擴展。
ComplexHeatmap::pheatmap(mat,?color?=?rev(brewer.pal(n?=?7,?name?=?"RdYlBu")) )例子
我們首先創建一個隨機數據,這個來自于pheatmap包中提供的例子(https://rdrr.io/cran/pheatmap/man/pheatmap.html).
test?=?matrix(rnorm(200),?20,?10) test[1:10,?seq(1,?10,?2)]?=?test[1:10,?seq(1,?10,?2)]?+?3 test[11:20,?seq(2,?10,?2)]?=?test[11:20,?seq(2,?10,?2)]?+?2 test[15:20,?seq(2,?10,?2)]?=?test[15:20,?seq(2,?10,?2)]?+?4 colnames(test)?=?paste("Test",?1:10,?sep?=?"") rownames(test)?=?paste("Gene",?1:20,?sep?=?"")我們載入ComplexHeatmap包,然后執行pheatmap()函數,生成一副和pheatmap::pheatmap()非常類似的熱圖。
library(ComplexHeatmap) #?注意這是ComplexHeatmap::pheatmap pheatmap(test)在ComplexHeatmap::pheatmap()中,按照pheatmap::pheatmap()的樣式進行了相應的配置,因此,大部分元素的樣式一模一樣。只有少部分不一致,比如說熱圖的legend。
下一個例子是在熱圖中加入annotation。以下代碼是在pheatmap()中添加annotation。如果你是pheatmap()用戶,你應該對annotation的數據格式不太陌生。
annotation_col?=?data.frame(CellType?=?factor(rep(c("CT1",?"CT2"),?5)),?Time?=?1:5 ) rownames(annotation_col)?=?paste("Test",?1:10,?sep?=?"")annotation_row?=?data.frame(GeneClass?=?factor(rep(c("Path1",?"Path2",?"Path3"),?c(10,?4,?6))) ) rownames(annotation_row)?=?paste("Gene",?1:20,?sep?=?"")ann_colors?=?list(Time?=?c("white",?"firebrick"),CellType?=?c(CT1?=?"#1B9E77",?CT2?=?"#D95F02"),GeneClass?=?c(Path1?=?"#7570B3",?Path2?=?"#E7298A",?Path3?=?"#66A61E") )pheatmap(test,?annotation_col?=?annotation_col,?annotation_row?=?annotation_row,?annotation_colors?=?ann_colors)看起來和pheatmap::pheatmap()還是很一致。
ComplexHeatmap::pheatmap()內部其實使用了Heatmap()函數,因此更多的參數都最終傳遞給了Heatmap()。我們可以在pheatmap()中使用一些Heatmap()特有的參數,比如row_split和column_split來對行和列進行切分。
pheatmap(test,?annotation_col?=?annotation_col,?annotation_row?=?annotation_row,?annotation_colors?=?ann_colors,?row_split?=?annotation_row$GeneClass,column_split?=?annotation_col$CellType)ComplexHeatmap::pheatmap()返回一個Heatmap對象,因此它可以與其他Heatmap/HeatmapAnnotation對象連接。換句話說,你可以使用炫酷的+或者%v%對多個pheatmap水平連接或者垂直連接。
p1?=?pheatmap(test,?name?=?"mat1") p2?=?rowAnnotation(foo?=?anno_barplot(1:nrow(test))) p3?=?pheatmap(test,?name?=?"mat2",?col?=?c("navy",?"white",?"firebrick3")) p1?+?p2?+?p3ComplexHeatmap支持將一個熱圖導出為一個shiny app,這也同樣適用于pheatmap(),因此你可以這樣做:
ht?=?pheatmap(...) ht_shiny(ht)?#?強烈建議試一試還有一件重要的小事是,因為ComplexHeatmap::pheatmap()返回一個Heatmap對象,如果pheatmap()并沒有在一個interactive的環境執行,比如說在一個R腳本中,或者在一個函數/for loop中,你應該顯式的調用draw()函數進行畫圖。
for(...)?{p?=?pheatmap(...)draw(p) }最后我想說的事,這篇文章的主旨并不是鼓勵用戶直接使用ComplexHeatmap::pheatmap(),我只是在此展示了pheatmap完全可以用ComplexHeatmap來代替,而且ComplexHeatmap提供了工具讓用戶無需任何額外的操作(zero effort)就可以遷移以前舊的代碼。但是我還是強烈建議用戶直接使用ComplexHeatmap中的“正經函數”。
從pheatmap到ComplexHeatmap的翻譯
在“閱讀原文”中,你可以找到一個表格,其中詳細的列出了如何將pheatmap::pheatmap()中的參數對應到Heatmap()中。
比較
這一小節我比較了相同參數下pheatmap::pheatmap()生成的熱圖和ComplexHeatmap::pheatmap()的相似度。我使用了pheatmap包中所有的例子(https://rdrr.io/cran/pheatmap/man/pheatmap.html)。同時我也使用了ComplexHeatmap中提供的一個簡單的幫助函數ComplexHeatmap::compare_pheatmap()。它的功能就是把參數同時傳遞給pheatmap::pheatmap()和ComplexHeatmap::pheatmap(),然后生成兩幅熱圖,這樣可以直接進行比較。因此如下代碼
compare_pheatmap(test)其實等同于:
pheatmap::pheatmap(test) ComplexHeatmap::pheatmap(test)在往下閱讀之前,我先告訴你結論:pheatmap::pheatmap()和ComplexHeatmap::pheatmap()產生的熱圖幾乎完全相同。
只提供一個矩陣:
compare_pheatmap(test)對列進行z-score歸一化,行聚類距離使用相關性距離:
compare_pheatmap(test,?scale?=?"row",?clustering_distance_rows?=?"correlation")設定顏色:
compare_pheatmap(test,?color?=?colorRampPalette(c("navy",?"white",?"firebrick3"))(50))不對行聚類:
compare_pheatmap(test,?cluster_row?=?FALSE)不顯示legend:
compare_pheatmap(test,?legend?=?FALSE)在矩陣格子上顯示數值:
compare_pheatmap(test,?display_numbers?=?TRUE)對矩陣格子上的數值進行格式化:
compare_pheatmap(test,?display_numbers?=?TRUE,?number_format?=?"%.1e")自定義矩陣格子上的文字:
compare_pheatmap(test,?display_numbers?=?matrix(ifelse(test?>?5,?"*",?""),?nrow(test)))定義legend上的label:
compare_pheatmap(test,?cluster_row?=?FALSE,?legend_breaks?=?-1:4,?legend_labels?=?c("0",?"1e-4",?"1e-3",?"1e-2",?"1e-1",?"1"))熱圖的標題:
compare_pheatmap(test,?cellwidth?=?15,?cellheight?=?12,?main?=?"Example?heatmap")添加列的annotation:
annotation_col?=?data.frame(CellType?=?factor(rep(c("CT1",?"CT2"),?5)),?Time?=?1:5 ) rownames(annotation_col)?=?paste("Test",?1:10,?sep?=?"")annotation_row?=?data.frame(GeneClass?=?factor(rep(c("Path1",?"Path2",?"Path3"),?c(10,?4,?6))) ) rownames(annotation_row)?=?paste("Gene",?1:20,?sep?=?"")compare_pheatmap(test,?annotation_col?=?annotation_col)不繪制annotation的legend:
compare_pheatmap(test,?annotation_col?=?annotation_col,?annotation_legend?=?FALSE)同時添加行和列的annotation:
compare_pheatmap(test,?annotation_col?=?annotation_col,?annotation_row?=?annotation_row)調整列名的旋轉:
compare_pheatmap(test,?annotation_col?=?annotation_col,?annotation_row?=?annotation_row,?angle_col?=?"45")調整列名的旋轉至水平方向:
compare_pheatmap(test,?annotation_col?=?annotation_col,?angle_col?=?"0")控制annotation的顏色:
ann_colors?=?list(Time?=?c("white",?"firebrick"),CellType?=?c(CT1?=?"#1B9E77",?CT2?=?"#D95F02"),GeneClass?=?c(Path1?=?"#7570B3",?Path2?=?"#E7298A",?Path3?=?"#66A61E") )compare_pheatmap(test,?annotation_col?=?annotation_col,?annotation_colors?=?ann_colors,?main?=?"Title")同時控制行和列annotation的顏色:
compare_pheatmap(test,?annotation_col?=?annotation_col,?annotation_row?=?annotation_row,?annotation_colors?=?ann_colors)只提供部分annotation的顏色,未提供顏色的annotation使用隨機顏色:
compare_pheatmap(test,?annotation_col?=?annotation_col,?annotation_colors?=?ann_colors[2])?將熱圖分為兩部分,我建議直接使用Heatmap()中的row_split或者row_km參數。
compare_pheatmap(test,?annotation_col?=?annotation_col,?cluster_rows?=?FALSE,?gaps_row?=?c(10,?14))使用cutree()對列的dendrogram切分:
compare_pheatmap(test,?annotation_col?=?annotation_col,?cluster_rows?=?FALSE,?gaps_row?=?c(10,?14),?cutree_col?=?2)自定義行名:
labels_row?=?c("",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"",?"Il10",?"Il15",?"Il1b") compare_pheatmap(test,?annotation_col?=?annotation_col,?labels_row?=?labels_row)自定義聚類的距離:
drows?=?dist(test,?method?=?"minkowski") dcols?=?dist(t(test),?method?=?"minkowski") compare_pheatmap(test,?clustering_distance_rows?=?drows,?clustering_distance_cols?=?dcols)對聚類的回調處理:
library(dendsort) callback?=?function(hc,?...){dendsort(hc)} compare_pheatmap(test,?clustering_callback?=?callback)超詳細的熱圖繪制教程(5000余字),真正的保姆級教程
聚類熱圖怎么按自己的意愿調整分支的順序?
獲取pheatmap聚類后和標準化后的結果
往期精品(點擊圖片直達文字對應教程)
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
?
總結
以上是生活随笔為你收集整理的从pheatmap无缝迁移至ComplexHeatmap的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Cell封面文章:跑步短短10分钟,身体
- 下一篇: 连发Science和Nature, 王二