探“云”指南 | 交互式聚類熱圖繪制系統(tǒng)
聚類熱圖(ClusterHeatmap)是科研文章中極為常見的一種數(shù)據(jù)可視化展示手段。在基因分析中對樣本和基因分別聚類后,我們可以簡明直觀地觀察到樣本和基因之間的相似情況。歐易生物云平臺研發(fā)的聚類熱圖在線繪制工具,現(xiàn)在不僅只需登錄網(wǎng)頁根據(jù)要求編輯數(shù)據(jù)便可進行快速繪制,并且開創(chuàng)性的研發(fā)了交互式制圖,可以實時對生成的熱圖進行修改和輸出,讓我們一起來看看吧!
云工具跳轉(zhuǎn)鏈接:
https://cloud.oebiotech.com/task/detail/interactive_heatmap/(
功能介紹
歐易生物云平臺提供的交互式在線聚類熱圖繪制系統(tǒng)具有五種不同的系統(tǒng)數(shù)據(jù)預處理模式(芯片、測序、蛋白、代謝、微生物),另外提供行列聚類,生成聚類圖色系等繪制聚類熱圖的主要參數(shù)選擇。該系統(tǒng)采用了大多數(shù)文章中使用的歐氏距離,平均連接的聚類算法,且數(shù)據(jù)提交后網(wǎng)站會自動對每個基因(行)進行Zscore的標準化,因此生成的熱圖具有科學性與高適用性。依托于歐易生物公司強大的云計算機配置,現(xiàn)在您不僅只需要30-90s便可快速完成一張美觀專業(yè)的聚類熱圖的繪制,并且在生成的熱圖中還可以進行交互式的選擇,即時的為您的熱圖進行風格上的修改和美化來使其完美符合您的要求。同時在保存熱圖的選項中您可以保存為png、pdf、矢量圖等多種格式,滿足您對于圖片清晰性等方面的多種需求。
數(shù)據(jù)準備
您需要按照相應(yīng)格式來處理數(shù)據(jù)整理成如下文件:
01
表達量矩陣文件
第一列為特征名稱,如基因/蛋白/代謝物,其余各列為樣本名稱,對應(yīng)值為各樣品中相應(yīng)表達量。請您注意:如果表達量矩陣文件中存在空值的情況,請補充完整后再分析。
圖1 | 表達量矩陣文件格式示例
作圖步驟
01
準備工作
請于上傳文件前根據(jù)上方的“作圖步驟”或云工具頁面的“使用說明”的示例文件格式來進行數(shù)據(jù)文件的準備。
02
主要參數(shù)
圖2 | 主要參數(shù)
03
主要參數(shù)詳解
①請于主要參數(shù)中的表達量矩陣文件處上傳您所要進行分析的文件,如果此處未上傳文件,您將無法得出結(jié)果。上傳成功后,將會于“選擇文件”后顯示您上傳的文件名;
②數(shù)據(jù)預處理方式選擇:對數(shù)據(jù)進行l(wèi)og化處理使顏色展示更平滑。一般情況下,芯片/微生物數(shù)據(jù)不需log處理,測序(基因/轉(zhuǎn)錄本)數(shù)據(jù)以2為底取對數(shù),蛋白/代謝數(shù)據(jù)以10為底取對數(shù)。默認無需處理,請您根據(jù)上傳的數(shù)據(jù)類型進行匹配選擇。根據(jù)我們上傳的示例數(shù)據(jù),此處選擇測序數(shù)據(jù)(如fpkm);
③對行進行聚類:是對基因/蛋白/代謝物/微生物物種聚類,展示變量間的表達模式相似度。默認為聚類,可在下拉菜單進行其他選擇;
④對列進行聚類:是對樣本聚類,展示不同樣本/分組間的相似度,用于考察數(shù)據(jù)質(zhì)量、重復性等。默認為聚類,可在下拉菜單進行其他選擇;
⑤聚類圖色系:我們提供了8種配色供您選擇。默認為歐易配色,可在下拉菜單進行其他選擇。
04
常用參數(shù)
圖3 | 常用參數(shù)
05
常用參數(shù)詳解
①樣本名稱旋轉(zhuǎn)度數(shù):默認為45,可在下拉菜單進行其他選擇;
②數(shù)據(jù)歸一化方式:默認為row,可在下拉菜單進行其他選擇;
③聚類樹劃分行的簇數(shù):基于層次聚類劃分列的簇數(shù)(非負整數(shù)),如不進行列聚類或分割,則忽略參數(shù);
④繪圖數(shù)字顯示:繪圖數(shù)字即為歸一化數(shù)值,非原始表達量。默認為隱藏,可在下拉菜單進行其他選擇;
⑤圖片標題:不能添加特殊字符,如 () 等。默認為Heatmap,可接受默認或自行輸入。
06
最終提交
文件上傳成功后請
如圖所示區(qū)域:
圖4 | 工具預估耗時提示處
個性化熱圖
(圖片為使用示例文件及其他參數(shù)保持默認時的結(jié)果)
01
結(jié)果展示及下載
分析結(jié)果圖將會在此處展示,
圖5 | 結(jié)果展示處
02
交互式作圖界面的使用
交互式作圖系統(tǒng)分為兩大模塊,分別是左側(cè)的熱圖預覽區(qū)域與右側(cè)的熱圖設(shè)置區(qū)域。當您在右側(cè)的設(shè)置區(qū)域做出修改時,左側(cè)的熱圖會即時隨之改變,這可以方便您對生成熱圖結(jié)果的實時把控,以下截圖為交互式作圖的初始界面:
圖6 | 交互式作圖初始界面
03
交互式作圖的具體設(shè)置
分布在系統(tǒng)右側(cè)的交互式作圖的具體設(shè)置分為五大部分:圖片全局風格調(diào)整、標題設(shè)置、圖例配置、X/Y軸配置、樣品點調(diào)整。您可以根據(jù)需求在不同選項中選擇,且熱圖預覽區(qū)域中的聚類熱圖會隨您的修改而實時改變,其部分設(shè)置選項如下圖所示:
圖7 | 交互式作圖設(shè)置區(qū)域部分設(shè)置選項
04
交互式作圖的操作演示
全局風格調(diào)整演示:
圖8 | 全局風格調(diào)整
聚類熱圖整體操作演示:
圖9?| 聚類熱圖整體演示
標題樣式調(diào)整演示:
圖10?| 標題設(shè)置
X軸風格修改操作演示:
圖11?| X軸設(shè)置
Y軸風格修改操作演示:
圖12?| y軸設(shè)置
05
交互式作圖結(jié)果的生成
當您按照自己的需求完成了所有對于聚類熱圖的設(shè)置,且對于左側(cè)預覽區(qū)域出示的熱圖生成結(jié)果滿意后,便可以
圖13?| 交互式作圖圖片的保存
06
結(jié)果說明
一列表示一個樣本,一行表示一種基因,其中的每個小方格都代表一個基因,其顏色代表該基因表達量的大小,
圖14?| 交互式熱圖示例
歷史記錄
圖15?| 歷史記錄示例
常見Q&A
請問需要進行數(shù)據(jù)篩選的話應(yīng)該怎么修改呢?
您好,首先感謝您的咨詢。建議您盡量不要在源文件進行數(shù)據(jù)篩選,新建一個全新的excel文件進行該操作會是更合適的選擇。
請問繪制熱圖對樣本數(shù)量有什么要求呢?
您好,首先感謝您的咨詢。當少于2個樣本時,不繪制熱圖;當僅有2個樣本時,不對數(shù)據(jù)進行行標準化;默認條件下,行列聚類,輸出聚類后排序列表;當行不聚類時,限制繪圖特征數(shù)目(數(shù)據(jù)量)不能多于 65536 個;當行聚類時,特征數(shù)目(數(shù)據(jù)量)不能多于14000個。
請問如果某個特征在所有樣本中數(shù)值都相等會怎么處理呢?
您好,首先感謝您的咨詢。這種情況下,將會自動刪除該特征并提供oeweb_task.log日志文件。
請問如果存在相同特征時會怎么處理呢?
您好,首先感謝您的咨詢。這種情況下,將會自動計算表達量之和、保留高表達特征并提供oeweb_task.log日志文件。
請問存在缺失值會影響繪圖嗎?
您好,首先感謝您的咨詢。會有影響,小工具正常運行是不允許存在空值的,所以在進行分析之前需要您對數(shù)據(jù)進行檢查,補充完整數(shù)據(jù)后才能上傳分析。
交互式作圖可以帶您更全面地了解各個層次的細節(jié),定制您最稱心的個性化圖片。以上就是聚類熱圖交互的介紹,歐易云平臺正在開發(fā)更多的交互式小工具,期待您的試用反饋。
往期推薦
探“云”指南 | 如何使用云工具進行樣本相關(guān)性分析
探“云”指南 | 如何進行共表達相關(guān)性分析
探“云”指南 | 如何在線一鍵化進行差異分析
探“云”指南 | 微生物ROC曲線