探“云”指南 | 如何進行共表達相關(guān)性分析
共表達相關(guān)性分析的基本思想是通過計算不同特征的表達量在樣本中間的相關(guān)性,以此來揭示其之間的相互作用關(guān)系。常見的共表達相關(guān)性分析方法包括相關(guān)系數(shù)分析、主成分分析、聚類分析、因子分析等。這些方法可以用于挖掘具有生物學(xué)意義的跨組學(xué)特征對模式,預(yù)測未知基因的功能和生物學(xué)過程,甚至發(fā)現(xiàn)新的藥物靶標(biāo)。
功能介紹
共表達相關(guān)性分析小工具可以根據(jù)樣本一一對應(yīng)關(guān)系對,計算兩個組學(xué)特征之間的相關(guān)性,或一個組學(xué)特征的自相關(guān)性(即兩個不同的表或者相同的表),繪制熱圖,矩陣圖和網(wǎng)絡(luò)關(guān)系圖。相關(guān)性算法可選用的有pearson相關(guān)性、spearman相關(guān)性、kendall相關(guān)性。如果不指定,默認(rèn)使用pearson相關(guān)性計算方法。
文件要求
01
輸入文件1
計算文件1和文件2為不同的數(shù)據(jù):
接受兩個特征表達量矩陣文件,兩個文件的表頭(樣本)信息需要一一對應(yīng)。
圖1 | 輸入文件1格式示例
02
輸入文件2
圖2 | 輸入文件2格式示例
03
計算自相關(guān)表格
相關(guān)性表1和相關(guān)性表2和填寫相同的特征表達量矩陣文件
圖3 | 計算自相關(guān)表格格式示例
參數(shù)調(diào)整
01
主要參數(shù)
圖4 | 主要參數(shù)
02
常用參數(shù)
圖5 | 常用參數(shù)
作圖步驟
01
準(zhǔn)備工作
請于上傳文件前首先查看“重要提示”的提示信息以及“使用說明”中的示例文件格式,根據(jù)提示進行文件準(zhǔn)備。
02
主要參數(shù)設(shè)置
①請于主要參數(shù)中的相關(guān)性表1、相關(guān)性表2處上傳您所要進行分析的文件,二者為必填參數(shù)。如果您要進行自相關(guān)分析,請在相關(guān)性表1、相關(guān)性表2處上傳同一份文件。我們以計算兩個組學(xué)特征之間的相關(guān)性為例,上傳不同的文件。在“選擇文件”后顯示上傳的文件名說明上傳成功。
此處為上傳成功示例:
圖6 | 文件上傳成功示例
②相關(guān)性計算方法:相關(guān)性算法可選用的有pearson相關(guān)性、spearman相關(guān)性、kendall相關(guān)性。如果不指定,默認(rèn)使用“pearson”;
③任務(wù)命名:對結(jié)果進行命名用于區(qū)分不同的任務(wù),默認(rèn)為結(jié)果創(chuàng)建日期時間,在歷史記錄的注釋處可見,可接受默認(rèn)或自行輸入。
03
常用參數(shù)設(shè)置
①選擇top特征:選擇top特征進行繪圖,最大不超過200,若相關(guān)性表中特征數(shù)超過200,則將選取豐度值top200進行計算;
②是否列聚類、是否行聚類:默認(rèn)均為“是”;
③是否顯示x軸的標(biāo)簽、是否顯示y軸的標(biāo)簽:默認(rèn)均為“是”;
④顯著性標(biāo)識繪制方法:可選擇pvalue或者qvalue;
⑤作圖顏色選擇:可參考“重要提示”中的配色展示;
⑥x軸標(biāo)簽名稱的旋轉(zhuǎn)度、坐標(biāo)軸字體大小、字體類型、字體樣式、格子高度、格子寬度:根據(jù)需求填寫即可;
⑦網(wǎng)絡(luò)圖特征關(guān)系對相關(guān)系數(shù)閾值:篩選繪制網(wǎng)絡(luò)圖特征關(guān)系對的相關(guān)系數(shù)閾值,默認(rèn)為“0.8”;
⑧網(wǎng)絡(luò)圖特征關(guān)系對顯著性閾值:篩選繪制網(wǎng)絡(luò)圖特征關(guān)系對的顯著性閾值,默認(rèn)為“0.05”。
04
最終提交
文件上傳成功后
如圖所示區(qū)域:
圖7 | 工具預(yù)估耗時提示處
結(jié)果分析
(本說明為上傳兩個不同文件及其他參數(shù)保持默認(rèn)的情況)
01
結(jié)果展示及下載
分析結(jié)果保存6個月,請注意及時下載保存,
圖8 | 結(jié)果展示處
02
結(jié)果說明
5.2.1、結(jié)果文件
圖9 | 結(jié)果文件示例
5.2.2、Corheatmap圖
列為表2特征,行為表1特征,其中的每個小方格都代表兩特征的相關(guān)性,顏色代表相關(guān)性的大小,根據(jù)右側(cè)的色階我們可以看出紅色表示正相關(guān),藍色表示負(fù)相關(guān),且顏色越深表示相關(guān)性越大,越接近黃色表示相關(guān)性越接近零。左側(cè)樹狀圖表示來自表1特征的聚類分析結(jié)果,圖片上方的樹形圖表示來自表2特征的聚類分析結(jié)果。圖中的“*”為顯著性標(biāo)記,“*”代表p<0.05,“**”代表p<0.01,“***”代表p<0.001。
圖10 | Corheatmap圖示例
5.2.3、相關(guān)性矩陣圖
列為表1特征,行為表2特征。根據(jù)右側(cè)的色階我們可以看出紅色表示正相關(guān),藍色表示負(fù)相關(guān),且顏色越深表示相關(guān)性越大,越接近白色表示相關(guān)性越接近0,同時,點的大小代表相關(guān)性的大小,點越大相關(guān)性越大。
圖11 | heatmap_matrix圖示例
該圖展示了兩表之間的特征以及同一表內(nèi)特征之間的相關(guān)性值,紅色為正相關(guān),藍色為負(fù)相關(guān),顏色越深表示相關(guān)性越大,越接近白色表示相關(guān)性越接近零。點上都標(biāo)記了對應(yīng)的相似性大小,左下至右上的點相關(guān)性均為1,表明它們對應(yīng)的是同一個變量的相關(guān)性,點的大小代表相關(guān)性的大小,點越大相關(guān)性越大。
圖12 | heatmap_matrix_square圖示
5.2.4、關(guān)聯(lián)網(wǎng)絡(luò)圖
關(guān)聯(lián)網(wǎng)絡(luò)圖中為基于 spearman 相關(guān)性分析計算相關(guān)性表1和相關(guān)性表2數(shù)據(jù)間的關(guān)聯(lián)性,共表達關(guān)系對根據(jù)選擇的顯著性標(biāo)識繪制方法的所選閾值及相關(guān)性系數(shù)的所選閾值鏡像篩選。藍點來自表2,紅點來自表1,紅線代表正相關(guān),綠線代表負(fù)相關(guān)。線的粗細代表相關(guān)性系數(shù)的高低。
圖13 | Correlation_cor0.8p0.05_Network圖示例
歷史記錄
圖14 | 歷史記錄示例
常見Q&A
請問我的相關(guān)性表中特征數(shù)超過200的話,在“選擇top特征”參數(shù)填寫200,繪圖所選特征會怎么選擇呢?
您好,首先感謝您的咨詢。若上傳的相關(guān)性表中特征數(shù)超過200,同時您在“選擇top特征”參數(shù)處也填寫200,則會選取豐度值top200進行計算。
往期推薦
探“云”指南 | 一文教你WGCNA分析
探“云”指南 | 微生物ROC曲線
探“云”指南 | 免費物種功能貢獻度分析小工具不容錯過!
探“云”指南 | 拜托!誰不喜歡清晰直觀的條形圖?。。。?/p>