如何解讀 kegg 結果中的數值?
KEGG(Kyoto Encyclopedia of Genes and Genomes)是一個包含基因、蛋白質、代謝途徑等多種生物資訊的資料庫。在進行富集分析(例如,基因富集分析或代謝物富集分析)時,我們經常使用KEGG路徑來幫助解釋實驗結果。
使用KEGG進行富集分析後,結果通常包含以下幾個主要引數:
1.Term或ID:
這是KEGG路徑的名稱或識別符號。
2.Count:
這是輸入列表(例如,顯著改變的基因或代謝物)中屬於特定KEGG路徑的專案數量。
3.%:
這是輸入列表中屬於特定KEGG路徑的專案佔輸入列表總專案的百分比。
4.P-value:
這是假設檢驗的結果,表示觀察到的富集程度(或更極端的富集程度)在零假設(隨機)下出現的機率。P值越小,表示在隨機的情況下觀察到當前結果的可能性越小,因此我們有更多的理由拒絕零假設,認為觀察到的富集程度不是隨機的,即輸入列表與特定KEGG路徑有顯著關聯。
5.Adjusted P-value或Q-value:
這是矯正後的P值,用來控制假陽性發現率(FDR)。在多重假設檢驗中,原始的P值可能過於樂觀,因此需要進行矯正。常見的矯正方法包括Bonferroni校正、Benjamini-Hochberg校正等。矯正後的P值越小,表示輸入列表與特定KEGG路徑的關聯程度越顯著。
6.Enrichment:
這是富集程度的度量,通常是觀察到的富集程度與隨機期望的富集程度的比值。富集程度越高,表示輸入列表與特定KEGG路徑的關聯程度越顯著。
對於解讀KEGG結果,一般來說,我們關注的是調整後的P值小(例如<0.05)且富集程度高的路徑,因為這些路徑很可能是實驗條件下發生顯著改變的生物過程。
百泰派克生物科技--生物藥物表徵,多組學生物質譜檢測優質服務商
相關服務:
How to order?