置換驗證截距沒有小於0可以嗎?有參考文獻嗎?

    在進行OPLS-DA分析時,置換驗證是確保模型的有效性並避免過擬合而進行一種常用的模型驗證方法。在置換驗證中,會隨機改變樣本的類別標籤,然後重新訓練模型並計算模型的預測能力。理論上,如果模型是有效的,那麼在正確的類別標籤下,模型的預測能力應該明顯優於隨機標籤。


    在許多文獻中,人們使用置換驗證的截距(intercept)作為模型驗證的一個指標。在2008年的一篇文章中,Eriksson等人提出,對於一個有效的模型,其置換驗證截距應該在(0, 0.3)範圍內。這是因為,如果模型在隨機標籤下的預測能力(即截距)太高,那麼可能是出現了過擬合。因此,他們建議,如果截距大於0.3,那麼應該對模型進行進一步的調整或驗證。


    然而,也有一些研究表明,截距小於0並不總是必須的。例如,Westerhuis等人在2008年的一篇文章中指出,截距小於0只是一個參考標準,而不是一個硬性要求。他們的理由是,有時即使截距大於0,模型也可能是有效的,只要模型的預測能力在正確的標籤下明顯優於隨機標籤。


    因此,對於截距是否需要小於0的問題,目前並沒有一個統一的標準。在實際分析中,應該綜合考慮其他的模型驗證指標,如Q2、R2等,以及實驗背景和其他資料資訊。


    參考文獻:


    1.Eriksson, L., Trygg, J., & Wold, S. (2008). CV-ANOVA for significance testing of PLS and OPLS® models. Journal of chemometrics, 22(11-12), 594-600.


    2.Westerhuis, J. A., Hoefsloot, H. C., Smit, S., Vis, D. J., Smilde, A. K., van Velzen, E. J., ... & Hendriks, M. M. (2008). Assessment of PLSDA cross validation. Metabolomics, 4(1), 81-89.


    百泰派克生物科技--生物製品表徵,多組學生物質譜檢測優質服務商


    相關服務:

    代謝組學

    代謝組學資料質量評估

    代謝組學生物資訊學分析

    主成分分析(PCA)

    PLS-DA/OPLS-DA二維圖

    資料歸一化分析

    單變數統計分析

    差異代謝產物聚類分析


提交需求
姓名 *
聯絡型別 *
聯繫方式 *
專案描述
諮詢專案 *

 

How to order?


/assets/images/icon/icon-rc2.png

客服諮詢

/assets/images/icon/icon-message.png

提交需求

https://file.biotech-pack.com/static/btpk/assets/images/icon/icon-wx-2.png

https://file.biotech-pack.com/pro/bt-btpk/image/config/config/20240322-4149-企业微信销售二维码.jpg

聯絡銷售人員

/assets/images/icon/icon-tag-sale.png

促銷活動

/assets/images/icon/icon-return.png