本發(fā)明公開了一種多變量數(shù)據(jù)的特征選擇新方法,適合分類與回歸分析,屬于化學(xué)計量學(xué)領(lǐng)域。該方法從樣本和特征方向同時進行蒙特卡羅劃分產(chǎn)生子模型,統(tǒng)計評價模型所產(chǎn)生的結(jié)果,以可視化的形式直觀呈現(xiàn)出來,方便特征選擇。具體包括以下幾個步驟:1,從特征方向多次隨機劃分數(shù)據(jù)并構(gòu)建模型,以分類或回歸系數(shù)方法選擇較多的最優(yōu)特征;2,從樣本方向多次劃分新的數(shù)據(jù),構(gòu)造訓(xùn)練集和預(yù)測集,計算預(yù)測錯誤率或交互驗證均方殘差;3,統(tǒng)計分析結(jié)果的均值和方差,以均值對方差作圖;4,分析圖形中均值和方差均較小的區(qū)域內(nèi)所構(gòu)建的模型,統(tǒng)計所有特征在該區(qū)域內(nèi)的出現(xiàn)次數(shù),以此作為特征選擇的依據(jù)。方法適合特征數(shù)目大、共線性程度高的數(shù)據(jù)分析。
聲明:
“復(fù)雜多變量數(shù)據(jù)的特征選擇新方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)