本發(fā)明公開的一種基于隨機哈希的異常檢測算法,屬于機器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域。本發(fā)明的異常檢測算法基于集成的思想,采取了哈希和隨機森林相結(jié)合的方法,數(shù)據(jù)點的異常分數(shù)由該點所落入的葉子結(jié)點中數(shù)據(jù)點個數(shù)來衡量。對于一個待測的數(shù)據(jù)點,其所落入的葉子結(jié)點中數(shù)據(jù)點個數(shù)越少,則該數(shù)據(jù)點是異常點的可能性越大。同傳統(tǒng)的基于密度和基于距離的方式相比,本發(fā)明中的方法具有更高的準(zhǔn)確性,并且其所需的運行時間要比傳統(tǒng)方式少很多。也能夠克服傳統(tǒng)方式在高維情況下失效的問題。
聲明:
“基于隨機哈希的異常檢測算法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)