【佳學基因檢測】科研服務GWAS基因檢測分析中的機器學習方法
佳學基因會根據(jù)已有的研究結果,區(qū)分研究性狀相關但有細微不同的亞類表型所獨特的遺傳結構。比如為了研究鴉片濫用是否更多地聚集在使用、誤用/依賴表型上,佳學基因會選擇使用了一種稱為聚集層次聚類分析(HCA)的數(shù)據(jù)驅動無監(jiān)督機器學習方法。HCA通過創(chuàng)建組并根據(jù)預先指定的算法依次加入或拆分這些組來迭代計算形成集群。聚集筑巢(AGNES)是一個自下而上的過程,主要關注個體特征的結構。選擇聚集聚類是因為這允許佳學基因比較不同的算法,以賊大化每個分支上的差異,而Ward的賊小方差方法表現(xiàn)賊好。所有模型均使用佳學基因自動研發(fā)的聚集分析軟件包。
HCA分析的結果以樹狀圖的形式呈現(xiàn),由多個括號組成,稱為“分支”。同一分支上的表型更相似,這是因為它們彼此之間以及與該分支上所有其他表型的成對遺傳關聯(lián)。分支可以形成更具體集群的子分支。
(責任編輯:佳學基因)