公司動態
AJHG:GWAS之后,如何進一步深入基因研究
閱讀:1062 發布時間:2019-5-23全基因組關聯研究(GWAS)針對大量人群尋找有助于常見的多基因特征(如身高或肥胖)的基因。這些綜合性研究經常發現大量微小的遺傳變異,這些變異在高齡,肥胖等人群中更常發生。但這種相關性并不一定意味著因果關系的存在。
雖然有許多計算算法可用于幫助提取GWAS結果,但很難知道選擇哪一種。研究人員在《American Journal of Human Genetics》雜志上發表的文章稱Benchmarker一種可靠的對GWAS數據進行挖掘的算法。
“我們有不同的優先級算法,但我們實際上并不知道如何確定哪一個是的,”該文章主要作者Rebecca Fine說 “我們不想依賴先前的'黃金標準'或引入除原始GWAS數據之外的任何其他內容。”
借助“交叉驗證”的機器學習概念,Benchmarker使調查人員能夠將GWAS數據本身作為自己的控制。我們的想法是采用GWAS數據集并挑出一條染色體。然后,基準測試的算法使用來自剩余的21條染色體(除X和Y之外的所有染色體)的數據來預測單個染色體上的哪些基因有可能對所研究的性狀有貢獻。由于依次對每個染色體重復該過程,因此匯集算法標記的基因。然后通過將這組優先基因與原始GWAS結果進行比較來驗證該算法。
“首先在GWAS上訓練算法,并保留一條染色體,然后返回到該染色體,并詢問這些基因是否與原始GWAS結果中的強p值相關聯,”Fine解釋說。 “雖然這些p值并不能代表確切的”正確答案“,但它們確實可以告訴我們一些真正的遺傳關聯。終產品是對每種算法執行情況的評估。
Fine,Hirschhorn及其同事通過應用得出的結論是,結合多種策略通常可以獲得*結果。他們還發現了某些算法在尋找某些特征的基因時表現*的證據。
“我們希望在GWAS之后開發更多算法來回答關鍵的下一個問題:哪些基因和變異與人類特征和疾病有因果關系,”Hirschhorn說。 “benchmarker可以作為一種無偏見的方法來確定用于回答這個問題的算法。”