online 18 January 2017
Xuanyao Liu他で日本人も複数名いる
分析対象SNPsが、約3万とあまりに少なすぎる

韓国人SNPが国際比較されたのは、2020時点で①The HUGO Pan-Asian SNP Consortium =PASNP ②この論文の2つしかない。阪大のウェブページで、この論文で使用しているBeagleというphasingソフトの解説があったので画像メモしておく。

asian7

同じ阪大のページで、いい一覧があったので画像メモしとくasian10

asian8
asian9

前置き

The HUGO Pan-Asian SNP Consortium (PASNP) was a successfulmodel of a genomics research network in Asia, ここ以降はコピペ省略するが、要するにPASNPは、たったの6万5千のSNPを比較しているに過ぎず、多くの少数民族をも対象にしたためサンプル数が極度に少ない場合がある欠点がある。(飛ばし読みしたが、この欠点は以前から知っていた)

The Asian Diversity Project (ADP) overcomes this paucity in databy enlisting scientists across Asia to cooperate and share resources fora deeper survey of population genetics in Asia.

To date, ADP hasassembled genetic data for 37 cosmopolitan and ethnic minority populations from public databases15–19 and private repositories(Figure 1a),where there are at least half a million SNP markers genotyped in each population and 33 of the 37 populations surveyed at least 10 individuals (Supplementary Table S1)
ADPでは、①比較対象SNPは、少なくとも50万②サンプルは37集団中33集団は少なくとも10人

Here, we aim to characterise the extent and sharing of positiveselection in the 37 ADP populations.
この論文では、アジア人の正の自然選択の存在を立証しようとしている。 コピペ省略するが、haploPS という普通は使われない正の自然選択を検出できるようになソフトを使用している。haploPSは、このサイトの冒頭でダウンロードできる
しかしながら、阪大医学研究科遺伝統計学のウェブページによれば、正の自然選択の存在を確認できるためのソフトとしては、むしろselacanとう解析ソフトが有効かつ一般的なようである。従って、この論文の価値が大きく損なわれるが、SNP比較分析では意味がある。

We believethis is thefirst survey of positive selection in Asia that possessessufficient statistical power to allow a systematic evaluation of theextent of sharing signatures of local adaptation.

asian


asian2

asian3
Principal component analysis of the 37 ADP populations using a common set of 30 927 SNPs in the 39 populations
たったの約3万を比較しただけ。主成分分析は、地理的分布と完全に合致している

手法

元データは①hapmap② Singapore Genome Variation Project(SGVP)の2つからである。 正の自然選択検出ソフトは、BEAGLE version 3.3.2

結果

A total of 3933 samples from 37 Asian populations remained afterquality control, of which we identified a set of 30 927 SNPs distributed across the genome that were present in all 37 populations.

37集団の3393のサンプルに共通する約3万のSNPを比較


asian4

Figure 2
Admixture analysis of ADP populations. Analysis of admixture with the program ADMIXTURE, where the number of ancestry ranges from K=2to12. The populations are binned into four population groups, corresponding to the South, Central, East and Southeast regions where each region comprises predominantly but not solely populations located in the corresponding geographical region in Asia.

admixtureで示された結果で、普通であればk6を採用するだろう。この論文の上の結果は極めて正確な可能性が非常に高い。重要論文である。
Detecting genomic signatures of positive selection以降は読まず