Korean National Standard Reference Variome database of whole genomes with comprehensive SNV, indel, CNV, and SV analyses

Jungeun Kim 他
 
FDA論文と全く同じ原データ(=同じサンプル集団)を使用しており、FDA論文の分析が完全に正しいことが確認された。サンプルは、FDA論文よりも15名多い、50名であり、FDA論文では明記していない非同義変異の比率が明らかとなり、朝鮮人のアレル頻度について、信じがたいような驚愕の数値が出ている。

Surprisingly, however, roughly half of the variants in 1000GP low frequency were classified as frequent in KoVariome.

と明言しており、韓国人という精神面での完全なDNA異常集団のDNA特性を書いている。MAOA遺伝子論文を読んだ時と同様だが、中国と日本に挟まれた朝鮮半島のみで、こんなことが起こりうるのか?
比較対象とした1000GPには、CHBとCHS、JPTがあり、中国人、日本人に比べてすら0.1%以上5%未満のアレル頻度が、精神面でのDNA異常集団韓国人どもでは、約2倍もある。

アレル頻度の低い変異は、

①集団遺伝学の一般論として、アレル頻度が高い変異の頻度の変化には少なくとも1万年以上必要とするのに対し、アレル頻度が低い変異の頻度の場合、数千年で充分変化するとされている。

精神面でのDNA異常集団 韓国人どもは、少なくとも、過去2500~3000年は、大規模な交雑を経ておらず、集団遺伝学の一般論がそのまま当てはまる。

しかし、中立論ですら、アレル頻度がかなり低い有害変異は、負の自然淘汰で消え去る点については、ネオダーウィニズムと同じ結論だ!中立論とネオダーウィニズムの結論が異なるのは、正の自然選択についてである。

②集団遺伝学の一般論として、レアな頻度の低い非同義変異は、そもそもほぼ100%近くが有害変異だ。少なくとも集団内から消えてなくなるはずの変異であり、負の自然選択の対象である。そのような消えてなくなるべき有害な非同義変異が韓国人どもに広がっていることを意味する

この韓国人どもの論文では、The portion of non-synonymous SNVs in the ‘1000GP rare’ class was more than twice what was observed in the other classes(上はFDA論文の結論と同じ。)
It is possible that these patterns are associated with purifying selection to rapidly remove deleterious alleles in the population46,

としてる。

この論文の資料は、2.2Mのエクセルファイルで公開されている。そのうちのtable6が上の異常極まるデータの詳細だ。table6から同義変異・非同義変異の箇所のみ取り出した

Table S6. Statistics of Korean SNVs/indels compared to 1000GP  
Statistics of SNVs





synonymous non-Synonymous
    Frequent in KoVariome Rare in KoVariome Frequent in KoVariome Rare in KoVariome
KPGP Specific       1,682       5,673       3,533     11,746
0.01% 0.04% 0.03% 0.09%
1000GP Freq. 1000G Common     13,437          414     11,727          435
MAF > 5%, all contenents 0.11% 0.00% 0.09% 0.00%
1000G Low frequency       6,222       9,828       6,594     13,012
0.01% <MAF <=5%, any continetns 0.05% 0.08% 0.05% 0.10%
1000G Rare              5            94              3          119
MAF <= 0.01, all contenents 0.00% 0.00% 0.00% 0.00%
Sums     21,346     16,009     21,857     25,312
0.17% 0.13% 0.17% 0.20%

上の表中のRare in KoVariomeは、ほぼ個体固有の非同義変異と見ていい。日本人とさして変わらない傾向だが、1000G Low frequency=1000ゲノムでは、個体固有とは言い難い変異が、韓国人では個体固有

(1)サンプル50名合計で検出された非同義変異は、計約47000(2)サンプル50名中の5%以上の者が有する非同義変異は、合計21857で、

①3533は韓国人固有
②11727は、他民族でも5%以上見られる非同義変異
③6594は、他民族では、5%以下しかない非同義変異

つまり、韓国人に5%以上の頻度で存在する非同義変異のうち、他民族と同様の頻度であるのは、半分程度に過ぎず、残り半分は、他民族では広がってはいない頻度(=5%未満)であるのに、韓国人では、ありふれた変異だ(5%以上)。

本当に重大な内容。集団特性だったんだ!一部の者のみが異常ではなかったのかもしれない!

この論文のサンプル数は50、FDA論文のサンプル数は35であるが、韓国人の非同義変異の異常な多さとバリアンツ分布の異様性については、サンプル数が多い全エクソンシーケンス論文(韓国人、日本人、主に白人の別々の論文)で完全に確認した。詳細な確認内容は、私が死んでからも残るようにと願い、このメモ用ブログのFDA論文ページにメモしてある


要約
We report a comprehensive analysis of the Korean population, and present the Korean National Standard Reference Variome (KoVariome).

「バリオーム(variome)はゲノム(genome)に対応する造語でgenome(DNA sequence)vari-ation(GV)あるいはゲノム多様性の総称である11それは disease causing mutation とも称される21Human Variome Project(HVP131はすべてのヒトGV をカタログ化する世界規模の巨大情報インフラ構築で世界保健機関(World Health Organiza-tion:WHO)が提唱する Global Public Good sと見なされうる.日本語では「疾患遺伝子世界統合データベース計画」とでも表現することができる.」上記は、このページからの抜粋As a part of the Korean Personal Genome Project (KPGP), we constructed the KoVariome database using 5.5 terabases of whole genome sequence data from 50 healthy Korean individuals in order to characterize the benign ethnicity-relevant genetic variation present in the Korean population.

In total, KoVariome includes 12.7M single-nucleotide variants (SNVs), 1.7M short insertions and deletions (indels), 4K structural variations (SVs), and 3.6K copy number variations (CNVs).
Among them, 2.4M (19%) SNVs and 0.4M (24%) indels were identified as novel.

We also discovered selective enrichment of 3.8M SNVs and 0.5M indels in Korean individuals, which were used to filter out 1,271 coding-SNVs not originally removed from the 1,000 Genomes Project when prioritizing disease-causing variants.

前置き

The Korean population is regarded as a homogeneous ethnic group in East Asia29
29の論文は、ウェブ上では、全文を読めない。

In this report, we describe the general features of KoVariome and characterize all four types of genomic variations, which include 12.7M SNVs, 1.7M indels, 4K SVs, and 3.6K CNVs.

This comprehensive database of genomic variations and corresponding metadata will be continuously updated and become a valuable resource to the genomic community as researchers search for the genetic basis of disease.
これで締めくくっており、事実上、単に疾病と遺伝子の関連解析用データベースとしての意味しかない

結果

Construction of the Korean standard Variome: KoVariome

From these data, we identified approximately 3.8M SNVs (ranged 3.7–3.9M) and 0.5M indels (0.4–0.7M) per Korean individual (Table 1 and Supplementary Fig. S1A).

In total, we observed 59K novel SNVs, including 1.2K (2.03%) coding-SNVs, per individual.

KGPGdatabaseには、現在で112名あり、赤マル印は、私が入れたこの論文のサンプルだ

two monozygotic twins, 14 parent-children pairs, seven siblings, five grandparents-grandchildren, six uncles-nephews, and three cousins.
で、一卵性双子2、親子14、兄弟7、孫と祖父母5、伯父と甥6、いとこ3
の計37名も血縁関係者が存在している。これらをあえて混ぜた意図は良く分かる。

このキチガイどもの論文では触れていないが、FDA論文ではKGPGには2名の外国人が含まれていたとのことであった。要するに39名は、一般的な分析には不適であり、残73名中50名をこの論文で分析している。

We analyzed familial SNVs using the same method as in KoVariome and also compared genetic distances between the two groups (see Methods).

このため、上記の血縁関係が影響していないかどうかを検証し、問題なしとしている。
This verifies that no genetic bias was present in the sample collection stage and current KoVariome.

ただし、この論文のサンプルは血縁のない者を選んだことを後で明記している

下の表は、このページで公表されているKPGPのサンプル一覧(下の一覧は、KPGPプロジェクトの全員)に、この論文によるNovel KoVariome SNVsの多い者を私が赤丸入れたものだ。

No Public ID Ethnic Group Gender Nationality WGS
SR LR
1 KPGP-00001 East Asian F Korea O    
2 KPGP-00002 East Asian M Korea O    
3 KPGP-00003 East Asian F Korea O    
4 KPGP-00005 East Asian F Korea O    
5 KPGP-00006 East Asian M Korea O    
6 KPGP-00009 East Asian M Korea O    
7 KPGP-00032 East Asian M Korea O    
8 KPGP-00033 East Asian F Korea O    
9 KPGP-00039 East Asian F Korea O    
10 KPGP-00056 East Asian M Korea O    
11 KPGP-00086 East Asian M Korea O O  
12 KPGP-00088 East Asian F Korea O    
13 KPGP-00089 East Asian F Korea O    
14 KPGP-00090 East Asian M Korea O    
15 KPGP-00091 East Asian M Korea O    
16 KPGP-00117 East Asian M Korea O    
17 KPGP-00120 East Asian M Korea O    
18 KPGP-00121 East Asian F Korea O    
19 KPGP-00122 East Asian F Korea O    
20 KPGP-00124 East Asian M Korea O    
21 KPGP-00125 East Asian M Korea O    
22 KPGP-00127 East Asian M Korea O    
23 KPGP-00128 East Asian F Korea O    
24 KPGP-00129 East Asian M Korea O    
25 KPGP-00131 East Asian M Korea O    
26 KPGP-00132 East Asian F Korea O    
27 KPGP-00134 East Asian F Korea O    
28 KPGP-00136 East Asian M Korea O    
29 KPGP-00137 East Asian F Korea O    
30 KPGP-00138 East Asian F Korea O    
31 KPGP-00139 East Asian F Korea O    
32 KPGP-00141 East Asian F Korea O    
33 KPGP-00142 East Asian M Korea O    
34 KPGP-00144 East Asian M Korea O    
35 KPGP-00145 East Asian M Korea O    
36 KPGP-00205 East Asian M Korea O    
37 KPGP-00216  East Asian M Korea O    
38 KPGP-00219 East Asian F Korea O    
39 KPGP-00220 East Asian F Korea O    
40 KPGP-00221 East Asian M Korea O    
41 KPGP-00224 East Asian M Korea O    
42 KPGP-00227 East Asian F Korea O    
43 KPGP-00228 East Asian M Korea O    
44 KPGP-00229 East Asian M Korea O    
45 KPGP-00230 East Asian F Korea O    
46 KPGP-00231 East Asian F Korea O    
47 KPGP-00232 East Asian M Korea O    
48 KPGP-00233 East Asian F Korea O    
49 KPGP-00234 East Asian M Korea O    
50 KPGP-00235 East Asian F Korea O    
51 KPGP-00245 East Asian M Korea O  
52 KPGP-00246 East Asian F Korea    
53 KPGP-00247 East Asian M Korea    
54 KPGP-00248 East Asian F Korea    
55 KPGP-00252 East Asian F Korea O    
56 KPGP-00253 East Asian M Korea O    
57 KPGP-00254 East Asian M Korea O    
58 KPGP-00255 East Asian M Korea O    
59 KPGP-00256 East Asian M Korea O    
60 KPGP-00260 East Asian F Korea O    
61 KPGP-00265 East Asian M Korea O  
62 KPGP-00266 East Asian F Korea O  
63 KPGP-00267 East Asian F Korea    
64 KPGP-00269 East Asian M Korea O  
65 KPGP-00270 East Asian F Korea    
66 KPGP-00273 East Asian M Korea    
67 KPGP-00288 East Asian M Korea O    
68 KPGP-00316 East Asian M Korea    
69 KPGP-00317 East Asian M Korea O    
70 KPGP-00318 East Asian M Korea O    
71 KPGP-00319 East Asian M Korea O    
72 KPGP-00320 East Asian M Korea O    
73 KPGP-00321 East Asian M Korea O    
74 KPGP-00324 East Asian F Korea O    
75 KPGP-00325 East Asian M Korea O    
76 KPGP-00326 East Asian M Korea O    
77 KPGP-00327 East Asian M Korea O    
78 KPGP-00328 East Asian F Korea O    
79 KPGP-00329 East Asian F Korea O    
80 KPGP-00331 East Asian F Korea O    
81 KPGP-00332 East Asian M Korea O O  
82 KPGP-00333 East Asian M Korea O O  
83 KPGP-00334 East Asian F Korea O    
84 KPGP-00336 East Asian M Korea O    
85 KPGP-00337 East Asian M Korea O    
86 KPGP-00338 East Asian F Korea O    
87 KPGP-00339 East Asian M Korea O O  
88 KPGP-00340 East Asian F Korea O    
89 KPGP-00341 East Asian F Korea O    
90 KPGP-00342 East Asian F Korea O    
91 KPGP-00343 East Asian M Korea O    
92 KPGP-00344 East Asian M Korea O    
93 KPGP-00345 East Asian F Korea O    
94 KPGP-00346 East Asian M Korea O    
95 KPGP-00347 East Asian M Korea O    
96 KPGP-00348 East Asian F Korea O    
97 KPGP-00350 East Asian M Korea O    
98 KPGP-00351 East Asian M Korea O    
99 KPGP-00352 East Asian M Korea O    
100 KPGP-00353 East Asian M Korea O    
101 KPGP-00354 East Asian M Korea O    
102 KPGP-00356 East Asian F Korea O    
103 KPGP-00357 East Asian M Korea O    
104 KPGP-00358 East Asian M Korea O    
105 KPGP-00360 East Asian F Korea O    
106 KPGP-00361 East Asian M Korea O    
107 KPGP-00362 East Asian M Korea O    
108 KPGP-00363 East Asian M Korea O    
109 KPGP-00364 East Asian M Korea O    
110 KPGP-00370 East Asian M Korea O    
111 KPGP-00374 East Asian M Korea O    
112 KPGP-00375 East Asian F Korea O    

 

表1が、図2aと共に、決定的に重要で、
①男31名、女19名のDNA解析で、対象は5.5テラビット
②一塩基変異は、12,735,004(平均で3,813,311 )、
うち、SNPsのデータベースと共通が10,286,599
1000ゲノムプロジェクト共通が8,967,464

③コード領域の一塩基変異が、
平均でCoding SNVs=20,097
非同義変異が、平均で
Average No. of non-synonymous SNVs10,394


We identified approximately 20,097 (0.53%) SNVs and 258 (0.05%) indels in the coding regions including 10,394 (0.22%) non-synonymous changes per individual (Table 1).

koreangenome
In accordance with previous reports, the multidimensional scaling (MDS) of variants among Korean, Chinese, and Japanese individuals showed a clear separation of the three populations (Fig. S2) despite the geographical and historical associations between these groups35,37.

35は、
Lee, S. et al. Korean Variant Archive (KOVA): a reference database of genetic variations in the Korean population. Scientific reports 7, 4287, https://doi.org/10.1038/s41598-017-04642-4 (2017).

37は、
Cho, Y. S. et al. An ethnically relevant consensus Korean reference genome is a step towards personal reference genomes. Nature communications 7, 13637, https://doi.org/10.1038/ncomms13637 (2016).

両方とも読むこと!


koreangenome2
Novel KoVariome SNVs were counted by adding individual samples one by one (Fig. 1A), and the number of novel SNVs decreased logarithmically and became depleted after the 9th donor.

FDA論文と同様にやはり一部の者に集中して、朝鮮人固有のSNVsが異常なまでに多い!
変異総量自体は、全員が380万程度でばらつきはないが、FDAの論文では、「朝鮮人固有の変異」と表示、この論文では、Novel KoVariome SNVsと表記した朝鮮人特有のSNVs一塩基変異は、特定の者に驚くほど集中している。非同義変異の比率の高さとともに朝鮮人DNAの決め手となる特質である。

論文中では、多い順に並べると、9人目以降激減としているが、9人の男女別は、
1が女、2が男、6が男、32が女、33が男、39が女、56が男、86が女、88が男
で、女が4名、男が5名である。

①この9名は、少なくとも他のサンプルの2倍以上のNovel KoVariome SNVsを有している

②この論文では、50名中の9名=18%である。従って、実際には、2割近くが遺伝的におかしい連中であり、私の推定では、彼らのSNVこそが、韓国人の精神面の異常性の主原因だ!

Accuracy test of SNVs and indels in KoVariome

メモする必要なし

Genome-wide features of KoVariome

By merging the variants of 50 unrelated Korean individuals, we identified 12.7M SNVs and 1.7M small indels shorter than 100bp (Table 1); approximately 1.5 times the number of SNVs previously reported from preliminary KPGP data (8.5M)33

33は、FDA論文であり、この論文では、サンプル50名は、血縁のない者を選んでいる

Both types of variants were primarily distributed in the non-coding regions (about 98%), including intergenic and intron regions (Supplementary Table S6).
これは、当然である。

Approximately 10.3M (81.10%) SNVs and 1.3M (76.47%) indels were present in dbSNP (ver. 146); while 2.4M SNVs and 0.4M indels were novel (Table 1).

novelは、事実上、韓国人固有の変異と同じである

Most notably, 13,584 (0.15%) KoVariome SNVs were rarely observed in the 1000GP continental groups with a MAF < 0.1%.

同時に13584のSNVは、他の民族にはほとんど見られない。

Surprisingly, however, roughly half of the variants in 1000GP low frequency were classified as frequent in KoVariome.


This indicates that there exist a significant population specific biases for common and uncommon variants.

結果は、下の図にまとめられている


korean_abnormal
グラフAについての記述。commonは5%以上、 Low は0.1%以上、Rareは0.1%以下


(A) Two dimensional classification of KoVariome. SNVs and indels observed in 1000GP data were classified based on the minor allele frequencies (MAF); ’1000GP Common’: MAF >=5% in all five continents, ‘1000GP Low frequency’: MAF>=0.1% in any continent, and ‘1000GP Rare’; MAF < 0.1% in all five continents. The five continental populations included African (AFR), European (EUR), Native American (AMR), South Asian (SAS), and East Asian (EAS). The second group was classified by the number of variants in KoVariome; ‘Frequent in KoVariome’ (>=3) and ‘Rare in KoVariome’ (<3).


このデータは本当なのだろうか?1000ゲノムで0.1%~5%しかないLowの頻度が、韓国人では、44%程度もの高い頻度となっている。中国東北部中国人・日本人・韓国人のDNAの近接性からいって、考えにくい、どう解釈すればいいのか?????

当たり前であるが、1000ゲノムで0.1%以下のレアな変異は明らかに人類から削除せられるべき有害な変異である。(集団特性ではなく、個体の特性である)しかし、このデータが、本当なら、韓国人の場合には、個体の形質ではなく、集団の形質であることになる


When we compared the allele frequencies in five the continental 1000GP groups to KoVariome.


In total, we observed 3.4M (77.19%) SNVs and 0.2M (74.21%) indels that were statistically enriched in at least one of the continental groups or the Korean population (Fig. 2B), suggesting a population stratification.

Interpretation of the KoVariome-specific variants

In KoVariome, there were 3.8M SNVs and 0.9M indels not observed in the 1000GP variome (Supplementary Table S6).

A third of the 3.8M SNVs (1.1M, 29.16%), and 0.4M (40.88%) indels were classified as ‘frequent in KoVariome’ (Fig. 2A).

Of the 15,279 non-synonymous SNVs and 480 frame-shift indels specific to KoVariome, 11,746 (76.88%) and 397 (82.71%) were rare in KoVariome (n < 3), respectively; whereas 3,533 SNVs were frequently observed (occurring at least three times) in KoVariome but not observed in the 1000GP variome at all.

To identify the possible clinical relevance of these KoVariome-specific frequent variants,
上のように、韓国人固有のデータを列挙して表2でがん以外は知らない病気と頻度一覧

Genomic distribution of rare variants

We investigated the proportion of the SNVs in four SNV classes (1000GP Common, 1000GP Low Frequency, 1000GP Rare, KoVariome Specific; Supplementary Fig. S4).

Our analyses showed that a high portion of the coding SNVs were enriched in the ‘1000GP rare’ class, while the SNVs in the non-coding regions were similarly distributed in all other variant classes.

上記の記述を私は韓国人DNAの異常性を示すと受け止める、韓国人の変異は、コード領域=遺伝子に高い比率で生じており、かつ、1000ゲノムで0.1%以下しかない極めて稀な変異である

The portion of non-synonymous SNVs in the ‘1000GP rare’ class was more than twice what was observed in the other classes.

「1000ゲノムではほとんどない=0.1%以下の非同義変異が、他の分類よりも2倍も韓国人に多い」

It is possible that these patterns are associated with purifying selection to rapidly remove deleterious alleles in the population46,

「可能性としてありそうなのは、韓国人における有害遺伝子を急速に削除する負の自然淘汰がある。」
この言明は、完全に正しい。日本人でも同様の現象は確かに起こっている。しかし、韓国人の場合には、それが、量的にあまりにも多い。=集団としての特性に近い程多い。従って、少なくとも、現時点で、韓国人が、人類=1000ゲノムとの比較で稀に見る劣悪遺伝子集団であると、私は解するし、それで絶対に間違いない。問題なのは、この論文では、遺伝病との関係を追及しているが、本来は、韓国人の精神面との関係を追及すべきなだ。

46は、下記論文
Charlesworth, B., Morgan, M. T. & Charlesworth, D. The effect of deleterious mutations on neutral molecular variation. Genetics 134, 1289–1303 (1993).


To analyze the tendencies of purifying selection in KoVariome, we defined rare variant ratios (RVRs) as the number of SNVs in the ‘rare in KoVariome’ class divided by the number of SNVs in the ‘frequent in KoVariome’ class.

We then compared RVRs across genomic regions (Fig. 2C). In both SNVs and indels, RVRs in the intergenic region were lowest (0.66), while similar levels of RVRs were observed in other non-coding regions (0.66–0.87).

Under the assumption that mutations occur randomly throughout the genome, lower rates of RVR in non-coding regions suggest neutral selection with no or weak selection pressures in the population.

非コード領域では韓国人に稀な変異の比率が低いことから、中立論に基づく弱い自然淘汰圧力は、韓国人には、ないか、又は、それ自体が弱いとしている

Conversely, the highest RVR in frame-shift indels (1.45) suggests there was some purifying selection against these variants in the Korean population.

挿入欠失変異について、韓国人に稀な変異の比率が高いことから、負の自然淘汰が韓国人に働いている

Furthermore, about twice as many RVRs were observed in the non-synonymous (1.16) and splice-site (1.33) SNVs compared to intergenic regions.
遺伝子間領域に比べ非同義変異では、韓国人に稀な変異の比率は、約2倍であった

Although SNVs in the coding region can be deleterious to protein function, selection pressure on the non-synonymous and splice-site SNVs seem to be slightly lower than that of the frame-shift indels, as expected.

Interpretation of disease-causing variants among Korean individuals

割愛する。遺伝性疾患や疾患感受性遺伝子の韓国人固有頻度等々いろいろあろうが、韓国人の異常性は、この論文で書いているような肉体面ではなく、明らかに精神面に現れている。しかし、現在の集団遺伝学では、集団特性としての精神面は全く未解明である。

Structural variations in KoVariome

数値羅列のみで意味のある記述無し

Copy number variations in KoVariome

数値羅列のみで意味のある記述無し

結論

Using this database, we characterized all four variation types and identified 12.7M SNVs, 1.7M indels, 4K SVs, and 3.6K CNVs, many of which were novel or selectively enriched in the Korean population.

Despite their close geographic proximity, the Korean population was shown to be genetically distinct from the Chinese and Japanese populations, highlighting the need for a Korean-specific variome to accurately identify rare disease variants in this population.

Method

省略