GC含量
GC含量(GCがんりょう、GC-content)は、DNA分子中の窒素塩基のうちグアニンとシトシンの割合である[1]。また、この用語はDNAやRNAの特定の断片や、ゲノム全体に対しても用いられる。
構造
[編集]グアニン(G)はシトシン(C)と互いに特異的な水素結合を形成し、アデニン(A)はチミン(T)(RNAの場合はウラシル(U))と特異的な水素結合を形成する。GCからなる塩基対は3つの水素結合で結ばれているのに対し、ATまたはAUからなる塩基対が2つの水素結合で結ばれている。この差異を強調するために、塩基対は"G≡C"、"A=T"、"A=U"と表記されることも多い。
GC含量の高いDNAは低いものよりも安定しているが、この安定性は水素結合によるものではなく、主に塩基対のスタッキング相互作用によるものである[2]。GC塩基対は、環外官能基の相対配置のためにATやAU塩基対よりもスタッキングエネルギーが大きい。さらに、塩基がスタッキングする順序と分子全体としての熱安定性には強い相関が存在する[3]。
GC含量の高さは核酸に熱安定性を付与するが、一方で高いGC含量のDNAを含む一部の細菌はより容易に自己融解を起こし、そのため細胞の寿命自体が短くなることが観察されている[4]。GC塩基対の熱安定性のため、かつてはGC含量の高さは高温への適応に必要であると信じられてきたが、この仮説は反証された[5]。しかし同じ研究で、原核生物の至適生育温度の高さと(rRNA、tRNAや他のncRNAなどの)構造RNAのGC含量との間で強い相関が示された。近年初めて行われた、遺伝子を中心とした体系的な大規模相関分析によって、特定のゲノム部位についてのみGC含量と温度の間に相関が見られることが示された[6]。
PCRでは、プライマーのGC含量から相補DNAのアニーリング温度が予測される。高いGC含量を持つプライマーは、高いアニーリング温度を持つことが示唆される。
GC含量の決定
[編集]GC含量(%)は次のように計算される[7] 。
別の表現としてAT/GC比があり、次のように計算される[8]。
GC含量やGC比はさまざまな方法で測定可能であるが、最も単純な方法の1つに、分光測色法を用いたDNA二重らせんの「融点」の測定がある。DNAによる 260 nmの波長の吸光は、二本鎖DNAが十分に加熱されて一本鎖DNAに分離すると急激に増加する[9]。最も一般的に用いられている手法として、ATまたはGCのみに結合する蛍光色素を用いた、大量のDNAサンプルに対するフローサイトメトリーの利用がある[10]。
別の自明な方法として、DNAやRNAの塩基配列が決定されると、単純計算によりGC含量を正確に算出できる。
ゲノムのGC比
[編集]ゲノム内の差異
[編集]ゲノム中のGC比は領域によって顕著な差異が存在する。複雑な生物では、高GC比領域はモザイク状に点在し、アイソコアと呼ばれる"小島"状の領域を形成する[11]。これは、染色体の染色強度の違いに直接現れる[12]。GCに富むアイソコアは典型的にはタンパク質コード領域を多く含むため、こうした特定の領域のGC比の決定は、ゲノム中の遺伝子の多い領域をマッピングする際に有用である[13][14]。
コーディング配列
[編集]ゲノム配列を俯瞰すると、ゲノム全体のGC含量と比較して、タンパク質コード領域は高いGC含量を持つことがよく見られる。コード領域の長さがGC含量に正比例することを示す証拠も得られている[15]。終止コドンがアデニンとチミンに偏っているという理由から、配列が短いほどATバイアスは高くなる[16]。
ゲノム間の差異
[編集]ゲノムのGC含量は生物種によって異なり、進化過程における選択の差異、突然変異の偏り、組換えと関連したDNA修復時の偏りによって引き起こされると考えられている[17]。
ヒトゲノムの100kb断片のGC含量は35%から60%であり、平均値は41%である[18]。出芽酵母(Saccharomyces cerevisiae)は38%[19]、他の一般的なモデル生物であるシロイヌナズナ(Arabidopsis thaliana)は36%である[20]。遺伝暗号の性質のため、GC含量が0%や100%に近いゲノムを持つ生物は事実上不可能である。しかし、マラリア原虫Plasmodium falciparumは極端ににGC含量が低く(約20%)[21]、AT含量が多い(つまりGC含量が少ない)生物としてしばしば言及される[22]。
哺乳類のいくつかの種(トガリネズミ、ココウモリ、テンレック、ウサギなど)は、ゲノムのGC含量の顕著な増加が独立に生じている。こうしたGC含量の変化は、種の生活史に関する形質(体重や寿命など)やゲノムサイズと相関しており[23]、GC-biased gene conversion(GCに偏った遺伝子変換)と呼ばれる分子的現象と関係している可能性がある[24]。
分類学への応用
[編集]原核生物の分類学における種の定義の問題は、細菌の分類に関する様々な示唆を与え、ad hoc committee on reconciliation of approaches to bacterial systematicsは細菌の高次分類にGC比を用いることを勧告した[25]。例えば、放線菌は「高GC含量の細菌」として特徴づけられ[26]、その1種であるストレプトマイセス属のStreptomyces coelicolor A3(2)では72%である[27]。
出典
[編集]- ^ Definition of GC – content on CancerWeb of Newcastle University,UK
- ^ Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). “Base-stacking and base-pairing contributions into thermal stability of the DNA double helix”. Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200 .
- ^ Yakovchuk, Peter; Protozanova, Ekaterina; Frank-Kamenetskii, Maxim D. (2006). “Base-stacking and base-pairing contributions into thermal stability of the DNA double helix”. Nucleic Acids Research 34 (2): 564–574. doi:10.1093/nar/gkj454. ISSN 1362-4962. PMC 1360284. PMID 16449200 .
- ^ Levin RE, Van Sickle C (1976). “Autolysis of high-GC isolates of Pseudomonas putrefaciens”. Antonie Van Leeuwenhoek 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999.
- ^ Hurst LD, Merchant AR (March 2001). “High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes”. Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861 .
- ^ Zheng H, Wu H (December 2010). “Gene-centric association analysis for the correlation between the guanine-cytosine content levels and temperature range conditions of prokaryotic species”. BMC Bioinformatics 11: S7. doi:10.1186/1471-2105-11-S11-S7. PMC 3024870. PMID 21172057 .
- ^ Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 84-205-3679-2
- ^ Definition of GC-ratio on Northwestern University, IL, USA
- ^ Wilhelm J, Pingoud A, Hahn M (May 2003). “Real-time PCR-based method for the estimation of genome sizes”. Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322 .
- ^ Vinogradov AE (May 1994). “Measurement by flow cytometry of genomic AT/GC ratio and genome size”. Cytometry 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377.
- ^ Bernardi G (January 2000). “Isochores and the evolutionary genomics of vertebrates”. Gene 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893 .
- ^ Furey TS, Haussler D (May 2003). “Integration of the cytogenetic map with the draft human genome sequence”. Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172 .
- ^ Sumner AT, de la Torre J, Stuppia L (August 1993). “The distribution of genes on chromosomes: a cytological approach”. J. Mol. Evol. 37 (2): 117–22. doi:10.1007/BF02407346. PMID 8411200.
- ^ Aïssani B, Bernardi G (October 1991). “CpG islands, genes and isochores in the genomes of vertebrates”. Gene 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049.
- ^ Pozzoli U, Menozzi G, Fumagalli M, et al (2008). “Both selective and neutral processes drive GC content evolution in the human genome”. BMC Evol. Biol. 8: 99. doi:10.1186/1471-2148-8-99. PMC 2292697. PMID 18371205 .
- ^ Wuitschick JD, Karrer KM (1999). “Analysis of genomic G + C content, codon usage, initiator codon context and translation termination sites in Tetrahymena thermophila”. J. Eukaryot. Microbiol. 46 (3): 239–47. doi:10.1111/j.1550-7408.1999.tb05120.x. PMID 10377985.
- ^ Birdsell JA (1 July 2002). “Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution”. Mol. Biol. Evol. 19 (7): 1181–97. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137 .
- ^ International Human Genome Sequencing Consortium (Feb 2001). “Initial sequencing and analysis of the human genome”. Nature 409 (6822): 860–921. Bibcode: 2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011. (page 876)
- ^ “Saccharomyces cerevisiae S288c (ID 128) - BioProject - NCBI”. www.ncbi.nlm.nih.gov. 2020年6月20日閲覧。
- ^ “Arabidopsis thaliana (ID 116) - BioProject - NCBI”. www.ncbi.nlm.nih.gov. 2020年6月20日閲覧。
- ^ “Plasmodium falciparum 3D7 (ID 148) - BioProject - NCBI”. www.ncbi.nlm.nih.gov. 2020年6月20日閲覧。
- ^ “Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum”. Mem. Inst. Oswaldo Cruz 92 (6): 835–41. (1997). doi:10.1590/S0074-02761997000600020. PMID 9566216 .
- ^ Romiguier, Jonathan; Ranwez, Vincent; Douzery, Emmanuel J. P.; Galtier, Nicolas (2010-08-01). “Contrasting GC-content dynamics across 33 mammalian genomes: Relationship with life-history traits and chromosome sizes” (英語). Genome Research 20 (8): 1001–1009. doi:10.1101/gr.104372.109. ISSN 1088-9051. PMC 2909565. PMID 20530252 .
- ^ “Biased gene conversion and the evolution of mammalian genomic landscapes”. Annu Rev Genom Hum Genet 10: 285–311. (2009). doi:10.1146/annurev-genom-082908-150001. PMID 19630562.
- ^ Wayne LG, et al (1987). “Report of the ad hoc committee on reconciliation of approaches to bacterial systematic”. International journal of systematic bacteriology 37 (4): 463–4. doi:10.1099/00207713-37-4-463.
- ^ “Taxonomy browser (Actinobacteria)”. www.ncbi.nlm.nih.gov. 2020年6月20日閲覧。
- ^ “Streptomyces coelicolor A3(2) strain:A3(2) (ID 242) - BioProject - NCBI”. www.ncbi.nlm.nih.gov. 2020年6月20日閲覧。