Nature Communications 14권, 기사 번호: 249(2023) 이 기사 인용
2990 접속
1 인용
27 알트메트릭
측정항목 세부정보
독은 많은 독성 단백질의 발현에 작용하는 강력한 선택압으로 인해 상당한 종간 및 종내 가변성을 갖는 복잡한 특성입니다. 그러나 독의 표현형을 결정하는 독소 발현 역학의 기본 과정을 이해하는 것은 아직 해결되지 않은 상태입니다. 종간 비교를 통해 우리는 말미잘의 독소 발현이 빠르게 진화하고 각 종에서 서로 다른 독소군이 대규모 유전자 복제 사건을 통해 독 표현형을 결정한다는 사실을 밝힙니다. 말미잘인 Nematostella vectensis에 대한 심층 분석에서는 뚜렷한 일배체형을 생성하는 독립적인 확장/수축 이벤트로 인해 개체군(1-24개 복사본)에 걸쳐 지배적인 독소(Nv1) 이배체 복사본 수의 놀라운 변화가 밝혀졌습니다. Nv1 카피 수는 Nv1 생산이 거의 완전히 손실된 한 집단과 함께 전사체 및 단백질 수준 모두에서의 발현과 상관관계가 있습니다. 마지막으로, 우리는 동물들이 독을 형성하는 데 있어 유사한 전략을 수렴적으로 진화시켰다는 다른 독 계통의 관찰을 통합하는 지배적인 독소 가설을 확립했습니다.
소진화와 대진화 사이의 연관성을 밝히려면 종, 개체군, 개체 간의 표현형 다양성을 촉진하는 분자 과정을 이해하는 것이 필수적입니다. 대부분의 특성은 다유전적입니다. 즉, 표현형은 여러 게놈 유전자좌의 영향을 받습니다1,2,3,4,5. 그러나 이러한 복잡한 특성의 유전성을 이해하는 것은 어렵습니다. 유전자 발현은 유전자가 다유전적 특성에 미치는 영향 유형을 결정하는 데 필수적인 특징일 가능성이 높습니다. 이는 종 내 및 종 간 표현형 변이에 기여하는 유전적 유전자 발현 역학에서 분명합니다6,7. 시스 및 트랜스 조절 요소에 대한 돌연변이8,9, 후생적 변형7,10,11 및 유전자 복제12,13,14를 포함하여 이러한 유전자 발현 역학을 구동하는 메커니즘은 적응 특성을 초래할 수 있는 선택적 압력의 영향을 받습니다. 유기체에서.
유전자 발현 역학의 급속한 변화를 촉진할 수 있는 메커니즘 중에는 유전자 복제가 있는데, 이는 전사체 풍부도의 증가를 유발하여 종 내 및 종 간 표현형 변이를 초래할 수 있습니다. 복제 수 변이(CNV)를 초래하는 유전자 복제는 복제 슬리피지, 감수분열 중 불평등 교차, 유전자 전사체의 역위치 및 전체 게놈 중복의 조합으로 인해 발생할 수 있습니다15,16. 다양화를 통해 작용할 분자 진화의 기질을 제공하는 것 외에도, 유전자 복제로 인해 발생하는 CNV는 복용량을 통해 유전자 발현이 증가하여 즉각적인 건강 효과를 일으킬 수 있습니다17. 실제로, 즉각적인 표현형 효과의 가능성과 복제된 유전자의 높은 돌연변이율은 CNV가 새로운 생태학적 틈새에 대한 신속한 적응을 위한 중요한 메커니즘일 수 있음을 시사합니다. CNV는 주로 인간 유전 질환과 최근 적응의 맥락에서 연구되지만18,19,20 다른 종의 생태학적 및 진화 과정에서 개인 및 인구 규모 CNV의 역할과 복잡한 특성에 미치는 영향에 대한 인식이 증가하고 있습니다21, 22,23.
강력한 선택 압력 하에서 진화한다고 가정되는 복잡한 특성은 포식 및 방어와 관련된 필수적인 생태학적 역할로 인해 독입니다. 독 표현형은 여러 독소를 코딩하는 유전자의 조화로운 발현에 의존하기 때문에 종종 복잡한 특성입니다. 이러한 독소는 결합되어 매우 뚜렷하고 종 내에서 그리고 종 간에 크게 달라지는 독 프로필을 생성합니다26,27. 종간 독소 유전자 발현의 차이가 독 표현형의 급속한 진화에 주요 원인이라는 증거가 뒷받침됩니다. 독소 유전자군은 적응 진화의 출생 및 사망 모델을 통해 진화하는 것으로 가정되었습니다. 왜냐하면 이러한 단백질은 영양과 생존을 위한 상호 작용을 중재하는 개인의 적합성에 핵심이기 때문입니다24,25. 비교 유전체학은 많은 독이 있는 유기체가 게놈에 유전자 중복을 빠르게 축적한다는 가설을 뒷받침하는 증거를 보여주었습니다. 예로는 거미(30,31), 원추 달팽이(32) 및 전갈(33)이 있지만 과부 거미(34)와 같은 예외는 있습니다.
95% at nodes. B Representative images of the three sea anemone superfamilies included in the phylotranscriptomic analyses (Edwardsioidea—N. vectensis; Actinioidea—Aulactinia veratra; Metridioidea—Calliactis polypus). Actinioidea and Metridioidea photos courtesy of Peter Prentis. C Models of trait evolution fitted to toxin expression highlights that pulsed evolutionary process best describes sea anemone venom evolution. Model of best fit highlighted in color based on weighted AIC and are colored according to the toxin family key in panel A. See Supplementary Data 1 for species code and reference./p>50% of the total toxin expression (Supplementary Data 2). During diversification of Actinioidea, ASR suggests that KTx3 evolved to become the dominant toxin family. The KTx3 family is the dominant toxin family in 10 of the 17 Actinioidea species, with Actinoporin, KTx1, and KTx2 dominant in four, one and two species, respectively. Outside of Actinioidea, the Edwardsiid Scolanthus callimorphus Gosse, 1853 convergently evolved to have KTx3 as the dominant toxin. These shifts in the dominant toxin can be explained by a model of punctuated evolution53,54. We tested this by modeling the rates of evolution acting on the expression of toxins. We find evidence that all sea anemone venom components undergo dramatic and unique shifts that is best explained through a mode of rapid pulses (Pulsed) as opposed to Brownian motion (BM), Ornstein–Uhlenbeck (OU), or early burst (EB) models (Fig. 1C)./p>90%, except for Massachusetts (Supplementary Data 10, BUSCO = 72.2%). In all, 2589 single-copy orthologs were identified using OrthoFinder and used to generate a well-supported maximum-likelihood phylogenetic tree (Fig. 4B). Broadly, populations clustered according to geographical location, with populations from North (Massachusetts, Maine, New Hampshire, New Jersey, and Nova Scotia) and South (North Carolina, South Carolina, and Florida) clustering independently together. This phylogenetic analysis also supports that the Maryland population, which serves as the source for the most common N. vectensis lab strain61, clusters more closely with southern populations, consistent with the previous analyses62. Differences among populations from close geographical locations are also observed, specifically with South Carolina populations clustering more closely with Florida than North Carolina./p>2, red dots are proteins with significant P value and Log2 fold change./p>500, while Florida had a TPM of five (Supplementary Data 11A). Expression differences of Nv1 among populations were further validated using nCounter platform, revealing that indeed Nv1 gene expression is massively reduced in the Florida population (Supplementary Data 11B). This striking result suggests that the Nv1 cluster in Florida has undergone a massive contraction./p>50% of the total conotoxin expression69. These dominant toxin superfamilies convergently evolve in a highly dynamic manner, where closely-related species have different dominant toxins69. From these results, we suggest that given venom is a polygenic trait in many other venomous animals, a single dominant toxin family is the major dictator of the venom phenotype and the shift in the dominant toxin is likely driven by selection to meet the ecological requirements of these animals./p>300 bp. In snakes, transposable elements have been proposed as the NAHR substrate90,91; however, this does not appear to be the case for the Nv1 locus as TEs are largely absent from within the Nv1 locus. If NAHR is the mechanism driving the expansion and contraction of the Nv1 haplotypes, it is unclear why it would not occur across haplotypes because sufficient NAHR substrate is evident between haplotypes despite the presence of haplotype-specific paralogs. An alternative hypothesis would be that expansions and contractions at the locus are a result of backward replication slippage92. We suggest that this mechanism is more likely responsible for the tandem duplications at the Nv1 locus as there is the sufficient substrate, the duplication sizes are consistent with past observations of replication slippage, and importantly, would maintain the strong haplotype structure./p> 2.2100). This included individual reads being mapped back to reference de novo transcriptome assemblies independently for each species using Bowtie2101, and abundance estimated using RSEM102. Normalized abundance estimates of the transcript were calculated and corrected for their length to generate TPM values. Finally, we calculated the cumulative TPM values for each toxin family and the venom phenotype was generated as the percentage that each family contributes./p>100 amino acids in length were retained and redundant sequences with >88% similarity were removed to produce a predicted proteome for the 29 transcriptomes using CD-HIT103./p> 8). Sequencing libraries were prepared using the Kapa Stranded mRNA-seq kit (Roche, Switzerland) and sequenced on an Illumina HiSeq 4000 using 150 bp paired-end chemistry performed at Duke Center for Genomic and Computational Biology (Durham, NC, USA). Raw reads from each population were cleaned using Trimmomatic94 to retain only high-quality reads and to remove non-biological sequence and assembled into nine transcriptomes using the Trinity 2.6.695. To assess the completeness of de novo transcriptomes, BUSCO (v3.0) was performed on each transcriptome to assess the completeness of each assembly, by determining the percentage of full-length sequences in each transcriptome corresponding to a conserved set of metazoan orthologs114./p>88% sequence similarity were removed using CD-HIT103. Protein sequences >100 amino acids in length were used to identify single-copy orthologs using OrthoFinder115 and leveraged using DIAMOND116. In addition, we added S. callimorphus and Edwardsiella carnea as outgroups to the N. vectensis populations. This resulted in 2589 single-copy orthologs shared among the 11 transcriptomes. Protein sequences for each single-copy ortholog were individually aligned using MAFFT99. Protein alignments were then concatenated and imported into IQ-TREE, and the best-fit model of evolution selected using ModelFinder106, and posterior mean site frequency models were used to reduce long-branch attraction artefacts117. A maximum-likelihood phylogenetic tree was generated using 1000 ultrafast bootstrap iterations./p>