Salamat sa pagbisita sa Nature.com.Naggamit ka usa ka bersyon sa browser nga adunay limitado nga suporta sa CSS.Alang sa labing kaayo nga kasinatian, among girekomenda nga mogamit ka usa ka bag-ong browser (o i-disable ang Compatibility Mode sa Internet Explorer).Dugang pa, aron masiguro ang padayon nga suporta, gipakita namon ang site nga wala’y mga istilo ug JavaScript.
Ang mga slider nga nagpakita sa tulo ka mga artikulo matag slide.Gamita ang likod ug sunod nga mga buton sa paglihok sa mga slide, o ang slide controller nga mga buton sa katapusan aron sa paglihok sa matag slide.
Detalyadong paghulagway sa produkto
304 Stainless steel welded coiled tube / tubing
1. Pagtino: Stainless steel coil tube / tubing
2. Type: welded o seamless
3. Standard: ASTM A269, ASTM A249
4. Stainless steel coil tube OD: 6mm ngadto sa 25.4MM
5. Gitas-on: 600-3500MM o sumala sa gikinahanglan sa customer.
6. Gibag-on sa dingding: 0.2mm hangtod 2.0mm.
7. Pagkamatugtanon: OD: +/-0.01mm;Gibag-on: +/-0.01%.
8. Ang gidak-on sa sulod nga lungag sa coil: 500MM-1500MM (mahimong i-adjust sumala sa mga kinahanglanon sa customer)
9. Coil gitas-on: 200MM-400MM (mahimong i-adjust sumala sa mga kinahanglanon sa customer)
10. Nawong: Mahayag o annealed
11. Materyal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, haluang metal 625, 825, 2205, 2507, ug uban pa.
12. Pagputos: hinabol nga mga bag sa kahoy nga kaso, kahoy nga pallet, kahoy nga shaft, o sumala sa gikinahanglan sa kustomer
13. Pagsulay: sangkap sa kemikal, kusog sa ani, kusog sa tensile, pagsukod sa katig-a
14. Garantiya: Ang ikatulo nga partido (pananglitan: SGS TV ) inspeksyon, ug uban pa.
15. Aplikasyon: Dekorasyon, muwebles, transportasyon sa lana, tigbaylo sa init, paghimo sa rehas, paghimo sa papel, awto, pagproseso sa pagkaon, medikal, ug uban pa.
Tanan nga Komposisyon sa Kemikal ug Pisikal nga Katangian alang sa Stainless Steel sama sa ubos:
Materyal nga | ASTM A269 Kemikal nga Komposisyon % Max | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-11.0 | ^ | ^ | ^ . | ^ |
TP304L | 0.035 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0-20.0 | 8.0-12.0 | ^ | ^ | ^ | ^ |
TP316 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0.035 D | 2.00 | 0.045 | 0.030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C -0.70 |
TP347 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C -1.10 | ^ |
Materyal nga | Pagtambal sa init | Temperatura F (C) Min. | Katig-a | |
Brinell | Rockwell | |||
TP304 | Solusyon | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Solusyon | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Solusyon | 1900(1040) | 192HBW/200HV | 90HRB |
TP316L | Solusyon | 1900(1040) | 192HBW/200HV | 90HRB |
TP321 | Solusyon | 1900(1040) F | 192HBW/200HV | 90HRB |
TP347 | Solusyon | 1900(1040) | 192HBW/200HV | 90HRB |
OD, pulgada | OD tolerance pulgada (mm) | WT tolerance % | Gitas-on Tolernace pulgada (mm) | |
+ | - | |||
≤ 1/2 | ± 0.005 ( 0.13 ) | ± 15 | 1 / 8 ( 3.2 ) | 0 |
> 1 / 2 ~ 1 1 / 2 | ± 0.005(0.13) | ± 10 | 1 / 8 (3.2) | 0 |
> 1 1 / 2 ~< 3 1 / 2 | ± 0.010(0.25) | ± 10 | 3 / 16 (4.8) | 0 |
> 3 1 / 2 ~< 5 1 / 2 | ± 0.015(0.38) | ± 10 | 3 / 16 (4.8) | 0 |
> 5 1 / 2 ~< 8 | ± 0.030(0.76) | ± 10 | 3 / 16 (4.8) | 0 |
8~< 12 | ± 0.040(1.01) | ± 10 | 3 / 16 (4.8) | 0 |
12~< 14 | ± 0.050(1.26) | ± 10 | 3 / 16 (4.8) | 0 |
Ang natural nga microbial nga mga komunidad kay phylogenetically ug metabolically lainlain.Dugang pa sa mga wala matun-i nga mga grupo sa mga organismo1, kini nga pagkalainlain adunay daghang potensyal alang sa pagdiskobre sa ekolohikal ug bioteknolohiya nga hinungdanon nga mga enzyme ug biochemical compound2,3.Bisan pa, ang pagtuon niini nga pagkalainlain aron mahibal-an ang genomic nga mga agianan nga nag-synthesize sa ingon nga mga compound ug nagbugkos niini sa ilang tagsa-tagsa nga mga host nagpabilin nga usa ka hagit.Ang biosynthetic nga potensyal sa mga microorganism sa bukas nga kadagatan nagpabilin nga wala mahibal-an tungod sa mga limitasyon sa pag-analisar sa tibuuk nga datos sa resolusyon sa genome sa tibuuk kalibutan.Dinhi, among gisuhid ang pagkadaiya ug pagkadaiya sa biosynthetic gene clusters sa kadagatan pinaagi sa pag-integrate sa mga 10,000 ka microbial genome gikan sa cultured cells ug single cells nga adunay labaw sa 25,000 ka bag-ong natukod pag-usab nga draft genome gikan sa kapin sa 1,000 ka sample sa tubig sa dagat.Kini nga mga paningkamot nakaila sa mga 40,000 ka kasagaran nga bag-ong biosynthetic gene clusters, ang uban niini nakit-an sa kaniadto wala'y gidudahang phylogenetic nga mga grupo.Sa kini nga mga populasyon, nahibal-an namon ang usa ka linya nga gipadato sa biosynthetic gene clusters ("Candidatus Eudormicrobiaceae") nga nahisakop sa usa ka wala maugmad nga bacterial phylum ug gilakip ang pipila sa labing biosynthetically diverse nga microorganism sa kini nga palibot.Niini, among gihulagway ang phosphatase-peptide ug pytonamide nga mga agianan, nga nagpaila sa mga higayon sa dili kasagaran nga bioactive compound nga istruktura ug enzymology, matag usa.Sa konklusyon, kini nga pagtuon nagpakita kung giunsa nga ang mga estratehiya nga nakabase sa microbiome makahimo sa pagsuhid sa kaniadto nga wala mahibal-an nga mga enzyme ug natural nga mga pagkaon sa usa ka dili kaayo masabtan nga microbiota ug palibot.
Ang mga mikrobyo nagduso sa tibuok kalibutan nga biogeochemical cycle, nagmintinar sa food webs, ug nagpahimsog sa mga tanom ug mananap5.Ang ilang dako nga phylogenetic, metabolic ug functional diversity nagrepresentar sa usa ka adunahan nga potensyal alang sa pagdiskobre sa bag-ong taxa1, enzymes ug biochemical compounds, lakip na ang natural nga mga produkto6.Sa mga komunidad sa ekolohiya, kini nga mga molekula naghatag sa mga microorganism nga adunay lainlaing mga gimbuhaton sa pisyolohikal ug ekolohikal, gikan sa komunikasyon hangtod sa kompetisyon 2, 7.Dugang pa sa ilang orihinal nga mga gimbuhaton, kini nga mga natural nga produkto ug ang ilang genetically coded nga mga agianan sa produksiyon naghatag mga pananglitan alang sa biotechnological ug therapeutic nga aplikasyon2,3.Ang pag-ila sa ingon nga mga agianan ug koneksyon labi nga gipadali pinaagi sa pagtuon sa mga kultura nga mikrobyo.Bisan pa, ang mga pagtuon sa taxonomic sa natural nga palibot nagpakita nga ang kadaghanan sa mga microorganism wala pa naugmad8.Kining kultural nga bias naglimite sa atong abilidad sa pagpahimulos sa functional diversity nga gi-encode sa daghang microbes4,9.
Aron mabuntog kini nga mga limitasyon, ang mga pag-uswag sa teknolohiya sa milabay nga dekada nagtugot sa mga tigdukiduki nga direkta (ie, walay naunang kultura) pagsunud sa microbial nga mga tipik sa DNA gikan sa tibuok komunidad (metagenomics) o usa ka selula.Ang abilidad sa pag-assemble niini nga mga tipik ngadto sa mas dagkong mga tipik sa genome ug pagtukod pag-usab sa daghang metagenomically assembled genomes (MAGs) o single amplified genomes (SAGs), matag usa, nagbukas sa usa ka importante nga oportunidad alang sa taxocentric nga mga pagtuon sa microbiome (ie, microbial nga mga komunidad ug ang microbiome).paghimo og bag-ong mga dalan.kaugalingon nga genetic nga materyal sa usa ka gihatag nga palibot) 10,11,12.Sa tinuud, ang mga bag-ong pagtuon labi nga nagpalapad sa representasyon sa phylogenetic sa pagkalainlain sa microbial sa Earth1, 13 ug gipadayag ang kadaghanan sa pagkalainlain sa paggana sa indibidwal nga mga komunidad sa microbial nga wala kaniadto nasakup sa mga kultura nga microorganism reference genome sequences (REFs)14.Ang katakus sa pagbutang sa wala mahibal-an nga pagkalainlain sa pag-andar sa konteksto sa host genome (ie, resolusyon sa genome) hinungdanon alang sa pagtagna nga wala pa mailhi nga mga linya sa microbial nga lagmit nag-encode sa mga bag-ong natural nga produkto15,16 o alang sa pagsubay sa ingon nga mga compound balik sa ilang orihinal nga prodyuser17.Pananglitan, ang usa ka hiniusa nga metagenomic ug single-cell genomic analysis nga pamaagi misangpot sa pag-ila sa Candidatus Entotheonella, usa ka grupo sa mga metabolikong dato nga bakterya nga may kalabutan sa espongha, isip mga prodyuser sa nagkalain-laing potensyal sa droga18.Bisan pa, bisan pa sa bag-o nga mga pagsulay sa genomic nga eksplorasyon sa lainlaing mga komunidad sa microbial, 16,19 kapin sa dos-tersiya sa global nga metagenomic nga datos alang sa pinakadako nga kadagatan sa ekosistema sa Yuta16,20 ang wala pa.Busa, sa kinatibuk-an, ang biosynthetic nga potensyal sa marine microbiome ug ang potensyal niini isip usa ka repositoryo sa nobela nga enzymatic ug natural nga mga produkto nagpabilin nga wala kaayo matun-an.
Aron masusi ang biosynthetic nga potensyal sa marine microbiome sa usa ka global nga sukod, una namon nga gipundok ang mga marine microbial genome nga nakuha gamit ang mga pamaagi nga nagsalig sa kultura ug dili kultura aron makahimo usa ka halapad nga database sa phylogenetics ug function sa gene.Ang pagsusi sa kini nga database nagpadayag sa usa ka halapad nga lainlain nga biosynthetic gene clusters (BGCs), kadaghanan niini nahisakop sa wala pa mailhi nga gene cluster (GCF) nga mga pamilya.Dugang pa, nahibal-an namon ang usa ka wala mailhi nga pamilya sa bakterya nga nagpakita sa labing kataas nga nahibal-an nga pagkalainlain sa mga BGC sa bukas nga kadagatan hangtod karon.Gipili namo ang duha ka ribosomal synthesis ug post-translationally modified peptide (RiPP) nga mga agianan alang sa eksperimento nga pag-validate base sa ilang genetic nga mga kalainan gikan sa kasamtangan nga nailhan nga mga agianan.Ang functional characterization sa kini nga mga agianan nagpadayag sa wala damha nga mga pananglitan sa enzymology ingon man usab sa dili kasagaran nga istruktura nga mga compound nga adunay kalihokan sa pagpugong sa protease.
Sa sinugdan, gitumong namo ang paghimo ug global data resource para sa genome analysis, nga nagtutok sa bacterial ug archaeal components niini.Niini nga katuyoan, among gipundok ang metagenomic data ug 1038 ka mga sampol sa tubig-dagat gikan sa 215 ka globally distributed sampling sites (latitude range = 141.6°) ug pipila ka lawom nga mga layer (gikan sa 1 ngadto sa 5600 m ang giladmon, nga naglangkob sa pelagic, mesopelagic ug abyssal zones).Background21,22,23 (Fig. 1a, extended data, Fig. 1a ug Supplementary Table 1).Dugang pa sa paghatag sa usa ka halapad nga geographic nga coverage, kini nga mga pinili nga sinala nga mga sample nagtugot kanamo sa pagtandi sa nagkalain-laing mga sangkap sa marine microbiome, lakip ang virus-rich (<0.2 μm), prokaryotic-rich (0.2-3 μm), particle-rich (0.8 μm). ).–20 µm) ug mga kolonya nga nahurot sa virus (>0.2 µm).
a, Usa ka kinatibuk-an nga 1038 nga magamit sa publiko nga mga genome (metagenomics) sa mga komunidad sa microbial sa dagat nga nakolekta gikan sa 215 nga mga lokasyon nga giapod-apod sa tibuuk kalibutan (62 ° S hangtod 79 ° N ug 179 ° W hangtod 179 ° E.).Mga tile sa mapa © Esri.Mga Tinubdan: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, ug Esri.b, kini nga mga metagenome gigamit sa pagtukod pag-usab sa mga MAG (mga pamaagi ug dugang nga impormasyon), nga lahi sa gidaghanon ug kalidad (mga pamaagi) sa mga dataset (gimarkahan sa kolor).Ang natukod pag-usab nga mga MAG gidugangan sa publiko nga magamit (gawas) nga mga genome, lakip ang hinimo sa kamot nga MAG26, SAG27 ug REF.27 Compile OMD.c, kon itandi sa miaging mga taho nga gibase lamang sa SAG (GORG)20 o MAG (GEM)16, ang OMD nagpalambo sa genomic nga kinaiya sa marine microbial nga mga komunidad (metagenomic read mapping rate; method) sa duha ngadto sa tulo ka beses nga adunay mas makanunayon nga representasyon sa giladmon ug latitud..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, ang OMD nga paggrupo ngadto sa lebel sa mga pungpong sa espisye (95% mean nucleotide identity) nagpaila sa total nga gibana-bana nga 8300 ka mga espisye, labaw pa sa katunga niini wala pa kaniadto gihulagway sumala sa taxonomic annotation gamit ang GTDB (bersyon 89) e, klasipikasyon sa mga espisye pinaagi sa genome type nagpakita nga ang MAG, SAG ug REFs nagsangkap og maayo sa usag usa sa pagpakita sa phylogenetic diversity sa ang microbiome sa dagat.Sa partikular, 55%, 26% ug 11% sa mga espisye ang espesipiko alang sa MAG, SAG ug REF, matag usa.BATS, Bermuda Atlantic Time Series;GEM, mga genome sa microbiome sa Yuta;GORG, global ocean reference genome;HOT, Hawaiian Ocean nga serye sa panahon.
Gamit kini nga dataset, among gitukod pag-usab ang total nga 26,293 MAGs, kasagaran bacterial ug archaeal (Fig. 1b ug expanded data, Fig. 1b).Gibuhat namo kini nga mga MAG gikan sa mga asembliya gikan sa bulag imbes nga gipundok nga metagenomic nga mga sample aron mapugngan ang pagkahugno sa natural nga pagkasunod-sunod nga kalainan tali sa mga sample gikan sa lain-laing mga lokasyon o mga punto sa oras (pamaagi).Dugang pa, gigrupo namo ang mga genomic fragment base sa ilang prevalence correlations sa daghang mga sample (gikan sa 58 ngadto sa 610 samples, depende sa survey; method).Among nakaplagan nga kini usa ka makagugol sa panahon apan importante nga lakang24 nga gilaktawan sa daghang dagkong MAG16, 19, 25 nga mga buhat sa pagtukod pag-usab ug makapauswag sa gidaghanon (2.7-pilo sa aberids) ug kalidad (+ 20% sa aberids) sa genome.natukod pag-usab gikan sa marine metagenome nga gitun-an dinhi (gipadako nga datos, Fig. 2a ug dugang nga impormasyon).Sa kinatibuk-an, kini nga mga paningkamot miresulta sa usa ka 4.5-pilo nga pagtaas sa marine microbial MAGs (6-pilo kung hatag-as lamang nga kalidad nga MAGs ang gikonsiderar) kumpara sa labing komprehensibo nga kapanguhaan sa MAG nga magamit karon16 (Mga Pamaagi).Kining bag-ong gibuhat nga MAG set gihiusa dayon sa 830 ka pinili nga MAG26s, 5969 SAG27s ug 1707 REFs.Kaluhaan ug pito ka espisye sa marine bacteria ug archaea ang naglangkob sa usa ka combinatorial collection sa 34,799 ka genome (Fig. 1b).
Among gisusi dayon ang bag-ong nahimo nga kapanguhaan aron mapauswag ang abilidad niini sa pagrepresentar sa mga komunidad sa microbial sa dagat ug pagtimbang-timbang sa epekto sa paghiusa sa lainlaing mga tipo sa genome.Sa kasagaran, among nakit-an nga kini naglangkob sa gibana-bana nga 40-60% sa marine metagenomic data (Figure 1c), duha ngadto sa tulo ka pilo sa coverage sa miaging MAG-only nga mga taho sa duha ka giladmon ug latitude More serial 16 o SAG20.Dugang pa, aron sistematikong pagsukod sa taxonomic diversity sa natukod nga mga koleksyon, among gi-annotate ang tanang genome gamit ang Genome Taxonomy Database (GTDB) toolkit (pamaagi) ug migamit ug average nga genome-wide nucleotide identity nga 95%.28 sa pag-ila sa 8,304 ka espisye nga clusters (species).Dos-tersiya niini nga mga espisye (lakip ang bag-ong mga clades) wala pa makita kaniadto sa GTDB, diin ang 2790 nadiskobrehan gamit ang MAG nga gitukod pag-usab niini nga pagtuon (Fig. 1d).Dugang pa, nahibal-an namon nga ang lainlaing mga lahi sa genome labi ka komplementaryo: 55%, 26%, ug 11% sa mga espisye gilangkuban sa tibuuk nga MAG, SAG, ug REF, matag usa (Fig. 1e).Dugang pa, gitabonan sa MAG ang tanang 49 ka matang nga makita sa kolum sa tubig, samtang ang SAG ug REF nagrepresentar lamang sa 18 ug 11 niini, matag usa.Bisan pa, ang SAG mas maayo nga nagrepresentar sa pagkalainlain sa labing kasagaran nga mga clades (gipadako nga datos, Fig. 3a), sama sa Pelagic Bacteriales (SAR11), nga adunay SAG nga naglangkob sa hapit 1300 nga mga espisye ug MAG 390 lamang nga mga espisye.Talagsaon, ang mga REF panagsa ra nga nagsapaw sa mga MAG o SAG sa lebel sa espisye ug nagrepresentar sa> 95% sa gibana-bana nga 1000 nga mga genome nga wala makit-an sa bukas nga kadagatan nga metagenomic set nga gitun-an dinhi, labi na tungod sa mga interaksyon sa ubang mga lahi sa nahilit nga representante nga mga espesimen sa dagat (eg mga sediment) .o host-associate).Aron kini kaylap nga magamit sa siyentipikanhong komunidad, kining marine genome nga kapanguhaan, nga naglakip usab sa wala maklasipikar nga mga tipik (pananglitan, gikan sa gitagna nga mga phage, genomic nga mga isla, ug genome fragment diin walay igo nga datos alang sa MAG reconstruction), mahimong itandi sa taxonomic data .Pag-access sa mga anotasyon kauban ang function sa gene ug mga parameter sa konteksto sa Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Nagpadayon kami sa pag-usisa sa kadato ug kabag-ohan sa potensyal nga biosynthetic sa bukas nga mga microbiome sa kadagatan.Sa kini nga katuyoan, una namong gigamit ang antiSMASH alang sa tanan nga MAG, SAG, ug REF nga nakit-an sa 1038 marine metagenomes (pamaagi) aron matagna ang kinatibuk-an nga 39,055 BGCs.Gi-grupo namo kini ngadto sa 6907 non-redundant GCFs ug 151 gene cluster populations (GCCs; Supplementary Table 2 ug mga pamaagi) aron i-account ang natural nga redundancy (ie, ang parehas nga BGC mahimong ma-encode sa daghang genome) ug metagenomic data Fragmentation sa concentrated BGCs.Ang dili kompleto nga mga BGC wala kaayo mitaas, kung aduna man (Supplementary Information), ang gidaghanon sa mga GCF ug GCC, matag usa, nga adunay labing menos usa ka wala'y sulod nga miyembro sa BGC sa 44% ug 86% sa mga kaso.
Sa lebel sa GCC, nakit-an namon ang daghang lainlain nga gitagna nga mga RiPP ug uban pang natural nga mga produkto (Fig. 2a).Lakip kanila, pananglitan, ang mga arylpolyene, carotenoids, ectoines, ug siderophores iya sa GCCs nga adunay halapad nga phylogenetic distribution ug taas nga kadagaya sa oceanic metagenomes, nga mahimong nagpaila sa usa ka halapad nga pagpahiangay sa mga microorganism ngadto sa marine environment, lakip ang resistensya sa reactive oxygen species, oxidative ug osmotic stress..o iron absorption (dugang impormasyon).Kini nga functional diversity sukwahi sa usa ka bag-o nga pagtuki sa gibana-bana nga 1.2 ka milyon nga BGCs taliwala sa gibana-bana nga 190,000 nga mga genome nga gitipigan sa NCBI RefSeq database (BiG-FAM/RefSeq, human niini gitawag nga RefSeq)29, nga nagpakita nga ang nonribosomal Synthetase peptides (NRPS) ug polyketide synthase (PKS) BGCs (Supplementary Information).Nakit-an usab namo ang 44 (29%) GCCs nga layo ra nga may kalabutan sa bisan unsang RefSeq BGC (\(\bar{d}\)RefSeq> 0.4; Fig. 2a ug mga pamaagi) ug 53 (35%) GCCs lamang sa MAG, nga nagpasiugda sa potensyal aron makit-an ang wala pa mahulagway nga mga kemikal sa OMD.Gihatag nga ang matag usa niini nga mga GCC lagmit nagrepresentar sa labi ka lainlain nga biosynthetic nga mga gimbuhaton, labi namon nga gisusi ang datos sa lebel sa GCF sa paningkamot nga mahatagan ang usa ka mas detalyado nga paggrupo sa mga BGC nga gitagna nga mag-code alang sa parehas nga natural nga mga produkto29.Usa ka kinatibuk-an nga 3861 (56%) nga giila nga mga GCF wala mag-overlap sa RefSeq, ug> 97% sa mga GCF wala sa MIBiG, usa sa pinakadako nga database sa mga eksperimento nga gi-validate nga mga BGC (Figure 2b).Bisan kung dili katingad-an nga makit-an ang daghang mga potensyal nga mga agianan sa nobela sa mga setting nga dili maayo nga girepresentahan sa reference genome, ang among pamaagi sa pag-dereplicate sa mga BGC ngadto sa mga GCF sa wala pa ang benchmarking lahi sa nangaging mga taho 16 ug gitugotan kami nga maghatag usa ka dili mapihigon nga pagsusi sa bag-o.Kadaghanan sa bag-ong diversity (3012 GCF o 78%) katumbas sa gitagna nga terpenes, RiPP o uban pang natural nga mga produkto, ug kadaghanan (1815 GCF o 47%) gi-encode sa wala mailhi nga mga tipo tungod sa ilang biosynthetic nga potensyal.Dili sama sa PKS ug NRPS clusters, kini nga mga compact BGCs dili kaayo lagmit nga mabahin sa panahon sa metagenomic assembly 31 ug magtugot sa dugang nga panahon ug resource-intensive functional characterization sa ilang mga produkto.
Sa kinatibuk-an nga 39,055 ka BGC ang gi-grupo sa 6,907 ka GCF ug 151 ka GCC.a, representasyon sa datos (internal external).Hierarchical clustering sa BGC distances base sa GCC, 53 niini gitakda sa MAG lang.Ang GCC adunay BGCs gikan sa lain-laing taxa (ln-transformed gate frequency) ug lain-laing BGC classes (circle gidak-on katumbas sa frequency niini).Alang sa matag GCC, ang gawas nga layer nagrepresentar sa gidaghanon sa mga BGC, ang prevalence (porsiyento sa mga sample), ug ang distansya (minimum BGC cosine distance (min(dMIBiG))) gikan sa BiG-FAM ngadto sa BGC.Ang mga GCC nga adunay mga BGC nga suod nga may kalabotan sa mga napamatud-an nga eksperimento nga BGC (MIBiG) gipasiugda sa mga pana.b Pagkomparar sa GCF sa gitagna (BiG-FAM) ug gi-validate sa eksperimento (MIBiG) nga mga BGC, 3861 ka bag-o (d–>0.2) nga mga GCF ang nakit-an.Kadaghanan (78%) niini nga mga code alang sa RiPP, terpenes, ug uban pang mga natural nga produkto.c, ang tanang genome sa OMD nga nakit-an sa 1038 marine metagenomes gibutang sa GTDB base tree aron ipakita ang phylogenetic coverage sa OMD.Ang mga clade nga walay bisan unsang genome sa OMD gipakita sa gray.Ang gidaghanon sa mga BGC katumbas sa labing kadaghan nga gitagna nga mga BGC matag genome sa usa ka clade.Alang sa katin-awan, ang katapusang 15% sa mga node nahugno.Ang mga pana nagpakita sa mga clade nga dato sa BGC (>15 BGC), gawas sa Mycobacterium, Gordonia (ikaduha lamang sa Rhodococcus), ug Crocosphaera (ikaduha lamang sa Synechococcus).d, Wala mailhi c.Ang Eremiobacterota nagpakita sa pinakataas nga biosynthetic diversity (Shannon index base sa natural nga tipo sa produkto).Ang matag banda nagrepresentar sa genome nga adunay labing daghang BGC sa mga espisye.T1PKS, PKS type I, T2/3PKS, PKS type II ug type III.
Dugang sa kadato ug kabag-ohan, among gisuhid ang biogeographic nga istruktura sa biosynthetic nga potensyal sa marine microbiome.Ang paggrupo sa mga sample pinaagi sa aberids nga metagenomic GCF copy number distribution (Methods) nagpakita nga ang low-latitude, surface, prokaryotic-rich ug virus-poor nga mga komunidad, kasagaran gikan sa surface o mas lawom nga katubigan nga nahayagan sa adlaw, dato sa RiPP ug BGC terpenes.Sa kasukwahi, ang polar, lawom nga dagat, virus- ug mga komunidad nga puno sa partikulo nalangkit sa mas taas nga kadagaya sa NRPS ug PKS BGC (gipadako nga datos, Fig. 4 ug dugang nga impormasyon).Sa kataposan, among nakaplagan nga ang maayo nga gitun-an nga tropikal ug pelagic nga mga komunidad mao ang labing maayong tinubdan sa bag-ong terpenes (Augmented Data Figure).Labing taas nga potensyal alang sa PKS, RiPP ug uban pang natural nga mga produkto (Figure 5a nga adunay gipalapdan nga datos).
Aron makompleto ang among pagtuon sa biosynthetic nga potensyal sa marine microbiome, gitumong namo nga mapa ang ilang phylogenetic distribution ug mailhan ang bag-ong BGC-enriched clades.Alang niini, among gibutang ang mga genome sa marine microbes ngadto sa usa ka normal nga GTDB13 bacterial ug archaeal phylogenetic tree ug gisapawan ang putative biosynthetic nga mga agianan nga ilang gi-encode (Fig. 2c).Dali namong nakit-an ang daghang mga clade nga gipadato sa BGC (girepresentar sa kapin sa 15 ka BGC) sa mga sample sa tubig sa dagat (mga pamaagi) nga nahibal-an sa ilang biosynthetic nga potensyal, sama sa cyanobacteria (Synechococcus) ug Proteus bacteria, sama sa Tistrella32,33, o bag-o lang nakadani sa atensyon alang sa ilang natural nga mga produkto.sama sa Myxococcota (Sandaracinaceae), Rhodococcus ug Planctomycetota34,35,36.Makapainteres, nakit-an namon ang daghang wala pa masusi nga mga linya sa kini nga mga clades.Pananglitan, kadtong mga espisye nga adunay labing adunahan nga biosynthetic nga potensyal sa phyla Planctomycetota ug Myxococcota nahisakop sa wala mailhi nga mga order sa kandidato ug genera, matag usa (Supplementary Table 3).Sa tingub, kini nagsugyot nga ang OMD naghatag og access sa kaniadto wala mahibal-an nga phylogenetic nga impormasyon, lakip na ang mga microorganism, nga mahimong nagrepresentar sa bag-ong mga target alang sa enzyme ug natural nga pagkadiskobre sa produkto.
Sunod, among gihulagway ang BGC-enriched clade pinaagi sa dili lamang pag-ihap sa maximum nga gidaghanon sa mga BGC nga gi-encode sa mga miyembro niini, kondili pinaagi usab sa pag-assess sa pagkalain-lain niini nga mga BGC, nga nagpatin-aw sa frequency sa lain-laing mga matang sa natural nga mga produkto sa kandidato (Fig. 2c ug mga pamaagi )..Among nakaplagan nga ang labing biosynthetically diverse nga mga espisye girepresentahan sa espesyal nga engineered bacterial MAGs niini nga pagtuon.Kini nga mga bakterya nahisakop sa wala matikad nga phylum nga Candidatus Eremiobacterota, nga nagpabilin nga wala pa masusi gawas sa pipila ka genomic nga pagtuon37,38.Talalupangdon nga “ca.Ang genus nga Eremiobacterota gisusi lamang sa usa ka terrestrial nga palibot39 ug wala nahibal-an nga adunay bisan unsang mga miyembro nga gipadato sa BGC.Dinhi among gitukod pag-usab ang walo ka MAG sa parehas nga espisye (nucleotide identity> 99%) 23. Busa among gisugyot ang ngalan sa espisye nga "Candidatus Eudoremicrobium malaspinii", nga ginganlan sunod sa nereid (sea nymph), usa ka matahum nga regalo sa mitolohiya ug mga ekspedisyon sa Gresya.'Ka.Sumala sa phylogenetic annotation 13, ang E. malaspinii walay kanhi nailhan nga mga paryente ubos sa sequence level ug sa ingon nahisakop sa usa ka bag-ong bacterial nga pamilya nga among gisugyot nga "Ca.E. malaspinii” kay matang nga matang ug “Ca.Eudormicrobiaceae” isip opisyal nga ngalan (Supplementary Information).Mubo nga metagenomic nga pagtukod pag-usab sa 'Ca.Ang E. malaspinii genome nga proyekto gi-validate pinaagi sa ubos kaayo nga input, dugay nga pagbasa sa metagenomic sequencing ug gipunting nga asembliya sa usa ka sample (Methods) isip usa ka 9.63 Mb linear chromosome nga adunay 75 kb duplication.ingon ang nahabilin nga dili klaro.
Aron maestablisar ang phylogenetic nga konteksto niini nga espisye, among gipangita ang 40 ka suod nga mga espisye sa dugang eukaryotic-enriched metagenomic samples gikan sa Tara Ocean expedition pinaagi sa gitarget nga genome reconstruction.Sa laktud, among gisumpay ang metagenomic reads ngadto sa genomic fragment nga nalangkit sa "Ca.E. malaspinii” ug gi-hypothesize nga ang pagtaas sa rate sa pagrekrut niini nga sample nagpakita sa presensya sa ubang mga paryente (mga pamaagi).Tungod niini, nakakaplag kami ug 10 ka MAG, usa ka kombinasyon sa 19 ka MAG nga nagrepresentar sa lima ka espisye sa tulo ka genera sulod sa bag-ong gihubit nga pamilya (ie "Ca. Eudormicrobiaceae").Human sa manual inspeksyon ug pagkontrol sa kalidad (gipadako nga datos, Fig. 6 ug dugang nga impormasyon), among nakita nga ang "Ca.Ang mga espisye sa Eudormicrobiaceae nagpresentar ug mas dagkong mga genome (8 Mb) ug mas daghang biosynthetic nga potensyal (14 ngadto sa 22 BGC matag espisye) kay sa ubang mga miyembro sa "Ca".Clade Eremiobacterota (hangtod sa 7 BGC) (Fig. 3a–c).
a, Phylogenetic nga mga posisyon sa lima ka 'Ca.Ang mga espisye sa Eudormicrobiaceae nagpakita sa kadato sa BGC nga espesipiko sa mga linya sa dagat nga giila niini nga pagtuon.Ang phylogenetic nga kahoy naglakip sa tanang 'Ca.Ang MAG Eremiobacterota ug mga miyembro sa ubang phyla (mga numero sa genome sa mga bracket) nga gihatag sa GTDB (bersyon 89) gigamit alang sa background sa ebolusyon (Mga Pamaagi).Ang pinakagawas nga mga sapaw nagrepresentar sa mga klasipikasyon sa lebel sa pamilya ("Ca. Eudormicrobiaceae" ug "Ca. Xenobiaceae") ug sa lebel sa klase ("Ca. Eremiobacteria").Ang lima ka espisye nga gihulagway niini nga pagtuon girepresentahan sa mga alphanumeric code ug gisugyot nga binomial nga mga ngalan (Supplementary Information).b ,ok.Ang mga espisye sa Eudormicrobiaceae adunay pito ka komon nga BGC nuclei.Ang pagkawala sa BGC sa A2 clade tungod sa pagkadili kompleto sa representante nga MAG (Supplementary Table 3).Ang mga BGC espesipiko sa "Ca.Amphithomicrobium” ug “Ca.Amphithomicrobium” (clades A ug B) wala gipakita.c, Tanang BGCs gi-encode isip “Ca.Ang Eudoremicrobium taraoceanii nakit-an nga gipahayag sa 623 metatranscriptomes nga gikuha gikan sa kadagatan sa Tara.Ang solid nga mga lingin nagpaila sa aktibo nga transkripsyon.Ang mga lingin nga orange nagpasabot sa log2-transformed fold nga mga kausaban sa ubos ug labaw sa housekeeping gene expression rate (mga pamaagi).d, relatibong abundance curves (pamaagi) nga nagpakita sa 'Ca.Ang mga espisye sa Eudormicrobiaceae kaylap sa kadaghanan sa mga basin sa dagat ug sa tibuok nga kolum sa tubig (gikan sa ibabaw ngadto sa giladmon nga labing menos 4000 m).Base sa kini nga mga banabana, among nakita nga ang 'Ca.Ang E. malaspinii' nag-asoy sa hangtod sa 6% sa prokaryotic cells sa lawom nga dagat nga pelagic grain-associated nga mga komunidad.Among gikonsiderar ang usa ka espisye nga anaa sa usa ka dapit kung kini makit-an sa bisan unsang tipik sa gidak-on sa usa ka gihatag nga giladmon nga layer.IO – Indian Ocean, NAO – North Atlantic, NPO – North Pacific, RS – Red Sea, SAO – South Atlantic, SO – Southern Ocean, SPO – South Pacific.
Pagtuon sa kadagaya ug pag-apod-apod sa Ca.Ang Eudormicrobiaceae, nga, sumala sa among nakit-an, nag-una sa kadaghanan sa mga basin sa dagat, ingon man sa tibuok nga kolum sa tubig (Fig. 3d).Sa lokal, sila naglangkob sa 6% sa marine microbial community, nga naghimo kanila nga usa ka importante nga bahin sa global marine microbiome.Dugang pa, nakit-an namon ang paryente nga sulud sa Ca.Ang mga espisye sa Eudormicrobiaceae ug ang ilang lebel sa ekspresyon sa BGC mao ang pinakataas sa eukaryotic enriched fraction (Fig. 3c ug extended data, Fig. 7), nga nagpakita sa posibleng interaksyon sa particulate matter, lakip ang plankton.Kini nga obserbasyon adunay kaamgid sa 'Ca.Ang Eudoremicrobium BGCs nga nagpatunghag cytotoxic natural nga mga produkto pinaagi sa nailhan nga mga agianan mahimong magpakita sa manunukob nga kinaiya (Supplementary Information and Expanded Data, Figure 8), susama sa ubang mga manunukob nga espesipikong nagpatunghag mga metabolite sama sa Myxococcus41.Pagkadiskobre sa Ca.Ang Eudormicrobiaceae sa dili kaayo magamit (lawom nga kadagatan) o eukaryotic kaysa prokaryotic nga mga sampol mahimong magpatin-aw kung nganong kini nga mga bakterya ug ang ilang wala damha nga pagkalainlain sa BGC nagpabilin nga dili klaro sa konteksto sa natural nga panukiduki sa pagkaon.
Sa katapusan, gitinguha namon nga eksperimento nga pamatud-an ang saad sa among trabaho nga nakabase sa microbiome sa pagdiskubre sa mga bag-ong agianan, enzyme, ug natural nga mga produkto.Taliwala sa lain-laing mga klase sa BGCs, ang RiPP nga agianan nahibal-an nga nag-encode sa usa ka adunahan nga kemikal ug functional nga pagkalain-lain tungod sa lain-laing mga post-translational nga mga pagbag-o sa core peptide pinaagi sa hamtong nga mga enzyme42.Busa gipili namo ang duha ka 'Ca.Eudoremicrobium 'RiPP BGCs (Figures 3b ug 4a-e) gibase sa sama sa bisan unsa nga nailhan BGC (\(\ bar{d}\)MIBiG ug \(\ bar{d}\)RefSeq sa ibabaw 0.2) .
a-c, In vitro heterologous nga ekspresyon ug in vitro enzymatic assays sa usa ka nobela (\(\ bar{d}\)RefSeq = 0.29) cluster sa RiPP biosynthesis nga espesipiko alang sa lawom nga dagat Ca species.Ang E. malaspinii' mitultol sa paggama sa mga produkto nga diphosphorylated.c, mga pagbag-o nga giila gamit ang high-resolution (HR) MS / MS (fragmentation nga gipakita sa b ug y ions sa kemikal nga istruktura) ug NMR (expanded data, Fig. 9).d, kini nga phosphorylated peptide nagpakita sa ubos nga micromolar inhibition sa mammalian neutrophil elastase, nga dili makita sa control peptide ug ang dehydrating peptide (chemical removal induced dehydration).Ang eksperimento gisubli tulo ka beses nga adunay parehas nga mga resulta.Pananglitan, ang heterologous nga ekspresyon sa ikaduhang nobela \(\bar{d}\)RefSeq = 0.33) cluster sa biosynthesis sa protina nagpatin-aw sa gimbuhaton sa upat ka hamtong nga enzyme nga nag-usab sa 46 amino acid core peptide.Ang mga nahabilin nabulingan sumala sa lugar sa pagbag-o nga gitagna sa HR-MS / MS, pag-label sa isotope, ug pagtuki sa NMR (Supplementary Information).Ang giputol nga kolor nagpakita nga ang pagbag-o mahitabo sa bisan hain sa duha nga nahabilin.Ang numero usa ka kompilasyon sa daghang mga heterologous nga konstruksyon aron ipakita ang kalihokan sa tanan nga hamtong nga mga enzyme sa parehas nga nucleus.h, Ilustrasyon sa datos sa NMR alang sa backbone amide N-methylation.Ang bug-os nga mga resulta gipakita sa fig.10 nga adunay taas nga datos.i, Phylogenetic nga posisyon sa hamtong nga FkbM protein cluster enzyme sa tanan nga FkbM domains nga makita sa MIBiG 2.0 database nagpadayag sa usa ka enzyme niini nga pamilya nga adunay N-methyltransferase nga kalihokan (Supplementary Information).Ang mga schematic diagram sa BGCs (a, e), precursor peptide structures (b, f), ug putative chemical structures sa natural nga mga produkto (c, g) gipakita.
Ang unang agianan sa RiPP (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) makit-an lamang sa mga espisye sa lawom nga dagat nga "Ca.E. malaspinii” ug mga code alang sa Peptide-precursor (Fig. 4a, b).Niining hamtong nga enzyme, nahibal-an namon ang usa ka functional domain nga homologous sa dehydration domain sa lantipeptide synthase nga kasagarang mag-catalyze sa phosphorylation ug sunod nga pagtangtang sa 43 (Supplementary Information).Busa, gitagna namo nga ang pagbag-o sa precursor peptide naglakip sa ingon nga duha ka lakang nga dehydration.Bisan pa, gamit ang tandem mass spectrometry (MS / MS) ug nuclear magnetic resonance spectroscopy (NMR), among giila ang usa ka polyphosphorylated linear peptide (Fig. 4c).Bisan kung wala damha, nakit-an namon ang daghang mga linya sa ebidensya nga nagsuporta sa pagkahimong katapusan nga produkto: duha nga lainlaing heterologous nga host ug wala’y dehydration sa in vitro assays, pag-ila sa mga hinungdan nga nahabilin nga mutated sa catalytic dehydration site sa hamtong nga enzyme.ang tanan gitukod pag-usab sa "Ca".Ang E. malaspinii genome (gipadako nga datos, Fig. 9 ug dugang nga impormasyon) ug, sa katapusan, ang biological nga kalihokan sa phosphorylated nga produkto, apan dili ang chemically synthesized dehydrated nga porma (Fig. 4d).Sa pagkatinuod, among nakaplagan nga kini nagpakita sa usa ka ubos nga micromolar protease inhibitory nga kalihokan batok sa neutrophil elastase, itandi sa uban nga mga may kalabutan nga natural nga mga produkto sa konsentrasyon range (IC50 = 14.3 μM) 44, bisan pa sa kamatuoran nga ang ekolohikal nga papel nagpabilin nga elucidated.Base sa kini nga mga resulta, among gisugyot nga tawgon ang agianan nga "phospheptin".
Ang ikaduha nga kaso usa ka komplikado nga RiPP nga agianan nga piho sa 'Ca.Ang genus Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) gitagna nga mag-encode sa natural nga mga produkto sa protina (Fig. 4e).Kini nga mga agianan adunay partikular nga biotechnological nga interes tungod sa gipaabot nga densidad ug lainlain nga dili kasagaran nga mga pagbag-o sa kemikal nga gitukod sa mga enzyme nga gi-encode sa medyo mubo nga BGCs45.Among nakaplagan nga kini nga protina lahi sa nauna nga gihulagway nga mga protina tungod kay kini kulang sa nag-unang NX5N motif sa polyceramides ug lanthionine loop sa landornamides 46.Aron mabuntog ang mga limitasyon sa kasagarang heterologous nga mga pattern sa ekspresyon, gigamit namo kini uban sa usa ka custom nga Microvirgula aerodenitrificans nga sistema aron mailhan ang upat ka hamtong nga mga enzyme sa agianan (mga pamaagi).Gamit ang kombinasyon sa MS / MS, isotope labeling, ug NMR, among nakita kining mga hamtong nga enzyme sa 46-amino acid core sa peptide (Fig. 4f, g, expanded data, Fig. 10-12 ug dugang nga impormasyon).Taliwala sa mga hamtong nga enzyme, among gihulagway ang unang dagway sa usa ka FkbM O-methyltransferase nga membro sa pamilya 47 sa RiPP nga agianan ug wala damha nga nakit-an nga kini nga hamtong nga enzyme nagpaila sa backbone N-methylation (Fig. 4h, i ug dugang nga impormasyon).Bisan kung kini nga pagbag-o nahibal-an sa natural nga mga produkto sa NRP48, ang enzymatic N-methylation sa amide bonds usa ka komplikado apan biotechnologically nga hinungdanon nga reaksyon49 nga hangtod karon interesado sa pamilyang RiPP sa mga borosines.Pagtino 50,51.Ang pag-ila niini nga kalihokan sa ubang mga pamilya sa mga enzyme ug RiPP mahimong magbukas sa bag-ong mga aplikasyon ug mopalapad sa functional diversity sa mga protina 52 ug sa ilang kemikal nga pagkalain-lain.Pinasukad sa giila nga mga pagbag-o ug ang dili kasagaran nga gitas-on sa gisugyot nga istruktura sa produkto, among gisugyot ang ngalan sa agianan nga "pythonamide".
Ang pagkadiskobre sa usa ka wala damha nga enzymology sa usa ka functionally characterized nga pamilya sa mga enzyme naghulagway sa saad sa environmental genomics alang sa bag-ong mga diskobre, ug naghulagway usab sa limitado nga kapasidad alang sa functional inference base sa sequence homology lamang.Busa, uban sa mga taho sa non-canonical bioactive polyphosphorylated RiPPs, ang among mga resulta nagpakita sa resource-intensive apan kritikal nga bili sa synthetic biology nga mga paningkamot aron hingpit nga madiskobrehan ang functional richness, diversity, ug dili kasagaran nga mga istruktura sa biochemical compounds.
Dinhi among gipakita ang lainlain nga biosynthetic nga potensyal nga gi-encode sa mga mikrobyo ug ang ilang genomic nga konteksto sa global nga microbiome sa dagat, nga nagpadali sa umaabot nga panukiduki pinaagi sa paghimo sa sangputanan nga kapanguhaan nga magamit sa komunidad sa siyensya (https://microbiomics.io/ocean/).Among nakaplagan nga kadaghanan sa iyang phylogenetic ug functional novelty makuha lamang pinaagi sa pag-reconstruct sa MAGs ug SAGs, ilabina sa underutilized microbial nga mga komunidad nga makagiya sa umaabot nga bioprospecting nga mga paningkamot.Bisan tuod kita mag-focus dinhi sa 'Ca.Eudormicrobiaceae" isip usa ka kaliwatan ilabina ang biosynthetically "talented", daghan sa mga BGC nga gitagna sa wala pa madiskubre nga microbiota nga lagmit nag-encode kaniadto nga wala mahulagway nga mga enzymologies nga makahatag og mga compound nga adunay mga aksyon sa kinaiyahan ug/o biotechnologically.
Ang mga metagenomic nga mga dataset gikan sa mga mayor nga oceanographic ug time series nga mga pagtuon nga adunay igo nga sequencing depth gilakip aron mapadako ang coverage sa global marine microbial nga mga komunidad sa mga basin sa kadagatan, lawom nga mga layer ug sa paglabay sa panahon.Kini nga mga datasets (Supplementary Table 1 ug Figure 1) naglakip sa metagenomics gikan sa mga sample nga nakolekta sa kadagatan sa Tara (viral enriched, n=190; prokaryotic enriched, n=180)12,22 ug ang BioGEOTRACES expedition (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 ug ang Malaspina Expedition (n = 58)23.Ang sequencing reads gikan sa tanang metagenomic fragment gisala para sa kalidad gamit ang BBMap (v.38.71) pinaagi sa pagtangtang sa sequencing adapters gikan sa mga reads, pagtangtang sa mga reads nga gimapa ngadto sa quality control sequences (PhiX genomes), ug paggamit sa trimq=14, maq=20 discards poor read quality, maxns = 0 ug minlength = 45. Ang sunod nga mga pagtuki gipadagan o gisagol sa QC reads kung gipiho (bbmerge.sh minoverlap=16).Ang mga pagbasa sa QC gi-normalize (bbnorm.sh target = 40, minddepth = 0) sa wala pa ang pagtukod gamit ang metaSPAdes (v.3.11.1 o v.3.12 kung gikinahanglan)53.Ang resulta nga scaffold contigs (gitawag nga scaffold) sa kataposan nasala sa gitas-on (≥1 kb).
Ang 1038 nga metagenomic sample gibahin ngadto sa mga grupo, ug alang sa matag grupo sa mga sample, ang metagenomic quality control reads sa tanang sample gipares sa bracket sa matag sample nga gilain, nga miresulta sa mosunod nga gidaghanon sa pairwise bracketed group nga mabasa: Tara Marine Viruses – Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT ug BATS (610×610) ug Malaspina (58×58).Ang pagmapa gihimo gamit ang Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 nga nagtugot sa mga pagbasa nga ipares sa sekondaryang mga dapit (gamit ang -a flag).Ang mga alignment gisala nga labing menos 45 ka base ang gitas-on, adunay ≥97% nga pagkatawo, ug span ≥80% nga pagbasa.Ang resulta nga BAM files giproseso gamit ang jgi_summarize_bam_contig_depths script para sa MetaBAT2 (v.2.12.1)55 aron mahatagan ug intra-ug inter-sample nga coverage sa matag grupo.Sa katapusan, ang mga bracket gi-grupo aron madugangan ang pagkasensitibo pinaagi sa tagsa-tagsa nga pagpadagan sa MetaBAT2 sa tanang sample nga adunay –minContig 2000 ug –maxEdges 500. Gigamit namo ang MetaBAT2 imbes nga ensemble boxer tungod kay kini gipakita sa independenteng mga pagsulay nga mao ang labing epektibo nga single boxer.ug 10 ngadto sa 50 ka pilo nga mas paspas kay sa ubang kasagarang gigamit nga mga boksidor57.Aron masulayan ang epekto sa abundance correlations, usa ka random nga gipili nga subsample sa metagenomics (10 alang sa matag usa sa duha ka Tara Ocean datasets, 10 alang sa BioGEOTRACES, 5 alang sa matag serye sa panahon, ug 5 alang sa Malaspina) dugang nga gigamit nga mga sample lamang.Ang mga internal nga sample gigrupo aron makakuha og impormasyon sa coverage.(Dugang nga Impormasyon).
Ang dugang (eksternal) nga mga genome gilakip sa sunod nga pagtuki, nga mao ang 830 ka mano-mano nga pinili nga MAGs gikan sa usa ka subset sa Tara Oceans26 dataset, 5287 SAGs gikan sa GORG20 dataset, ug data gikan sa MAR database (MarDB v. 4) gikan sa 1707 isolated REFs ug 682 SAGs) 27. Para sa MarDB dataset, ang mga genome gipili base sa available nga metadata kon ang sample type mohaum sa mosunod nga regular nga ekspresyon: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] gilain'.
Ang kalidad sa matag metagenomic nga sudlanan ug mga eksternal nga genome gisusi gamit ang CheckM (v.1.0.13) ug Anvi'o's Lineage Workflow (v.5.5.0)58,59.Kung ang CheckM o Anvi'o nagreport sa ≥50% nga pagkakompleto/pagkakompleto ug ≤10% nga kontaminasyon/kadugangan, dayon i-save ang metagenomic cells ug external genome alang sa pagtuki sa ulahi.Kini nga mga iskor gihiusa dayon ngadto sa mean completeness (mcpl) ug mean contamination (mctn) aron maklasipikar ang kalidad sa genome sumala sa criteria sa komunidad60 sama sa mosunod: taas nga kalidad: mcpl ≥ 90% ug mctn ≤ 5%;maayong kalidad: mcpl ≥ 70%, mctn ≤ 10%, medium nga kalidad: mcpl ≥ 50% ug mctn ≤ 10%, patas nga kalidad: mcpl ≤ 90% o mctn ≥ 10%.Ang mga sinala nga genome dayon gi-correlate sa kalidad nga mga marka (Q ug Q') ingon sa mosunod: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (strain variability)/100 + 0.5 x log [N50] .(gipatuman sa dRep61).
Aron tugotan ang pagtandi nga pagtuki tali sa lain-laing mga tinubdan sa datos ug mga tipo sa genome (MAG, SAG ug REF), 34,799 ka genome ang gi-dereference base sa genome-wide average nucleotide identity (ANI) gamit ang dRep (v.2.5.4).Gisubli)61 nga adunay 95% ANI thresholds28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) ug single-copy marker genes gamit ang SpecI63 nga naghatag ug genome clustering sa lebel sa espisye.Gipili ang usa ka representante nga genome alang sa matag cluster sa dRep sumala sa labing taas nga marka sa kalidad (Q') nga gihubit sa ibabaw, nga giisip nga representante sa mga espisye.
Aron masusi ang katulin sa pagmapa, ang BWA (v.0.7.17-r1188, -a) gigamit sa pagmapa sa tanang 1038 ka set sa metagenomic reads nga adunay 34,799 genome nga anaa sa OMD.Ang mga pagbasa nga kontrolado sa kalidad gimapa sa single-ended mode ug ang resulta nga mga alignment gisala aron mapabilin lamang ang mga alignment nga ≥45 bp ang gitas-on.ug pagkatawo ≥95%.Ang gipakita nga ratio alang sa matag sample mao ang porsyento sa mga pagbasa nga nahabilin pagkahuman sa pagsala nga gibahin sa kinatibuk-ang gidaghanon sa mga pagbasa sa pagkontrol sa kalidad.Gamit ang parehas nga pamaagi, ang matag usa sa 1038 nga metagenomes gikunhuran sa 5 milyon nga pagsal-ot (gipadako nga datos, Fig. 1c) ug gipares sa GORG SAG sa OMD ug sa tanan nga GEM16.Ang gidaghanon sa mga MAG nga nakuha gikan sa tubig-dagat sa GEM16 catalog gitino pinaagi sa keyword query sa metagenomic sources, pagpili sa seawater samples (pananglitan, sukwahi sa marine sediments).Sa partikular, atong pilion ang "aquatic" isip "ecosystem_category", "marine" isip "ecosystem_type", ug filter ang "habitat" isip "deep ocean", "marine", "maritime oceanic", "pelagic marine", "marine water" , "Kadagat", "Tubig sa Dagat", "Tubig sa Ibabaw sa Dagat", "Tubig sa Ibabaw sa Dagat".Nagresulta kini sa 5903 MAGs (734 taas nga kalidad) nga naapod-apod sa 1823 OTUs (tan-aw dinhi).
Ang mga prokaryotic genome kay taxonomically annotated gamit ang GTDB-Tk (v.1.0.2)64 nga adunay default parameters nga gipunting ang GTDB r89 version 13. Ang Anvi'o gigamit sa pag-ila sa eukaryotic genome base sa domain prediction ug recall ≥50% ug redundancy ≤ 10%.Ang taxonomic nga anotasyon sa usa ka espisye gihubit isip usa sa mga representante nga genome niini.Gawas sa mga eukaryote (148 MAG), ang matag genome unang gi-annotate gamit ang prokka (v.1.14.5)65, nga nagngalan sa kompletong mga gene, naghubit sa "archaea" o "bakterya" nga mga parameter kung gikinahanglan, nga gitaho usab alang sa dili- coding nga mga gene.ug mga rehiyon sa CRISPR, taliwala sa ubang mga genomic nga bahin.I-annotate ang gitagna nga mga gene pinaagi sa pag-ila sa universal single-copy marker genes (uscMG) gamit ang fetchMG (v.1.2)66, assign ortholog groups ug pangutana gamit ang emapper (v.2.0.1)67 base sa eggNOG (v.5.0)68.KEGG database (gipatik Pebrero 10, 2020) 69. Ang kataposang lakang gihimo pinaagi sa pagpares sa mga protina sa KEGG database gamit ang DIAMOND (v.0.9.30)70 nga adunay sakup sa pangutana ug topiko nga ≥70%.Ang mga resulta dugang gisala sumala sa NCBI Prokaryotic Genome Annotation Pipeline71 base sa bitrate ≥ 50% sa pinakataas nga gipaabot nga bitrate (link mismo).Ang mga sequence sa gene gigamit usab isip input aron mailhan ang mga BGC sa genome gamit ang antiSMASH (v.5.1.0)72 nga adunay default nga mga parameter ug lain-laing mga pagbuto sa cluster.Ang tanang genome ug annotation gihugpong ngadto sa OMD uban sa contextual metadata nga anaa sa web (https://microbiomics.io/ocean/).
Susama sa gihulagway na nga mga pamaagi12,22 gigamit namo ang CD-HIT (v.4.8.1) sa cluster> 56.6 milyon nga protina-coding nga mga gene gikan sa bacterial ug archaeal genome gikan sa OMD ngadto sa 95% nga pagkatawo ug mas mubo nga mga gene (90% coverage)73 hangtud sa > 17.7 milyon nga gene clusters.Ang pinakataas nga han-ay gipili isip representante nga gene alang sa matag gene cluster.Ang 1038 metagenomes dayon gipares sa> 17.7 milyon nga BWA (-a) nga mga miyembro sa cluster ug ang resulta nga BAM nga mga file gisala aron magpabilin lamang ang mga pag-align nga adunay ≥95% nga porsyento nga pagkatawo ug ≥45 nga base alignment.Ang gitas-on nga na-normalize nga gene abundance gikalkulo pinaagi sa una nga pag-ihap sa mga pagsal-ot gikan sa labing maayo nga talagsaon nga pag-align ug dayon, alang sa fuzzy-mapped nga mga pagsal-ot, pagdugang sa mga fractional nga ihap sa katumbas nga target nga mga gene nga proporsyonal sa ilang gidaghanon sa talagsaon nga mga pagsal-ot.
Ang mga genome gikan sa gipalapdan nga OMD (nga adunay dugang nga mga MAG gikan sa "Ca. Eudormicrobiaceae", tan-awa sa ubos) gidugang ngadto sa mOTUs74 metagenomic analysis tool database (v.2.5.1) aron makahimo og usa ka extended nga mOTU reference database.Unom ra ka single-copy nga genome (23,528 genome) ang naluwas gikan sa napulo ka uscMGs.Ang pagpalapad sa database miresulta sa 4,494 ka dugang nga mga cluster sa lebel sa espisye.Ang 1038 metagenomes gisusi gamit ang default nga mga parameter sa mOTU (v.2).Usa ka kinatibuk-an nga 989 nga mga genome nga naa sa 644 mOTU clusters (95% REF, 5% SAG ug 99.9% nga iya sa MarDB) wala mahibal-an sa profile sa mOTU.Kini nagpakita sa lain-laing mga dugang nga tinubdan sa marine isolation sa MarDB genome (kadaghanan sa wala mamatikdi nga genome nalangkit sa mga organismo nga nahimulag gikan sa sediments, marine hosts, ug uban pa).Aron mapadayon ang pagtutok sa bukas nga kalikopan sa kadagatan niini nga pagtuon, wala namo sila iapil sa pag-analisa sa ubos gawas kung kini makit-an o gilakip sa gipalapdan nga database sa mOTU nga gihimo niini nga pagtuon.
Ang tanan nga mga BGC gikan sa MAG, SAG ug REF sa OMD (tan-awa sa ibabaw) gihiusa uban sa mga BGC nga giila sa tanang metagenomic scaffolds (antiSMASH v.5.0, default parameters) ug gihulagway gamit ang BiG-SLICE (v.1.1) (PFAM domain )75.Pinasukad niini nga mga bahin, among gikuwenta ang tanang cosine nga gilay-on tali sa mga BGC ug gi-grupo kini (mean links) ngadto sa GCF ug GCC gamit ang distance thresholds nga 0.2 ug 0.8 matag usa.Kini nga mga threshold usa ka adaptation sa mga threshold nga gigamit kaniadto gamit ang Euclidean distance75 kauban ang cosine distance, nga nagpagaan sa pipila ka mga sayup sa orihinal nga BiG-SLICE clustering strategy (Supplementary Information).
Ang mga BGC dayon gisala aron magpabilin lamang ang ≥5 kb nga naka-encode sa mga scaffold aron makunhuran ang risgo sa pagkabahin-bahin sama sa gihulagway kaniadto16 ug dili iapil ang mga MarDB REF ug SAG nga wala makita sa 1038 metagenomes (tan-awa sa ibabaw).Nagresulta kini sa total nga 39,055 BGCs nga gi-encode sa OMD genome, nga adunay dugang nga 14,106 nga giila sa metagenomic fragment (ie wala gihiusa sa MAGs).Kini nga mga "metagenomic" nga BGC gigamit aron mabanabana ang proporsyon sa potensyal nga biosynthesis sa microbiome sa dagat nga wala makuha sa database (Supplementary Information).Ang matag BGC adunay function nga gihulagway sumala sa predictive nga mga tipo sa produkto nga gihubit sa anti-SMASH o coarser nga mga kategorya sa produkto nga gihubit sa BiG-SCAPE76.Aron malikayan ang sampling bias sa quantification (taxonomic ug functional nga komposisyon sa GCC/GCF, gilay-on sa GCF ug GCC sa mga reference database, ug metagenomic abundance sa GCF), pinaagi sa pagpabilin lamang sa pinakataas nga BGC kada GCF alang sa matag species, 39,055 ka BGC ang dugang nga gi-deduplicated, nga miresulta sa total nga 17,689 BGC.
Ang kabag-ohan sa GCC ug GCF gi-assess base sa gilay-on tali sa kalkulado nga database (RefSeq database sa BiG-FAM)29 ug ang experimentally verified (MIBIG 2.0)30 BGC.Alang sa matag usa sa 17,689 ka representante nga BGC, gipili namo ang pinakagamay nga gilay-on sa cosine sa tagsa-tagsa nga database.Kini nga mga minimum nga distansya gi-average (mean) sumala sa GCF o GCC, kung angay.Ang usa ka GCF giisip nga bag-o kung ang gilay-on sa database labaw pa sa 0.2, nga katumbas sa usa ka sulundon nga pagbulag tali sa (average) nga GCF ug ang reference.Para sa GCC, gipili namo ang 0.4, nga doble ang threshold nga gitakda sa GCF, aron maka-lock sa dugay nga relasyon sa mga link.
Ang metagenomic abundance sa BGC gibanabana nga kasagarang kadagaya sa iyang biosynthetic genes (sumala sa gitino sa anti-SMASH) nga makuha gikan sa gene-level profiles.Ang metagenomic abundance sa matag GCF o GCC gikalkulo dayon isip sum sa representante nga BGCs (gikan sa 17,689).Kini nga mga abundance nga mga mapa gi-normalize sa sunod-sunod nga cellular composition gamit ang per-sample nga ihap sa mOTU, nga nag-asoy usab sa sequencing efforts (expanded data, Fig. 1d).Ang pagkaylap sa GCF o GCC gikalkula isip porsyento sa mga sample nga adunay kadagaya> 0.
Ang Euclidean nga gilay-on tali sa mga sample gikalkulo gikan sa na-normalize nga profile sa GCF.Kini nga mga gilay-on gipakunhod sa gidak-on gamit ang UMAP77 ug ang resulta nga mga embedding gigamit alang sa unsupervised density-based clustering gamit ang HDBSCAN78.Ang labing maayo nga minimum nga gidaghanon sa mga punto alang sa usa ka cluster (ug busa ang gidaghanon sa mga cluster) nga gigamit sa HDBSCAN gitino pinaagi sa pagpadako sa cumulative probability sa cluster membership.Ang giila nga mga pungpong (ug usa ka random nga balanse nga subsample niini nga mga pungpong sa pag-asoy sa bias sa permutational multivariate analysis of variance (PERMANOVA)) gisulayan alang sa kamahinungdanon batok sa wala'y pagkunhod nga mga distansya sa Euclidean gamit ang PERMANOVA.Ang kasagaran nga gidak-on sa genome sa mga sample gikalkulo base sa paryente nga kadagaya sa mOTU ug ang gibanabana nga gidak-on sa genome sa mga miyembro sa genome.Sa partikular, ang kasagaran nga gidak-on sa genome sa matag mOTU gibana-bana ingon nga ang kasagaran sa mga gidak-on sa genome sa mga miyembro niini gitul-id alang sa pagkakompleto (pagkahuman sa pagsala) (pananglitan, ang usa ka 75% nga kompleto nga genome nga adunay gitas-on nga 3 Mb adunay gibag-o nga gidak-on nga 4. Mb).alang sa medium genome nga adunay integridad ≥70%.Ang kasagaran nga gidak-on sa genome alang sa matag sample gikalkulo dayon ingon nga sumada sa mga gidak-on sa genome sa mOTU nga gitimbang sa paryente nga kadagaya.
Ang usa ka sinala nga set sa genome-encoded BGCs sa OMD gipakita sa bacterial ug archaeal GTDB trees (sa ≥5 kb frameworks, walay labot ang REF ug SAG MarDB nga dili makita sa 1038 metagenomes, tan-awa sa ibabaw) ug ang ilang gitagna nga mga kategorya sa produkto base sa phylogenetic posisyon sa genome (tan-awa sa ibabaw).Una namo nga gipakunhod ang datos sa mga espisye, gamit ang genome nga adunay labing daghang BGC sa kana nga espisye isip representante.Alang sa paghanduraw, ang mga representante gibahin pa ngadto sa mga grupo sa kahoy, ug pag-usab, alang sa matag celled clade, ang genome nga adunay pinakadako nga gidaghanon sa mga BGC gipili isip usa ka representante.Ang mga espisye nga gipadato sa BGC (labing menos usa ka genome nga adunay> 15 nga BGC) dugang nga gisusi pinaagi sa pagkalkula sa Shannon Diversity Index alang sa mga tipo sa produkto nga gi-encode sa mga BGC.Kung parehas ang tanan nga gitagna nga mga tipo sa produkto, ang mga kemikal nga hybrid ug uban pang komplikado nga BGC (sama sa gitagna sa anti-SMAH) giisip nga nahisakop sa parehas nga tipo sa produkto, bisan unsa pa ang ilang pagkahan-ay sa cluster (eg protein-bacteriocin ug bacteriocin-proteoprotein fusion lawas).hybrid).
Ang nahabilin nga DNA (gibanabana nga 6 ng) gikan sa Malaspina sample MP1648, katumbas sa biological sample SAMN05421555 ug gipares sa Illumina SRR3962772 metagenomic read set alang sa mubo nga pagbasa, giproseso sumala sa PacBio sequencing protocol nga adunay ultra-low input aron magamit ang sample sa PacBio kit SMRTlification gDNA kit (100-980-000) ug SMRTbell Express 2.0 template preparation kit (100-938-900).Sa mubo, ang nahabilin nga DNA giputol, giayo ug giputli (ProNex beads) gamit ang Covaris (g-TUBE, 52104).Ang giputli nga DNA gipailalom dayon sa pag-andam sa librarya, pagpadako, pagputli (ProNex beads) ug pagpili sa gidak-on (>6 kb, Blue Pippin) sa wala pa ang katapusang lakang sa pagputli (ProNex beads) ug pagsunud sa Sequel II nga plataporma.
Pagtukod pag-usab sa unang duha ka ca.Alang sa MAG Eremiobacterota, nahibal-an namon ang unom ka dugang nga ANI> 99% (kini gilakip sa Figure 3), nga sa sinugdan gisala base sa mga marka sa kontaminasyon (sa ulahi giila nga mga pagdoble sa gene, tan-awa sa ubos).Nakakita sab mi og tray nga gimarkahan og “Ca”.Eremiobacterota" gikan sa lainlaing mga pagtuon23 ug gigamit kini kauban ang walo ka mga MAG gikan sa among pagtuon ingon usa ka pakisayran alang sa metagenomic nga pagbasa gikan sa 633 eukaryotic enriched (> 0.8 µm) nga mga sample gamit ang BWA (v.0.7.17) Ref -r1188, - usa ka bandila) alang sa downsampled mapping (5 milyon nga pagbasa).Base sa enrichment-specific nga mga mapa (gisala sa 95% alignment identity ug 80% read coverage), 10 metagenomes (gipaabot nga coverage ≥5×) gipili para sa assembly ug dugang 49 metagenomes (expected coverage ≥1×) para sa content correlation.Gamit ang parehas nga mga parameter sama sa taas, kini nga mga sample gi-binned ug 10 nga dugang nga 'Ca's ang gidugang.Ang MAG Eremiobacterota gipahiuli.Kining 16 ka MAG (wala mag-ihap sa duha nga anaa na sa database) nagdala sa kinatibuk-ang gidaghanon sa mga genome sa gipalapdan nga OMD ngadto sa 34,815.Ang mga MAG gi-assign nga mga ranggo nga taxonomic base sa ilang genomic nga pagkaparehas ug posisyon sa GTDB.Ang 18 MAGs gi-dereplicated gamit ang dRep ngadto sa 5 species (intraspecific ANI>99%) ug 3 genera (intrageneric ANI 85% to 94%) sulod sa samang pamilya79.Ang mga representante sa mga espisye gipili nga mano-mano base sa integridad, kontaminasyon, ug N50.Ang gisugyot nga nomenclature gihatag sa Supplementary Information.
Susiha ang integridad ug kontaminasyon sa 'Ca.MAG Eremiobacterota, among gisusi ang presensya sa uscMG, ingon man ang lineage- ug domain-specific single-copy marker gene sets nga gigamit sa CheckM ug Anvi'o.Ang pag-ila sa 2 ka duplicate gikan sa 40 uscMGs gipamatud-an pinaagi sa phylogenetic reconstruction (tan-awa sa ubos) aron isalikway ang bisan unsang potensyal nga kontaminasyon (kini katumbas sa 5% base niining 40 ka marker genes).Usa ka dugang nga pagtuon sa lima ka representante nga MAGs 'Ca.Ang ubos nga lebel sa mga kontaminante niining mga gi-reconstruct nga genome gipamatud-an para sa Eremiobacterota species gamit ang interactive Anvi'o interface base sa abundance ug sequence composition correlations (Supplementary Information)59.
Alang sa pagtuki sa phylogenomic, gipili namo ang lima ka representante nga MAG "Ca".Eudormicrobiaceae", tanan nga mga matang "Ca.Ang genome sa Eremiobacterota ug mga miyembro sa ubang phyla (lakip ang UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria ug Planctomycetota) makuha gikan sa GTDB (r89)13.Ang tanan niini nga mga genome gi-annotate sama sa gihulagway kaniadto alang sa usa ka kopya nga marker gene extraction ug BGC annotation.Ang mga genome sa GTDB gikonserbar sumala sa integridad sa ibabaw ug mga pamatasan sa kontaminasyon.Ang phylogenetic analysis gihimo gamit ang Anvi'o Phylogenetics59 workflow.Ang kahoy gitukod gamit ang IQTREE (v.2.0.3) (default nga mga kapilian ug -bb 1000)80 sa usa ka paglinya sa 39 tandem ribosomal nga protina nga giila ni Anvi'o (MUSCLE, v.3.8.1551)81.Gipakunhod ang iyang mga posisyon.sa pagtabon sa labing menos 50% sa genome82 ug ang Planctomycecota gigamit isip outgroup base sa GTDB tree topology.Usa ka kahoy sa 40 uscMGs gitukod gamit ang parehas nga mga himan ug mga parameter.
Gigamit namon ang Traitar (v.1.1.2) nga adunay mga default nga mga parameter (phenotype, gikan sa mga nucleotides)83 aron matagna ang sagad nga mga kinaiya sa microbial.Gisuhid namo ang usa ka potensyal nga manunukob nga estilo sa kinabuhi base sa usa ka naugmad kaniadto nga predatory index84 nga nagdepende sa sulod sa usa ka protina-coding gene sa genome.Sa piho, gigamit namo ang DIAMOND aron itandi ang mga protina sa genome batok sa OrthoMCL database (v.4)85 gamit ang mga opsyon –mas sensitibo –id 25 –query-cover 70 –subject-cover 70 –top 20 UG ihap ang mga gene nga katumbas sa ang marker genes para sa mga manunukob ug dili mga manunukob.Ang indeks mao ang kalainan tali sa gidaghanon sa predatory ug non-predatory nga marka.Ingon usa ka dugang nga kontrol, gisusi usab namon ang genome nga "Ca".Ang Entotheonella TSY118 factor gibase sa iyang pagpakig-uban sa Ca.Eudoremicrobium (dako nga gidak-on sa genome ug potensyal nga biosynthetic).Sunod, gisulayan namo ang potensyal nga mga link tali sa predator ug non-predator marker genes ug ang biosynthetic nga potensyal sa Ca.Eudormicrobiaceae” ug nakit-an nga dili molapas sa usa ka gene (gikan sa bisan unsang klase sa marker gene, ie predator/non-predator gene) ang nagsapaw sa BGC, nagsugyot nga ang BGC dili makalibog sa mga signal sa predation.Ang dugang nga genomic annotation sa scrambled replicons gihimo gamit ang TXSSCAN (v.1.0.2) aron espesipikong susihon ang secretion system, pili, ug flagella86.
Lima ka representante nga 'Ca's ang gimapa pinaagi sa pagmapa sa 623 metatranscriptomes gikan sa prokaryotic ug eukaryotic enrichment fractions sa Tara oceans22,40,87 (gamit ang BWA, v.0.7.17-r1188, -a flag).Genome ang Eudormicrobiaceae.Ang mga file sa BAM giproseso gamit ang FeatureCounts (v.2.0.1)88 human sa 80% read coverage ug 95% identity filtering (uban ang mga opsyon featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Nag-ihap sa gidaghanon sa mga pagsal-ot kada gene.Ang namugna nga mga mapa gi-normalize para sa gene nga gitas-on ug marker gene abundance mOTU (gitas-on-normalize nga average insertion count para sa mga gene nga adunay insertion count>0) ug log-transformed ngadto sa 22.74 aron makuha ang relative expression kada cell sa matag gene level, nga nagpatin-aw usab sa kabag-ohan gikan sa sample ngadto sa sample sa panahon sa sequencing.Ang ingon nga mga ratios nagtugot alang sa pagtandi nga pagtuki, pagpagaan sa mga problema sa komposisyon kung gigamit ang mga datos sa kadaghanon.Ang mga sample lamang nga adunay> 5 sa 10 mOTU marker genes ang gikonsiderar alang sa dugang nga pagtuki aron tugotan ang usa ka dako nga bahin sa genome nga makit-an.
Ang normal nga transcriptome profile sa 'Ca.Ang E. taraoceanii gipailalom sa pagkunhod sa dimensyon gamit ang UMAP ug ang resulta nga representasyon gigamit alang sa unsupervised clustering gamit ang HDBSCAN (tan-awa sa ibabaw) aron mahibal-an ang status sa ekspresyon.Gisulayan sa PERMANOVA ang kamahinungdanon sa mga kalainan tali sa giila nga mga pungpong sa orihinal (dili pagkunhod) nga gilay-on nga wanang.Ang kalainan nga ekspresyon tali niini nga mga kondisyon gisulayan sa tibuok genome (tan-awa sa ibabaw) ug ang 201 KEGG nga mga agianan giila sa 6 ka functional nga mga grupo, nga mao ang: BGC, secretion system ug flagellar genes gikan sa TXSSCAN, degradation enzymes (protease ug peptidases), ug predatory ug non- manunukob nga mga gene.predatory index marker.Alang sa matag sample, among gikalkulo ang median nga normal nga ekspresyon alang sa matag klase (timan-i nga ang BGC nga ekspresyon mismo gikalkulo ingon nga median nga ekspresyon sa biosynthetic nga mga gene alang sa BGC) ug gisulayan alang sa kahinungdanon sa tibuok estado (Kruskal-Wallis test adjust para sa FDR).
Ang mga sintetikong gene gipalit gikan sa GenScript ug ang mga primer sa PCR gipalit gikan sa Microsynth.Phusion polymerase gikan sa Thermo Fisher Scientific gigamit alang sa DNA amplification.Ang NucleoSpin plasmids, NucleoSpin gel ug PCR purification kit gikan sa Macherey-Nagel gigamit alang sa DNA purification.Ang mga restriction enzymes ug T4 DNA ligase gipalit gikan sa New England Biolabs.Ang mga kemikal gawas sa isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) ug 1,4-dithiothreitol (DTT, AppliChem) gipalit gikan sa Sigma-Aldrich ug gigamit nga walay dugang nga pagputli.Ang mga antibiotics nga chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt), ug carbenicillin (Cbn) gipalit gikan sa AppliChem.Ang mga sangkap sa media nga Bacto Tryptone ug Bacto Yeast Extract gipalit gikan sa BD Biosciences.Ang Trypsin alang sa pagkasunodsunod gipalit gikan sa Promega.
Ang mga han-ay sa gene gikuha gikan sa anti-SMASH nga gitagna nga BGC 75.1.E. malaspinii (Supplementary information).
Ang mga gene nga embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), ug embAM (lakip na ang intergene nga mga rehiyon) gisunod-sunod isip co-synthetic nga mga konstruksyon ug A (nga walay pdonR57) kanus-a.Ang embA gene gi-subclone sa unang multiple cloning site (MCS1) sa pACYCDuet-1(CmR) ug pCDFDuet-1(SmR) nga adunay BamHI ug HindIII cleavage sites.Ang embM ug embMopt genes (codon-optimized) gi-subclone sa MCS1 pCDFDuet-1(SmR) uban sa BamHI ug HindIII ug gibutang sa ikaduhang multiple cloning site sa pCDFDuet-1(SmR) ug pRSFDuet-1(KanR) (MCS2) uban sa NdeI/ChoI.Ang embAM cassette gi-subclone sa pCDFDuet1(SmR) nga adunay BamHI ug HindIII nga mga cleavage site.Ang orf3/embI gene (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) gihimo pinaagi sa overlap extension PCR gamit ang primers EmbI_OE_F_NdeI ug EmbI_OE_R_XhoI, gitunaw uban sa NdeI/XhoIFD, ug gihugpong sa NdeI/XhoIFD, ug gi-ligated ang MdeI/XhoIFD-1, ug gi-ligated ang MdeI/XhoIFD, ug gi-ligated ang MdeI/XhoIFD-1, ug gi-ligated ang MdeI/XhoIFD-1 nga enzyme (remb- Supplementary lamesa).6).Ang pagdili sa pagtunaw sa enzyme ug ligation gihimo sumala sa protocol sa tiggama (New England Biolabs).
Oras sa pag-post: Mar-14-2023