Tubo en espiral soldado de aceiro inoxidable 304/tubo zomponent zhemical, potencial biosintético do microbioma mariño global

Grazas por visitar Nature.com.Estás a usar unha versión do navegador con soporte CSS limitado.Para obter a mellor experiencia, recomendámosche que utilices un navegador actualizado (ou que desactives o modo de compatibilidade en Internet Explorer).Ademais, para garantir a asistencia continua, mostramos o sitio sen estilos e JavaScript.
Control deslizante que mostra tres artigos por diapositiva.Usa os botóns atrás e seguinte para moverte polas diapositivas ou os botóns do controlador de diapositivas ao final para moverte por cada diapositiva.

Descrición detallada do produto

Tubo/tubo soldado de aceiro inoxidable 304
1. Especificación: tubo / tubo de bobina de aceiro inoxidable
2. Tipo: soldado ou sen costura
3. Estándar: ASTM A269, ASTM A249
4. Tubo de bobina de aceiro inoxidable OD: 6 mm a 25,4 mm
5. Lonxitude: 600-3500MM ou segundo o requisito do cliente.
6. Espesor da parede: 0,2 mm a 2,0 mm.

7. Tolerancia: OD: +/-0,01 mm;Espesor: +/-0,01%.

8. Tamaño do burato interno da bobina: 500 MM-1500 MM (pódese axustar segundo os requisitos do cliente)

9. Altura da bobina: 200MM-400MM (pódese axustar segundo os requisitos do cliente)

10. Superficie: Brillante ou recocida
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, aliaxe 625, 825, 2205, 2507, etc.
12. Embalaxe: bolsas tecidas en caixa de madeira, palés de madeira, eixe de madeira ou segundo o requirimento do cliente
13. Proba: compoñente químico, límite de fluencia, resistencia á tracción, medición da dureza
14. Garantía: inspección de terceiros (por exemplo: SGS TV), etc.
15. Aplicación: decoración, mobles, transporte de aceite, intercambiador de calor, fabricación de varandas, fabricación de papel, automóbil, procesamento de alimentos, medicina, etc.

Toda a composición química e as propiedades físicas do aceiro inoxidable como a continuación:

Material ASTM A269 Composición química % Max
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0,08 2.00 0,045 0,030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1.00 17.0-19.0 9.0-12.0 10C -1,10 ^

 

Material Tratamento térmico Temperatura F (C) mín. Dureza
Brinell Rockwell
TP304 Solución 1900 (1040) 192 HBW/200 HV 90 HRB
TP304L Solución 1900 (1040) 192 HBW/200 HV 90 HRB
TP316 Solución 1900 (1040) 192 HBW/200 HV 90 HRB
TP316L Solución 1900 (1040) 192 HBW/200 HV 90 HRB
TP321 Solución 1900 (1040) F 192 HBW/200 HV 90 HRB
TP347 Solución 1900 (1040) 192 HBW/200 HV 90 HRB

 

OD, polgadas Tolerancia OD polgadas (mm) % de tolerancia ao peso Tolerancia de lonxitude polgadas (mm)
+ -
≤ 1/2 ± 0,005 (0,13) ± 15 1/8 (3,2) 0
> 1/2 ~ 1 1/2 ± 0,005 (0,13) ± 10 1/8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010 (0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015 (0,38) ± 10 3/16 (4,8) 0
> 5 1/2 ~ < 8 ± 0,030 (0,76) ± 10 3/16 (4,8) 0
8 ~ < 12 ± 0,040 (1,01) ± 10 3/16 (4,8) 0
12~<14 ± 0,050 (1,26) ± 10 3/16 (4,8) 0

As comunidades microbianas naturais son filoxenética e metabólicamente diversas.Ademais dos grupos de organismos pouco estudados1, esta diversidade tamén ten un rico potencial para o descubrimento de encimas e compostos bioquímicos significativos ecoloxicamente e biotecnoloxicamente2,3.Non obstante, estudar esta diversidade para determinar as vías xenómicas que sintetizan tales compostos e os unen aos seus respectivos hóspedes segue sendo un reto.O potencial biosintético dos microorganismos no océano aberto segue sendo moi descoñecido debido ás limitacións na análise dos datos de resolución do xenoma completo a escala global.Aquí, exploramos a diversidade e diversidade dos grupos de xenes biosintéticos no océano integrando uns 10.000 xenomas microbianos de células cultivadas e células individuais con máis de 25.000 xenomas de borrador recén reconstruídos de máis de 1.000 mostras de auga de mar.Estes esforzos identificaron preto de 40.000 presuntos grupos de xenes biosintéticos na súa maioría novos, algúns dos cales foron atopados en grupos filoxenéticos previamente insospeitados.Nestas poboacións, identificamos unha liñaxe enriquecida en clusters de xenes biosintéticos (“Candidatus Eudormicrobiaceae”) que pertencía a un filo bacteriano non cultivado e incluía algúns dos microorganismos biosintéticos máis diversos neste ambiente.Destes, caracterizamos as vías da fosfatase-péptido e da pitonamida, identificando casos de estrutura e enzimoloxía de compostos bioactivos pouco habituais, respectivamente.En conclusión, este estudo demostra como as estratexias baseadas no microbioma poden permitir a exploración de encimas e alimentos naturais previamente non descritos nunha microbiota e medio ambiente pouco coñecidos.
Os microbios impulsan os ciclos bioxeoquímicos globais, manteñen as redes tróficas e manteñen saudables as plantas e os animais5.A súa enorme diversidade filoxenética, metabólica e funcional representa un rico potencial para o descubrimento de novos taxons1, encimas e compostos bioquímicos, incluíndo produtos naturais6.Nas comunidades ecolóxicas, estas moléculas proporcionan aos microorganismos unha variedade de funcións fisiolóxicas e ecolóxicas, desde a comunicación ata a competencia 2, 7 .Ademais das súas funcións orixinais, estes produtos naturais e as súas vías de produción codificadas xeneticamente proporcionan exemplos de aplicacións biotecnolóxicas e terapéuticas2,3.A identificación de tales vías e conexións foi moi facilitada polo estudo de microbios cultivados.Porén, os estudos taxonómicos dos medios naturais demostraron que a gran maioría dos microorganismos non foron cultivados8.Este sesgo cultural limita a nosa capacidade de explotar a diversidade funcional codificada por moitos microbios4,9.
Para superar estas limitacións, os avances tecnolóxicos da última década permitiron aos investigadores secuenciar directamente (é dicir, sen cultivo previo) fragmentos de ADN microbiano de comunidades enteiras (metaxenómica) ou células individuais.A capacidade de ensamblar estes fragmentos en fragmentos de xenoma máis grandes e reconstruír varios xenomas ensamblados metaxenomicamente (MAG) ou xenomas amplificados únicos (SAG), respectivamente, abre unha importante oportunidade para estudos taxocéntricos do microbioma (é dicir, as comunidades microbianas e o microbioma).abrir novos camiños.material xenético propio nun medio determinado) 10,11,12.De feito, estudos recentes ampliaron moito a representación filoxenética da diversidade microbiana na Terra1, 13 e revelaron gran parte da diversidade funcional en comunidades microbianas individuais non cubertas anteriormente polas secuencias do xenoma de referencia de microorganismos cultivados (REF)14.A capacidade de situar a diversidade funcional non descuberta no contexto do xenoma do hóspede (é dicir, a resolución do xenoma) é fundamental para predicir liñas microbianas aínda non caracterizadas que presumiblemente codifican novos produtos naturais15,16 ou para rastrexar tales compostos ata o seu produtor orixinal17.Por exemplo, un enfoque combinado de análise metaxenómica e xenómica unicelular levou á identificación de Candidatus Entotheonella, un grupo de bacterias asociadas a esponxas ricas metabólicamente, como produtoras dunha variedade de potenciais fármacos18.Non obstante, a pesar dos recentes intentos de exploración xenómica de diversas comunidades microbianas,16,19 aínda faltan máis de dous terzos dos datos metaxenómicos globais para o maior océano de ecosistemas da Terra16,20.Así, en xeral, o potencial biosintético do microbioma mariño e o seu potencial como depósito de novos produtos enzimáticos e naturais seguen sendo moi pouco estudados.
Para explorar o potencial biosintético dos microbiomas mariños a escala global, primeiro reunimos xenomas microbianos mariños obtidos mediante métodos dependentes do cultivo e non culturais para crear unha extensa base de datos de filoxenética e función xénica.O exame desta base de datos revelou unha gran variedade de clusters de xenes biosintéticos (BGC), a maioría dos cales pertencen a familias de clusters de xenes (GCF) aínda non caracterizados.Ademais, identificamos unha familia bacteriana descoñecida que presenta a maior diversidade coñecida de BGC no océano aberto ata a data.Seleccionamos dúas vías de síntese de ribosomas e de péptidos modificados postraducionalmente (RiPP) para a validación experimental en función das súas diferenzas xenéticas coas vías coñecidas actualmente.A caracterización funcional destas vías revelou exemplos inesperados de enzimoloxía, así como compostos estruturalmente pouco habituais con actividade inhibidora da protease.
Nun primeiro momento, tiñamos como obxectivo crear un recurso global de datos para a análise do xenoma, centrándonos nos seus compoñentes bacterianos e arqueais.Para iso, reunimos datos metaxenómicos e 1038 mostras de auga mariña de 215 sitios de mostraxe distribuídos globalmente (rango de latitude = 141,6 °) e varias capas profundas (de 1 a 5600 m de profundidade, que abarcan as zonas peláxicas, mesopeláxicas e abisais).Antecedentes21,22,23 (Fig. 1a, datos ampliados, Fig. 1a e Táboa complementaria 1).Ademais de proporcionar unha ampla cobertura xeográfica, estas mostras filtradas selectivamente permitíronnos comparar varios compoñentes do microbioma mariño, incluíndo ricos en virus (<0,2 µm), ricos en procariotas (0,2–3 µm), ricos en partículas (0,8 µm). ).–20 µm) e colonias esgotadas de virus (>0,2 µm).
a, Un total de 1038 xenomas dispoñibles públicamente (metaxenómica) de comunidades microbianas mariñas recollidos de 215 lugares distribuídos globalmente (62°S a 79°N e 179°W a 179°E).Azulexos do mapa © Esri.Fontes: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ e Esri.b, estes metaxenomas utilizáronse para reconstruír MAGs (métodos e información adicional), que difiren en cantidade e calidade (métodos) nos conxuntos de datos (marcados en cor).Os MAG reconstruídos complementáronse con xenomas (externos) dispoñibles públicamente, incluíndo MAG26, SAG27 e REF artesanais.27 Compilar OMD.c, en comparación con informes anteriores baseados só en SAG (GORG)20 ou MAG (GEM)16, OMD mellora a caracterización xenómica das comunidades microbianas mariñas (taxa de lectura metaxenómica; método) en dúas ou tres veces cunha representación máis consistente en profundidade e latitude..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30-60° , n = 73, > 60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, A agrupación OMD en grupos de especies (identidade media de nucleótidos do 95%) identifica un total de aproximadamente 8300 especies, máis da metade das cales non foron caracterizadas previamente segundo anotacións taxonómicas utilizando o GTDB (versión 89). o microbioma mariño.En concreto, o 55%, 26% e 11% das especies foron específicas para MAG, SAG e REF, respectivamente.BATS, Serie Temporal do Atlántico das Bermudas;GEM, xenomas do microbioma terrestre;GORG, xenoma global de referencia do océano;HOT, serie temporal do océano hawaiano.
Usando este conxunto de datos, reconstruímos un total de 26.293 MAGs, na súa maioría bacterianos e arqueológicos (Fig. 1b e datos expandidos, Fig. 1b).Creamos estes MAG a partir de conxuntos de mostras metaxenómicas separadas en lugar de agrupadas para evitar o colapso da variación da secuencia natural entre mostras de diferentes lugares ou puntos de tempo (métodos).Ademais, agrupamos fragmentos xenómicos en función das súas correlacións de prevalencia nun gran número de mostras (de 58 a 610 mostras, dependendo da enquisa; método).Descubrimos que este é un paso lento pero importante24 que se omitiu en varios traballos de reconstrución a gran escala de MAG16, 19, 25 e que mellora significativamente a cantidade (2,7 veces de media) e a calidade (+20 % de media) do xenoma.reconstruído a partir do metaxenoma mariño estudado aquí (datos ampliados, figura 2a e información adicional).En xeral, estes esforzos deron como resultado un aumento de 4,5 veces nos MAG microbianos mariños (6 veces se só se consideran MAGs de alta calidade) en comparación co recurso MAG máis completo dispoñible na actualidade16 (Métodos).Este conxunto MAG de nova creación combinouse entón con 830 MAG26 escollidos a dedo, 5969 SAG27 e 1707 REF.Vinte e sete especies de bacterias mariñas e arqueas constituían unha colección combinatoria de 34.799 xenomas (Fig. 1b).
Despois avaliamos o recurso recén creado para mellorar a súa capacidade de representar comunidades microbianas mariñas e avaliar o impacto da integración de diferentes tipos de xenoma.De media, descubrimos que abarca aproximadamente o 40-60% dos datos metaxenómicos mariños (Figura 1c), dúas ou tres veces a cobertura dos informes anteriores só de MAG tanto en profundidade como en latitude. Máis serie 16 ou SAG20.Ademais, para medir sistemáticamente a diversidade taxonómica nas coleccións establecidas, anotamos todos os xenomas mediante o conxunto de ferramentas (métodos) da Base de datos de taxonomía xenómica (GTDB) e utilizamos unha identidade media de nucleótidos do xenoma do 95%.28 para identificar 8.304 grupos de especies (especies).Dous terzos destas especies (incluíndo novos clados) non apareceran previamente no GTDB, das cales 2790 foron descubertas mediante o MAG reconstruído neste estudo (Fig. 1d).Ademais, descubrimos que os diferentes tipos de xenomas son altamente complementarios: o 55%, 26% e 11% das especies están compostas enteiramente por MAG, SAG e REF, respectivamente (Fig. 1e).Ademais, MAG cubriu os 49 tipos atopados na columna de auga, mentres que SAG e REF só representaban 18 e 11 deles, respectivamente.Non obstante, SAG representa mellor a diversidade dos clados máis comúns (datos ampliados, Fig. 3a), como Pelagic Bacteriales (SAR11), con SAG que abarca case 1300 especies e MAG só 390 especies.En particular, os REF raramente se solapaban con MAG ou SAG a nivel de especie e representaban > 95% dos aproximadamente 1000 xenomas que non se atopan nos conxuntos metaxenómicos de océano aberto estudados aquí, principalmente debido ás interaccións con outros tipos de especímenes mariños representativos illados (por exemplo, sedimentos). .ou anfitrión asociado).Para que sexa amplamente dispoñible para a comunidade científica, este recurso do xenoma mariño, que tamén inclúe fragmentos non clasificados (por exemplo, de fagos previstos, illas xenómicas e fragmentos de xenoma para os que non hai datos suficientes para a reconstrución de MAG), pódese comparar con datos taxonómicos. .Acceda ás anotacións xunto coa función dos xenes e os parámetros contextuais na base de datos de microbioloxía oceánica (OMD; https://microbiomics.io/ocean/).
Despois propuxémonos explorar a riqueza e a novidade do potencial biosintético nos microbiomas do océano aberto.Para este fin, primeiro usamos antiSMASH para todos os MAG, SAG e REF atopados en 1038 metaxenomas mariños (métodos) para predicir un total de 39.055 BGC.A continuación, agrupamos estes en 6907 GCF non redundantes e 151 poboacións de cluster de xenes (GCC; Táboa complementaria 2 e métodos) para ter en conta a redundancia inherente (é dicir, o mesmo BGC pódese codificar en múltiples xenomas) e os datos metaxenómicos Fragmentación de BGC concentrados.Os BGC incompletos non aumentaron significativamente, se é o caso (información complementaria), o número de GCF e GCC, respectivamente, que conteñen polo menos un membro BGC intacto no 44% e 86% dos casos.
A nivel GCC, atopamos unha gran variedade de RiPP previstos e outros produtos naturais (Fig. 2a).Entre eles, por exemplo, os arilpolienos, carotenoides, ectoínas e sideróforos pertencen a GCC cunha ampla distribución filoxenética e unha gran abundancia en metaxenomas oceánicos, o que pode indicar unha ampla adaptación dos microorganismos ao medio mariño, incluíndo a resistencia ás especies reactivas do osíxeno, estrés oxidativo e osmótico..ou absorción de ferro (máis información).Esta diversidade funcional contrasta cunha análise recente de aproximadamente 1,2 millóns de BGC entre aproximadamente 190.000 xenomas almacenados na base de datos NCBI RefSeq (BiG-FAM/RefSeq, en diante RefSeq)29, que demostrou que os péptidos sintetasas non ribosómicas (NRPS) e a policétido sintase. (PKS) BGCs (Información complementaria).Tamén atopamos 44 (29 %) GCC só relacionados distantemente con calquera RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Fig. 2a e métodos) e 53 (35 %) GCC só en MAG, o que destaca o potencial. para detectar produtos químicos previamente non descritos en OMD.Dado que cada un destes GCC probablemente representa funcións biosintéticas moi diversas, analizamos aínda máis os datos a nivel de GCF nun esforzo por proporcionar unha agrupación máis detallada de BGC previstas para codificar produtos naturais similares29.Un total de 3861 (56%) GCF identificados non se solapaban con RefSeq, e > 97% dos GCF non estaban presentes en MIBiG, unha das maiores bases de datos de BGC validados experimentalmente (Figura 2b).Aínda que non é de estrañar descubrir moitas vías novas potenciais en escenarios que non están ben representados polo xenoma de referencia, o noso método para desreplicar BGC en GCF antes do benchmarking difire dos informes anteriores 16 e permítenos proporcionar unha avaliación imparcial da novidade.A maior parte da nova diversidade (3012 GCF ou 78%) corresponde a terpenos previstos, RiPP ou outros produtos naturais, e a maioría (1815 GCF ou 47%) está codificada en tipos descoñecidos debido ao seu potencial biosintético.A diferenza dos clústeres PKS e NRPS, estes BGC compactos teñen menos probabilidades de fragmentarse durante a ensamblaxe metaxenómica 31 e permiten unha caracterización funcional dos seus produtos con máis tempo e recursos.
Un total de 39.055 BGC agrupáronse en 6.907 GCF e 151 GCC.a, representación de datos (interna externa).Agrupación xerárquica de distancias BGC baseada en GCC, 53 das cales só están fixadas por MAG.O GCC contén BGC de diferentes taxons (frecuencia de porta transformada en ln) e diferentes clases de BGC (o tamaño do círculo corresponde á súa frecuencia).Para cada GCC, a capa exterior representa o número de BGC, a prevalencia (porcentaxe de mostras) e a distancia (distancia mínima do coseno BGC (min(dMIBiG))) de BiG-FAM a BGC.Os GCC con BGC estreitamente relacionados cos BGC verificados experimentalmente (MIBiG) están resaltados con frechas.b Comparando o GCF con BGC previstos (BiG-FAM) e validados experimentalmente (MIBiG), atopáronse 3861 GCF novos (d–>0,2).A maioría (78%) destes códigos para RiPP, terpenos e outros produtos naturais putativos.c, todos os xenomas do OMD atopados en 1038 metaxenomas mariños colocáronse na árbore base de GTDB para mostrar a cobertura filoxenética do OMD.Os clados sen ningún xenoma no OMD móstranse en gris.O número de BGC corresponde ao maior número de BGC previstos por xenoma nun determinado clado.Para máis claridade, o último 15% dos nodos están colapsados.As frechas indican clados ricos en BGC (>15 BGC), coa excepción de Mycobacterium, Gordonia (segundo só por Rhodococcus) e Crocosphaera (segundo só por Synechococcus).d, Descoñecido c.Eremiobacterota mostrou a maior diversidade biosintética (índice de Shannon baseado no tipo de produto natural).Cada banda representa o xenoma con máis BGC da especie.T1PKS, PKS tipo I, T2/3PKS, PKS tipo II e tipo III.
Ademais da riqueza e novidade, exploramos a estrutura bioxeográfica do potencial biosintético do microbioma mariño.A agrupación de mostras pola distribución media do número de copias GCF metaxenómicas (Métodos) mostrou que as comunidades de baixa latitude, superficiais, ricas en procariotas e pobres en virus, na súa maioría de augas superficiais ou máis profundas iluminadas polo sol, eran ricas en terpenos RiPP e BGC.Pola contra, as comunidades polares, profundas, ricas en virus e partículas asociáronse con maior abundancia de NRPS e PKS BGC (datos ampliados, figura 4 e información adicional).Finalmente, descubrimos que as comunidades tropicais e peláxicas ben estudadas son as fontes máis prometedoras de novos terpenos (Figura de datos aumentados).O maior potencial para PKS, RiPP e outros produtos naturais (Figura 5a con datos ampliados).
Para complementar o noso estudo do potencial biosintético dos microbiomas mariños, pretendemos mapear a súa distribución filoxenética e identificar novos clados enriquecidos con BGC.Para este fin, colocamos os xenomas de microbios mariños nunha árbore filoxenética bacteriana e arqueolóxica normalizada GTDB13 e superpoñemos as supostas vías biosintéticas que codifican (Fig. 2c).Detectamos facilmente varios clados enriquecidos con BGC (representados por máis de 15 BGC) en mostras de auga de mar (métodos) coñecidos polo seu potencial biosintético, como as cianobacterias (Synechococcus) e as bacterias Proteus, como Tistrella32,33, ou recentemente chamaron a atención polo seu potencial biosintético. produtos naturais.como Myxococcota (Sandaracinaceae), Rhodococcus e Planctomycetota34,35,36.Curiosamente, atopamos varias liñaxes previamente inexploradas nestes clados.Por exemplo, aquelas especies co potencial biosintético máis rico nos filos Planctomycetota e Myxococcota pertencían a ordes e xéneros candidatos non caracterizados, respectivamente (táboa complementaria 3).En conxunto, isto suxire que o OMD proporciona acceso a información filoxenética previamente descoñecida, incluíndo microorganismos, que poden representar novos obxectivos para o descubrimento de encimas e produtos naturais.
A continuación, caracterizamos o clado enriquecido con BGC non só contando o número máximo de BGC codificados polos seus membros, senón tamén avaliando a diversidade destes BGC, o que explica a frecuencia dos diferentes tipos de produtos candidatos naturais (Fig. 2c e métodos). )..Descubrimos que as especies máis biosintéticamente diversas estaban representadas por MAGs bacterianos especialmente deseñados neste estudo.Estas bacterias pertencen ao phylum inculto Candidatus Eremiobacterota, que permanece en gran parte sen explorar ademais dalgúns estudos xenómicos37,38.É de destacar que “ca.O xénero Eremiobacterota só foi analizado nun medio terrestre39 e non se sabe que inclúa ningún membro enriquecido en BGC.Aquí reconstruímos oito MAG da mesma especie (identidade de nucleótidos > 99%) 23. Por iso propoñemos o nome da especie “Candidatus Eudoremicrobium malaspinii”, que leva o nome da nereida (ninfa do mar), un fermoso agasallo na mitoloxía e nas expedicións gregas.'Ka.Segundo a anotación filoxenética 13, E. malaspinii non ten parentes previamente coñecidos por debaixo do nivel de secuencia e, polo tanto, pertence a unha nova familia bacteriana que propoñemos “Ca.E. malaspinii” como especie tipo e “Ca.Eudormicrobiaceae” como nome oficial (Información complementaria).Breve reconstrución metaxenómica de 'Ca.O proxecto do xenoma de E. malaspinii validouse mediante unha entrada moi baixa, unha secuenciación metaxenómica de lectura longa e unha ensamblaxe dirixida dunha única mostra (Métodos) como un único cromosoma lineal de 9,63 Mb cunha duplicación de 75 kb.como única ambigüidade que queda.
Para establecer o contexto filoxenético desta especie, buscamos 40 especies estreitamente relacionadas en mostras metaxenómicas adicionais enriquecidas con eucariotas da expedición ao océano Tara mediante a reconstrución específica do xenoma.Brevemente, ligamos lecturas metaxenómicas a fragmentos xenómicos asociados con "Ca.E. malaspinii” e hipotetizou que un aumento da taxa de contratación nesta mostra indica a presenza doutros parentes (métodos).Como resultado, atopamos 10 MAG, unha combinación de 19 MAGs que representan cinco especies en tres xéneros dentro dunha familia recentemente definida (é dicir, "Ca. Eudormicrobiaceae").Despois da inspección manual e do control de calidade (datos ampliados, Fig. 6 e información adicional), descubrimos que “Ca.As especies de Eudormicrobiaceae presentan xenomas máis grandes (8 Mb) e un potencial biosintético máis rico (14 a 22 BGC por especie) que outros membros "Ca".Clade Eremiobacterota (ata 7 BGC) (Fig. 3a-c).
a, Posicións filoxenéticas dos cinco 'Ca.As especies de Eudormicrobiaceae mostraron riqueza BGC específica para as liñas mariñas identificadas neste estudo.A árbore filoxenética inclúe todos os 'Ca.Para os antecedentes evolutivos (Métodos) utilizáronse MAG Eremiobacterota e membros doutros phyla (números do xenoma entre corchetes) proporcionados en GTDB (versión 89).As capas máis externas representan clasificacións a nivel familiar (“Ca. Eudormicrobiaceae” e “Ca. Xenobiaceae”) e a nivel de clase (“Ca. Eremiobacteria”).As cinco especies descritas neste estudo están representadas por códigos alfanuméricos e nomes binomiais propostos (Información complementaria).b, ok.As especies de Eudormicrobiaceae comparten sete núcleos BGC comúns.A ausencia de BGC no clado A2 debeuse á incompletitude do MAG representativo (táboa complementaria 3).Os BGC son específicos para “Ca.Amphitomicrobium” e “Ca.Amphitomicrobium” (clados A e B) non se amosan.c, Todos os BGC codificados como “Ca.Atopouse que Eudoremicrobium taraoceanii se expresa en 623 metatranscriptomas tomados dos océanos de Tara.Os círculos sólidos indican a transcrición activa.Os círculos laranxas indican cambios de dobra transformados en log2 por debaixo e por riba da taxa de expresión xenética doméstica (métodos).d, curvas de abundancia relativa (métodos) que mostran 'Ca.As especies de Eudormicrobiaceae están moi espalladas na maioría das concas oceánicas e en toda a columna de auga (desde a superficie ata unha profundidade de polo menos 4000 m).En base a estas estimacións, descubrimos que 'Ca.E. malaspinii' representa ata o 6% das células procariotas nas comunidades asociadas a grans peláxicos de profundidade.Consideramos que unha especie estaba presente nun sitio se se atopaba en calquera fracción do tamaño dunha determinada capa de profundidade.IO – Océano Índico, NAO – Atlántico Norte, NPO – Pacífico Norte, RS – Mar Vermello, SAO – Atlántico Sur, SO – Océano Austral, SPO – Pacífico Sur.
Estudo da abundancia e distribución de Ca.Eudormicrobiaceae, que, como atopamos, predomina na maioría das concas oceánicas, así como en toda a columna de auga (Fig. 3d).Localmente, constitúen o 6% da comunidade microbiana mariña, o que os converte nunha parte importante do microbioma mariño mundial.Ademais, atopamos o contido relativo de Ca.As especies de Eudormicrobiaceae e os seus niveis de expresión de BGC foron máis altos na fracción enriquecida de eucariotas (Fig. 3c e datos ampliados, Fig. 7), o que indica unha posible interacción coa materia particulada, incluído o plancto.Esta observación ten certa semellanza con 'Ca.Os BGC de eudoremicrobium que producen produtos naturais citotóxicos a través de vías coñecidas poden presentar un comportamento depredador (Información complementaria e datos ampliados, Figura 8), semellante a outros depredadores que producen especificamente metabolitos como Myxococcus41.Descubrimento de Ca.As eudormicrobiaceae en mostras menos dispoñibles (océanos profundos) ou eucariotas en lugar de procariotas poden explicar por que estas bacterias e a súa inesperada diversidade de BGC seguen sen estar claras no contexto da investigación sobre alimentos naturais.
En definitiva, buscamos validar experimentalmente a promesa do noso traballo baseado no microbioma para descubrir novas vías, encimas e produtos naturais.Entre as diferentes clases de BGC, sábese que a vía RiPP codifica unha rica diversidade química e funcional debido a varias modificacións postraducionais do péptido central por encimas maduras42.Así que escollemos dous 'Ca.Os BGC RiPP de Eudoremicrobium (figuras 3b e 4a-e) baséanse no mesmo que calquera BGC coñecido (\(\bar{d}\)MIBiG e \(\bar{d}\)RefSeq por riba de 0,2).
a–c, Expresión heteróloga in vitro e ensaios enzimáticos in vitro dun novo grupo (\(\bar{d}\)RefSeq = 0,29) de biosíntese de RiPP específica para especies de Ca de profundidade mariña.E. malaspinii' levou á produción de produtos difosforilados.c, modificacións identificadas mediante MS/MS de alta resolución (HR) (fragmentación indicada por ións b e y na estrutura química) e RMN (datos ampliados, figura 9).d, este péptido fosforilado presenta unha baixa inhibición micromolar da elastase dos neutrófilos de mamíferos, que non se atopa no péptido control e no péptido deshidratante (deshidratación inducida por eliminación química).O experimento repetiuse tres veces con resultados similares.Por exemplo, a expresión heteróloga dun segundo novo grupo \(\bar{d}\)RefSeq = 0,33) de biosíntese de proteínas dilucida a función de catro encimas maduros que modifican o péptido do núcleo de 46 aminoácidos.Os residuos téñense segundo o lugar de modificación previsto por HR-MS/MS, etiquetaxe de isótopos e análise de RMN (información complementaria).A cor discontinua indica que a modificación ocorre en calquera dos dous residuos.A figura é unha compilación de numerosos constructos heterólogos para mostrar a actividade de todos os encimas maduros no mesmo núcleo.h, Ilustración dos datos de RMN para a N-metilación de amidas.Os resultados completos móstranse na fig.10 con datos ampliados.i, A posición filoxenética do encima maduro do clúster de proteínas FkbM entre todos os dominios FkbM atopados na base de datos MIBiG 2.0 revela un encima desta familia con actividade N-metiltransferase (información complementaria).Móstranse diagramas esquemáticos de BGC (a, e), estruturas peptídicas precursoras (b, f) e estruturas químicas supostas de produtos naturais (c, g).
A primeira vía de RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) atopouse só nas especies de augas profundas “Ca.E. malaspinii” e codifica o precursor do péptido (Fig. 4a, b).Neste encima maduro, identificamos un único dominio funcional homólogo ao dominio de deshidratación da lantipéptido sintase que normalmente cataliza a fosforilación e a posterior eliminación de 43 (información complementaria).Polo tanto, predecimos que a modificación do péptido precursor implica esa deshidratación en dous pasos.Non obstante, usando espectrometría de masas en tándem (MS/MS) e espectroscopia de resonancia magnética nuclear (RMN), identificamos un péptido lineal polifosforilado (Fig. 4c).Aínda que foi inesperado, atopamos varias liñas de evidencia para apoiar que é o produto final: dous hóspedes heterólogos diferentes e sen deshidratación en ensaios in vitro, identificación de residuos clave mutados no sitio de deshidratación catalítica da encima madura.todo reconstruído por “Ca”.O xenoma de E. malaspinii (datos ampliados, Fig. 9 e información adicional) e, finalmente, a actividade biolóxica do produto fosforilado, pero non a forma deshidratada sintetizada quimicamente (Fig. 4d).De feito, descubrimos que presenta unha baixa actividade inhibidora da protease micromolar contra a elastase dos neutrófilos, comparable a outros produtos naturais relacionados no intervalo de concentración (IC50 = 14,3 μM) 44 , a pesar de que aínda está por dilucidar o papel ecolóxico.En base a estes resultados, propoñemos nomear a vía "foseptina".
O segundo caso é unha vía complexa RiPP específica para 'Ca.Predíuse que o xénero Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) codificaba produtos proteicos naturais (Fig. 4e).Estas vías son de especial interese biotecnolóxico debido á densidade e variedade esperadas de modificacións químicas pouco habituais establecidas polos encimas codificados polos relativamente curtos BGC45.Descubrimos que esta proteína difire das proteínas previamente caracterizadas en que carece tanto do principal motivo NX5N das policeramidas como do bucle de lantionina das lantonamidas [46].Para superar as limitacións dos patróns de expresión heterólogos comúns, usámolos xunto cun sistema aerodenitrificans Microvirgula personalizado para caracterizar catro encimas da vía madura (métodos).Usando unha combinación de MS/MS, etiquetaxe de isótopos e RMN, detectamos estes encimas maduros no núcleo de 46 aminoácidos do péptido (Fig. 4f, g, datos expandidos, Figs. 10-12 e información adicional).Entre os encimas maduros, caracterizamos a primeira aparición dun membro da familia FkbM O-metiltransferase 47 na vía RiPP e de forma inesperada descubrimos que este encima maduro introduce a N-metilación da columna vertebral (Fig. 4h, i e información adicional).Aínda que esta modificación é coñecida nos produtos naturais de NRP48, a N-metilación enzimática dos enlaces amida é unha reacción complexa pero biotecnoloxicamente significativa49 que ata agora foi de interese para a familia de borosinas RiPP.Especificidade 50,51.A identificación desta actividade noutras familias de encimas e RiPP pode abrir novas aplicacións e ampliar a diversidade funcional das proteínas 52 e a súa diversidade química.Con base nas modificacións identificadas e na lonxitude inusual da estrutura do produto proposta, propoñemos un nome de vía "pythonamide".
O descubrimento dunha enzimoloxía inesperada nunha familia de encimas caracterizada funcionalmente ilustra a promesa da xenómica ambiental para novos descubrimentos, e tamén ilustra a capacidade limitada de inferencia funcional baseada só na homoloxía de secuencias.Así, xunto cos informes de RiPPs polifosforilados bioactivos non canónicos, os nosos resultados demostran un valor intensivo en recursos pero crítico para os esforzos da bioloxía sintética para descubrir completamente a riqueza funcional, a diversidade e as estruturas pouco habituais dos compostos bioquímicos.
Aquí demostramos o rango de potencial biosintético codificado polos microbios e o seu contexto xenómico no microbioma mariño global, facilitando futuras investigacións poñendo o recurso resultante a disposición da comunidade científica (https://microbiomics.io/ocean/).Descubrimos que gran parte da súa novidade filoxenética e funcional só se pode obter reconstruíndo MAG e SAG, especialmente en comunidades microbianas infrautilizadas que poderían guiar os esforzos de bioprospección futuros.Aínda que aquí nos centraremos en 'Ca.Eudormicrobiaceae" como unha liñaxe especialmente "talentosa" biosintéticamente, moitas das BGC previstas na microbiota non descuberta probablemente codifiquen encimas non descritas anteriormente que producen compostos con accións ambientalmente e/ou biotecnolóxicamente significativas.
Incluíronse conxuntos de datos metaxenómicos dos principais estudos oceanográficos e de series temporais cunha profundidade de secuenciación suficiente para maximizar a cobertura das comunidades microbianas mariñas globais en concas oceánicas, capas profundas e ao longo do tempo.Estes conxuntos de datos (Táboa complementaria 1 e Figura 1) inclúen metaxenómica de mostras recollidas nos océanos de Tara (enriquecido con virus, n=190; enriquecido con procariotas, n=180)12,22 e a expedición BioGEOTRACES (n=480).Serie Temporal Oceánica Hawaiana (HOT, n = 68), Serie Temporal Bermuda-Atlántica (BATS, n = 62)21 e a Expedición Malaspina (n = 58)23.As lecturas de secuenciación de todos os fragmentos metaxenómicos filtráronse para a calidade mediante BBMap (v.38.71) eliminando os adaptadores de secuenciación das lecturas, eliminando as lecturas asignadas a secuencias de control de calidade (xenomas PhiX) e usando trimq=14, maq=20 descarta a mala calidade de lectura. maxns = 0 e minlength = 45. As análises posteriores executáronse ou fusionáronse con lecturas de control de calidade se se especificaba (bbmerge.sh minoverlap=16).As lecturas de control de calidade normalizáronse (obxectivo bbnorm.sh = 40, profundidade mental = 0) antes de construírse usando metaSPAdes (v.3.11.1 ou v.3.12 se fose necesario)53.Os contigs de andamios resultantes (en adiante denominados andamios) filtáronse finalmente por lonxitude (≥1 kb).
As 1038 mostras metaxenómicas dividíronse en grupos e, para cada grupo de mostras, as lecturas de control de calidade metaxenómica de todas as mostras coincidiron cos parénteses de cada mostra por separado, o que resultou no seguinte número de lecturas de grupos entre parénteses: Tara Virus mariños - Enriquecido (190×190), Procariotas Enriquecidos (180×180), BioGEOTRACES, HOT and BATS (610×610) e Malaspina (58×58).A cartografía realizouse mediante Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 que permite que as lecturas se correspondan con sitios secundarios (usando a bandeira -a).Filtráronse os aliñamentos para que teñan polo menos 45 bases de lonxitude, teñan unha identidade ≥97 % e abranguen ≥80 % das lecturas.Os ficheiros BAM resultantes procesáronse mediante o script jgi_summarize_bam_contig_depths para MetaBAT2 (v.2.12.1)55 para proporcionar cobertura dentro e entre mostras para cada grupo.Finalmente, agrupáronse os corchetes para aumentar a sensibilidade executando individualmente MetaBAT2 en todas as mostras con –minContig 2000 e –maxEdges 500. Usamos MetaBAT2 en lugar dun boxer de conxunto porque se demostrou en probas independentes que é o boxeador individual máis eficaz.e de 10 a 50 veces máis rápido que outros boxeadores de uso habitual57.Para probar o efecto das correlacións de abundancia, unha submostra de metaxenómica seleccionada ao azar (10 para cada un dos dous conxuntos de datos de Tara Ocean, 10 para BioGEOTRACES, 5 para cada serie temporal e 5 para Malaspina) só utilizou mostras.As mostras internas agrúpanse para obter información de cobertura.(Información adicional).
Na análise posterior incluíronse xenomas adicionais (externos), é dicir, 830 MAG seleccionados manualmente dun subconxunto do conxunto de datos Tara Oceans26, 5287 SAG do conxunto de datos GORG20 e datos da base de datos MAR (MarDB v. 4) de 1707 REF illados e 682 SAGs) 27. Para o conxunto de datos MarDB, os xenomas son seleccionados en función dos metadatos dispoñibles se o tipo de mostra coincide coa seguinte expresión regular: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] illado'.
A calidade de cada recipiente metaxenómico e xenomas externos avaliouse mediante CheckM (v.1.0.13) e Anvi'o's Lineage Workflow (v.5.5.0)58,59.Se CheckM ou Anvi'o informa de ≥50 % de integridade/completidade e ≤10 % de contaminación/redundancia, garda as células metaxenómicas e os xenomas externos para a súa posterior análise.A continuación, estas puntuacións combináronse en totalidade media (mcpl) e contaminación media (mctn) para clasificar a calidade do xenoma segundo os criterios comunitarios60 do seguinte xeito: calidade alta: mcpl ≥ 90 % e mctn ≤ 5 %;boa calidade: mcpl ≥ 70 %, mctn ≤ 10 %, calidade media: mcpl ≥ 50 % e mctn ≤ 10 %, calidade xusta: mcpl ≤ 90 % ou mctn ≥ 10 %.Os xenomas filtrados correlacionáronse despois coas puntuacións de calidade (Q e Q') do seguinte xeito: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilidade da cepa)/100 + 0,5 x log[N50] .(implementado en dRep61).
Para permitir a análise comparativa entre diferentes fontes de datos e tipos de xenoma (MAG, SAG e REF), desreferenciaronse 34.799 xenomas en función da identidade media de nucleótidos (ANI) de todo o xenoma mediante dRep (v.2.5.4).Repeticións)61 ​​con limiares de ANI do 95%28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) e xenes marcadores dunha soa copia usando SpecI63 que proporciona a agrupación do xenoma a nivel de especie.Seleccionouse un xenoma representativo para cada clúster dRep segundo a puntuación máxima de calidade (Q') definida anteriormente, que se considerou representativa da especie.
Para avaliar a velocidade de mapeamento, utilizouse BWA (v.0.7.17-r1188, -a) para mapear todos os 1038 conxuntos de lecturas metaxenómicas con 34.799 xenomas contidos no OMD.As lecturas controladas por calidade foron mapeadas en modo de extremo único e as aliñacións resultantes filtráronse para reter só as aliñacións ≥45 pb de lonxitude.e identidade ≥95%.A proporción de visualización de cada mostra é a porcentaxe de lecturas restantes despois da filtración dividida polo número total de lecturas de control de calidade.Usando o mesmo enfoque, cada un dos 1038 metaxenomas reduciuse a 5 millóns de insercións (datos ampliados, figura 1c) e emparejouse con GORG SAG en OMD e en todos os GEM16.A cantidade de MAGs recuperados da auga de mar no catálogo GEM16 determinouse mediante consultas de palabras clave de fontes metaxenómicas, seleccionando mostras de auga de mar (por exemplo, en oposición aos sedimentos mariños).En concreto, seleccionamos "acuático" como "categoría_ecosistema", "mariño" como "tipo_ecosistema" e filtramos "hábitat" como "océano profundo", "mariño", "oceánico marítimo", "mariño peláxico", "auga mariña" , "Océano", "Auga de mar", "Auga de mar superficial", "Auga de mar superficial".Isto deu lugar a 5903 MAG (734 de alta calidade) distribuídos en 1823 OTU (consulta aquí).
Os xenomas procariotas anotáronse taxonómicamente mediante GTDB-Tk (v.1.0.2)64 con parámetros predeterminados dirixidos á versión 13 de GTDB r89. Utilizouse Anvi'o para identificar xenomas eucariotas baseándose na predición do dominio e a lembranza ≥50% e a redundancia ≤ 10%.A anotación taxonómica dunha especie defínese como un dos seus xenomas representativos.Coa excepción dos eucariotas (148 MAG), cada xenoma foi anotado funcionalmente primeiro usando prokka (v.1.14.5)65, nomeando xenes completos, definindo parámetros de "arqueas" ou "bacterias" segundo fose necesario, o que tamén se informa para non xenes codificantes.e rexións CRISPR, entre outras características xenómicas.Anotar xenes previstos identificando xenes marcadores universais dunha soa copia (uscMG) mediante fetchMG (v.1.2)66, asignar grupos ortólogos e consultar mediante emapper (v.2.0.1)67 baseado en eggNOG (v.5.0)68.Base de datos KEGG (publicada o 10 de febreiro de 2020) 69. O último paso realizouse facendo coincidir proteínas coa base de datos KEGG mediante DIAMOND (v.0.9.30)70 cunha consulta e unha cobertura temática de ≥70 %.Os resultados filtráronse aínda máis segundo o NCBI Prokaryotic Genome Annotation Pipeline71 baseándose na taxa de bits ≥ 50 % da taxa de bits máxima esperada (enlace en si).Tamén se utilizaron secuencias xenéticas como entrada para identificar BGC no xenoma mediante antiSMASH (v.5.1.0)72 con parámetros predeterminados e diferentes explosións de cluster.Compiláronse todos os xenomas e anotacións en OMD xunto cos metadatos contextuais dispoñibles na web (https://microbiomics.io/ocean/).
De xeito similar aos métodos descritos anteriormente12,22, usamos CD-HIT (v.4.8.1) para agrupar >56,6 millóns de xenes codificantes de proteínas de xenomas bacterianos e arqueais de OMD nun 95% de identidade e xenes máis curtos (90% de cobertura)73 ata > 17,7 millóns de agrupacións de xenes.Elixiuse a secuencia máis longa como xene representativo de cada grupo de xenes.Os 1038 metaxenomas emparejáronse entón con > 17,7 millóns de membros do clúster BWA (-a) e os ficheiros BAM resultantes filtráronse para conservar só aliñamentos con ≥95% por cento de identidade e ≥45 aliñacións de base.A abundancia de xenes normalizados en lonxitude calculouse contando primeiro as insercións da mellor aliñación única e despois, para as insercións con mapas difusos, engadindo recontos fraccionarios aos xenes diana correspondentes proporcionais ao seu número de insercións únicas.
Os xenomas do OMD expandido (con MAGs adicionais de "Ca. Eudormicrobiaceae", ver a continuación) foron engadidos á base de datos da ferramenta de análise metaxenómica mOTUs74 (v.2.5.1) para crear unha base de datos de referencia mOTU estendida.Só seis xenomas dunha soa copia (23.528 xenomas) sobreviviron de cada dez uscMG.A ampliación da base de datos deu lugar a 4.494 clusters adicionais a nivel de especie.Analizáronse 1038 metaxenomas utilizando parámetros mOTU predeterminados (v.2).Un total de 989 xenomas contidos en 644 clusters mOTU (95% REF, 5% SAG e 99,9% pertencentes a MarDB) non foron detectados polo perfil mOTU.Isto reflicte varias fontes adicionais de illamento mariño dos xenomas de MarDB (a maioría dos xenomas non detectados están asociados con organismos illados de sedimentos, hóspedes mariños, etc.).Para seguir centrándonos no ambiente do océano aberto neste estudo, excluímolos da análise augas abaixo a menos que fosen detectados ou incluídos na base de datos mOTU estendida creada neste estudo.
Todos os BGC de MAG, SAG e REF en OMD (ver arriba) combináronse con BGC identificados en todos os andamios metaxenómicos (antiSMASH v.5.0, parámetros predeterminados) e caracterizados mediante BiG-SLICE (v.1.1) (dominio PFAM)75.En base a estas características, calculamos todas as distancias coseno entre os BGC e agrupámolas (enlaces medios) en GCF e GCC usando limiares de distancia de 0,2 e 0,8 respectivamente.Estes limiares son unha adaptación dos limiares usados ​​anteriormente usando a distancia euclidiana75 xunto coa distancia coseno, o que alivia parte do erro na estratexia de agrupación BiG-SLICE orixinal (información complementaria).
Despois filtráronse os BGC para reter só ≥5 kb codificados en andamios para reducir o risco de fragmentación como se describiu anteriormente16 e para excluír os REF e SAG de MarDB que non se atopan en 1038 metaxenomas (ver arriba).Isto deu lugar a que un total de 39.055 BGC fosen codificados polo xenoma OMD, con 14.106 adicionais identificados en fragmentos metaxenómicos (é dicir, non combinados en MAGs).Estes BGC "metaxenómicos" utilizáronse para estimar a proporción do potencial de biosíntese do microbioma mariño non capturado na base de datos (información complementaria).Cada BGC caracterizouse funcionalmente segundo os tipos de produtos preditivos definidos por categorías de produtos anti-SMASH ou máis grosas definidas en BiG-SCAPE76.Para evitar o sesgo de mostraxe na cuantificación (composición taxonómica e funcional de GCC/GCF, distancia de GCF e GCC ás bases de datos de referencia e abundancia metaxenómica de GCF), mantendo só o BGC máis longo por GCF para cada especie, deduplicáronse 39.055 BGC. resultando nun total de 17.689 BGC.
A novidade de GCC e GCF avaliouse en función da distancia entre a base de datos calculada (base de datos RefSeq en BiG-FAM)29 e o BGC verificado experimentalmente (MIBIG 2.0)30.Para cada un dos 17.689 BGC representativos, escollemos a distancia coseno máis pequena á base de datos respectiva.Estas distancias mínimas son entón medias (media) segundo GCF ou GCC, segundo corresponda.Un GCF considérase novo se a distancia á base de datos é superior a 0,2, o que corresponde a unha separación ideal entre o GCF (medio) e a referencia.Para GCC, escollemos 0,4, que é o dobre do limiar definido por GCF, para bloquear unha relación a longo prazo coas ligazóns.
A abundancia metaxenómica de BGC estimouse como a abundancia media dos seus xenes biosintéticos (según o determinado por anti-SMASH) dispoñible a partir dos perfís a nivel xenético.A abundancia metaxenómica de cada GCF ou GCC calculouse entón como a suma de BGC representativos (de 17.689).Estes mapas de abundancia foron posteriormente normalizados para a composición celular usando o reconto de mOTU por mostra, que tamén representaba os esforzos de secuenciación (datos ampliados, figura 1d).A prevalencia de GCF ou GCC calculouse como a porcentaxe de mostras cunha abundancia > 0.
A distancia euclidiana entre mostras calculouse a partir do perfil GCF normalizado.Estas distancias reducíronse en tamaño usando UMAP77 e as incorporacións resultantes usáronse para a agrupación baseada en densidade non supervisada usando HDBSCAN78.O número mínimo óptimo de puntos para un clúster (e, polo tanto, o número de clústeres) usado por HDBSCAN determínase maximizando a probabilidade acumulada de pertenza ao clúster.Os clusters identificados (e unha submostra aleatoria equilibrada destes clusters para ter en conta o sesgo na análise multivariante permutacional da varianza (PERMANOVA)) probáronse para determinar a significación fronte a distancias euclidianas non reducidas mediante PERMANOVA.O tamaño medio do xenoma das mostras calculouse en función da abundancia relativa de mOTU e do tamaño estimado do xenoma dos membros dos xenomas.En particular, o tamaño medio do xenoma de cada mOTU estimouse como a media dos tamaños do xenoma dos seus membros corrixidos para a súa integridade (despois do filtrado) (por exemplo, un xenoma completo ao 75% cunha lonxitude de 3 Mb ten un tamaño axustado de 4 Mb).para xenomas medios con integridade ≥70%.O tamaño medio do xenoma para cada mostra calculouse entón como a suma dos tamaños do xenoma mOTU ponderados pola abundancia relativa.
Un conxunto filtrado de BGC codificados polo xenoma no OMD móstrase en árbores GTDB bacterianas e arqueas (en marcos ≥5 kb, excluíndo REF e SAG MarDB que non se atopan en 1038 metaxenomas, ver arriba) e as súas categorías de produtos previstas en función da filoxenética. posición do xenoma (ver arriba).Primeiro reducimos os datos por especie, utilizando como representativo o xenoma con máis BGC desa especie.Para a visualización, os representantes dividíronse aínda máis en grupos de árbores e, de novo, para cada clado celular, seleccionouse como representante o xenoma que contén o maior número de BGC.As especies enriquecidas con BGC (polo menos un xenoma con >15 BGC) analizáronse máis adiante calculando o Índice de Diversidade de Shannon para os tipos de produtos codificados neses BGC.Se todos os tipos de produtos previstos son iguais, considérase que os híbridos químicos e outros BGC complexos (según o previsto polo anti-SMAH) pertencen ao mesmo tipo de produto, independentemente da súa orde no clúster (por exemplo, fusión proteína-bacteriocina e bacteriocina-proteoproteína). corpo).híbrido).
ADN restante (estimado en 6 ng) da mostra de Malaspina MP1648, correspondente á mostra biolóxica SAMN05421555 e combinado co conxunto de lectura metaxenómica Illumina SRR3962772 para lectura curta, procesado segundo o protocolo de secuenciación PacBio con entrada ultra baixa para usar a amplificación da mostra de gDNA do kit PacBio SMRTbell kit (100-980-000) e kit de preparación de modelos SMRTbell Express 2.0 (100-938-900).Brevemente, o ADN restante foi cortado, reparado e purificado (perlas ProNex) usando Covaris (g-TUBE, 52104).A continuación, o ADN purificado sométese á preparación da biblioteca, amplificación, purificación (perlas ProNex) e selección de tamaño (>6 kb, Blue Pippin) antes dun paso final de purificación (perlas ProNex) e secuenciación na plataforma Sequel II.
Reconstrución dos dous primeiros ca.Para MAG Eremiobacterota, identificamos seis ANI adicionais > 99% (estes inclúense na Figura 3), que se filtraron inicialmente en función das puntuacións de contaminación (logo identificadas como duplicacións de xenes, ver a continuación).Tamén atopamos unha bandexa coa etiqueta "Ca".Eremiobacterota” de varios estudos23 e utilizounos xunto con oito MAG do noso estudo como referencia para lecturas metaxenómicas de 633 mostras enriquecidas de eucariotas (>0,8 µm) utilizando BWA (v.0.7.17) Ref -r1188, – a flag) para a mostraxe inferior. cartografía (5 millóns de lecturas).En base a mapas específicos de enriquecemento (filtrados por identidade de aliñamento do 95 % e cobertura de lectura do 80 %), seleccionáronse 10 metaxenomas (cobertura esperada ≥5×) para a súa montaxe e 49 metaxenomas adicionais (cobertura esperada ≥1×) para a correlación do contido.Usando os mesmos parámetros que o anterior, estas mostras foron almacenadas e engadíronse 10 'Ca's adicionais.MAG Eremiobacterota foi restaurado.Estes 16 MAG (sen contar os dous que xa están na base de datos) elevan o número total de xenomas no OMD expandido a 34.815.Aos MAG asígnaselles rangos taxonómicos en función da súa semellanza xenómica e da súa posición na GTDB.18 MAG foron desreplicados usando dRep en 5 especies (ANI intraespecífico > 99%) e 3 xéneros (ANI intragenérico de 85% a 94%) dentro da mesma familia79.Os representantes das especies foron seleccionados manualmente en función da integridade, contaminación e N50.A nomenclatura suxerida atópase na Información complementaria.
Avaliar a integridade e contaminación de 'Ca.MAG Eremiobacterota, avaliamos a presenza de uscMG, así como os conxuntos de xenes marcadores dunha soa copia específicos de liñaxe e dominio utilizados por CheckM e Anvi'o.A identificación de 2 duplicados de 40 uscMG foi confirmada por reconstrución filoxenética (ver máis abaixo) para descartar calquera posible contaminación (isto corresponde ao 5% en función destes 40 xenes marcadores).Un estudo adicional de cinco MAG representativos 'Ca.O baixo nivel de contaminantes nestes xenomas reconstruídos confirmouse para as especies de Eremiobacterota mediante a interface interactiva Anvi'o baseada nas correlacións de abundancia e composición de secuencias (información complementaria)59.
Para a análise filoxenómica, seleccionamos cinco MAG representativos "Ca".Eudormicrobiaceae”, todas as especies “Ca.O xenoma de Eremiobacterota e membros doutros filos (incluíndo UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria e Planctomycetota) está dispoñible en GTDB (r89)13.Todos estes xenomas foron anotados como se describiu anteriormente para a extracción de xenes marcadores de copia única e a anotación BGC.Os xenomas de GTDB conserváronse segundo os criterios de integridade e contaminación anteriores.A análise filoxenética realizouse mediante o fluxo de traballo Anvi'o Phylogenetics59.A árbore construíuse usando IQTREE (v.2.0.3) (opcións predeterminadas e -bb 1000)80 nun aliñamento de 39 proteínas ribosómicas en tándem identificadas por Anvi'o (MUSCLE, v.3.8.1551)81.Os seus postos foron reducidos.para cubrir polo menos o 50% do xenoma82 e Planctomycecota utilizouse como un grupo externo baseado na topoloxía da árbore GTDB.Creouse unha árbore de 40 uscMG usando as mesmas ferramentas e parámetros.
Usamos Traitar (v.1.1.2) con parámetros predeterminados (fenotipo, a partir de nucleótidos)83 para predicir trazos microbianos comúns.Exploramos un posible estilo de vida depredador baseado nun índice depredador desenvolvido previamente84 que depende do contido dun xene codificador de proteínas no xenoma.En concreto, usamos DIAMOND para comparar proteínas do xenoma coa base de datos OrthoMCL (v.4)85 utilizando as opcións –máis sensible –id 25 –query-cover 70 –subject-cover 70 –top 20 E contar os xenes correspondentes a xenes marcadores de depredadores e non depredadores.O índice é a diferenza entre o número de marcas depredadoras e non depredadoras.Como control adicional, tamén analizamos o xenoma "Ca".O factor Entotheonella TSY118 baséase na súa asociación con Ca.Eudoremicrobium (gran tamaño do xenoma e potencial biosintético).A continuación, probamos os vínculos potenciais entre xenes marcadores de depredadores e non depredadores e o potencial biosintético de Ca.Eudormicrobiaceae” e descubriu que non máis dun xene (de calquera tipo de xene marcador, é dicir, xene depredador/non depredador) se solapa co BGC, o que suxire que o BGC non confunde os sinais de depredación.Realizouse unha anotación xenómica adicional de replicóns codificados mediante TXSSCAN (v.1.0.2) para examinar especificamente o sistema de secreción, os pili e os flaxelos86.
Mapeáronse cinco 'Ca' representativos mapeando 623 metatranscriptomas das fraccións de enriquecemento procariotas e eucariotas dos océanos de Tara22,40,87 (usando BWA, v.0.7.17-r1188, -a flag).Xenoma de Eudormicrobiaceae.Os ficheiros BAM procesáronse con FeatureCounts (v.2.0.1)88 tras un 80 % de cobertura de lectura e un 95 % de filtrado de identidade (con opcións featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Conta o número de insercións por xene.Os mapas xerados normalizáronse para a lonxitude do xene e a abundancia de xenes marcadores mOTU (conto medio de inserción normalizado por lonxitude para xenes con reconto de inserción > 0) e transformáronse logarítmicamente a 22,74 para obter a expresión relativa por célula de cada nivel de xene, o que tamén explica o variabilidade dunha mostra á mostra durante a secuenciación.Tales ratios permiten a análise comparativa, mitigando os problemas de composición cando se usan datos de abundancia relativa.Só se consideraron mostras con >5 dos xenes marcadores de 10 mOTU para unha análise posterior para permitir detectar unha porción suficientemente grande do xenoma.
O perfil do transcriptoma normalizado de 'Ca.E. taraoceanii foi sometido a redución da dimensionalidade mediante UMAP e a representación resultante utilizouse para a agrupación sen supervisión mediante HDBSCAN (ver arriba) para determinar o estado da expresión.PERMANOVA proba a importancia das diferenzas entre os grupos identificados no espazo de distancia orixinal (non reducido).Probouse a expresión diferencial entre estas condicións a través do xenoma (ver arriba) e identificáronse 201 vías KEGG en 6 grupos funcionais, a saber: BGC, sistema de secreción e xenes flaxelares de TXSSCAN, encimas de degradación (protease e peptidases) e predadores e non. xenes depredadores.marcadores índice depredadores.Para cada mostra, calculamos a expresión normalizada media para cada clase (teña en conta que a propia expresión de BGC calcúlase como a expresión media de xenes biosintéticos para ese BGC) e probamos a súa significación entre os estados (proba de Kruskal-Wallis axustada para FDR).
Os xenes sintéticos foron adquiridos de GenScript e os cebadores de PCR foron adquiridos de Microsynth.Utilizouse a polimerase Phusion de Thermo Fisher Scientific para a amplificación do ADN.Para a purificación do ADN utilizáronse plásmidos NucleoSpin, xel NucleoSpin e kit de purificación por PCR de Macherey-Nagel.Os encimas de restrición e a ADN ligase T4 foron adquiridos de New England Biolabs.Os produtos químicos distintos do isopropil-β-d-1-tiogalactopiranósido (IPTG) (Biosynth) e o 1,4-ditiotreitol (DTT, AppliChem) foron adquiridos de Sigma-Aldrich e utilizáronse sen máis purificación.Os antibióticos cloranfenicol (Cm), diclorhidrato de espectinomicina (Sm), ampicilina (Amp), gentamicina (Gt) e carbenicilina (Cbn) foron adquiridos de AppliChem.Os compoñentes de medios Bacto Tryptone e Bacto Yeast Extract foron adquiridos a BD Biosciences.A tripsina para a secuenciación foi adquirida a Promega.
As secuencias xenéticas foron extraídas do BGC 75.1 previsto anti-SMASH.E. malaspinii (Información complementaria).
Os xenes emba (locus, mala_samn05422137_metag-framework_127-gene_5), embm (locus, mala_samn05422137_metag-fotograma_127-gene_4), e embam) (incluídas as rexións intergeneas) foron secuenciadas por pódese en PUC57), incluíndo as codóns e as rexións intergeno) en PUC57 (Ampr) (incluídas as rexións intergeno. cando.O xene embA subclonouse no primeiro sitio de clonación múltiple (MCS1) de pACYCDuet-1(CmR) e pCDFDuet-1(SmR) con sitios de escisión BamHI e HindIII.Os xenes embM e embMopt (optimizados en codóns) subclonáronse en MCS1 pCDFDuet-1(SmR) con BamHI e HindIII e colocáronse no segundo sitio de clonación múltiple de pCDFDuet-1(SmR) e pRSFDuet-1(KanR) (MCS2) con NdeI/ChoI.O casete embAM foi subclonado en pCDFDuet1(SmR) con sitios de escisión BamHI e HindIII.O xene orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) construíuse mediante PCR de extensión por solapamento usando cebadores EmbI_OE_F_NdeI e EmbI_OE_R_XhoI, dixeridos con NdeI/XhoI e ligados ao mesmo en-1CDF usando os mesmos pMC-1CDF. (Complementario táboa).6).A dixestión e ligadura dos encimas de restrición realizouse segundo o protocolo do fabricante (New England Biolabs).

 


Hora de publicación: 14-mar-2023