Em formação

9.2: Um lado técnico - Transposons - Biologia

9.2: Um lado técnico - Transposons - Biologia



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Em seu estudo, Lewis et al usaram o que é conhecido como “elemento genético móvel” ou transposons para gerar mutações. Um transposon é um pedaço de DNA que pode se mover (pular) de um lugar para outro no genoma259. A geneticista (e ganhadora do prêmio Nobel) Barbara McClintock (1902–1992) identificou pela primeira vez os transposons no curso de estudos de milho (Zea mays)260. Existem dois tipos básicos de transposons. Os transposons do tipo II consistem em uma sequência de DNA que codifica proteínas que permitem que ela se exceda de uma molécula de DNA maior (hospedeira) e se insira em outro local dentro do genoma da célula hospedeira - ela salta de um lugar para outro no genoma. O segundo transposon, tipo I, pode fazer cópias de si mesmo, por meio de um intermediário de RNA, e essa cópia pode ser usada para gerar um DNA complementar que pode então ser inserido no genoma do hospedeiro, deixando a cópia original no lugar. Ambos os tipos de transposon codificam as proteínas necessárias para reconhecer a sequência do transposon e mediar seu movimento ou replicação, e subsequente inserção em novos locais. Se a sequência do transposon for inserida em um gene, ela pode criar uma mutação nula ou amorfa nesse gene, interrompendo as sequências regulatórias ou de codificação do gene. Os transposons são apenas uma de uma classe de moléculas de DNA que podem atuar como parasitas moleculares, algo que nem Darwin nem os fundadores da genética previram, mas que faz sentido do ponto de vista molecular, uma vez que a capacidade de replicar, cortar e unir moléculas de DNA evoluiu . Essas várias atividades estão associadas ao reparo de mutações envolvendo quebras de fita simples e dupla no DNA, mas aparentemente também tornaram possível os parasitas baseados em DNA. Se uma célula hospedeira infectada com um transposon se replica, ela também replica a sequência do transposon, que será herdada pela descendência da célula. Este é um processo conhecido como transmissão vertical, tópico ao qual retornaremos em breve.

Como os transposons normalmente não codificam funções essenciais, as mutações podem inibir os vários componentes moleculares envolvidos em sua replicação e salto dentro de um genoma. Eles podem ser inativados (mortos) por mutação aleatória, e não há nenhuma vantagem seletiva (imediata ou aparente) para mantê-los. Se você se lembrar de nossa discussão sobre DNA, o genoma humano e muitos outros tipos de genomas contêm múltiplas cópias de sequências específicas. Análises subsequentes revelaram que estes representam formas “mortas” de transposons e parasitas moleculares baseados em DNA relacionados. Estima-se que o genoma humano contém ~ 50.000 cópias do transposon do tipo Alu e que ~ 50% do genoma humano consiste em transposons mortos. Provavelmente não é muito surpreendente, então, que haja movimento dentro dos genomas durante o curso da vida de um organismo, uma vez que alguns transposons ainda estão ativos.


Genoma humano

o genoma humano é um conjunto completo de sequências de ácido nucléico para humanos, codificadas como DNA dentro dos 23 pares de cromossomos nos núcleos das células e em uma pequena molécula de DNA encontrada nas mitocôndrias individuais. Estes são geralmente tratados separadamente como o genoma nuclear e o genoma mitocondrial. [2] Os genomas humanos incluem genes de DNA codificadores de proteínas e DNA não codificador. Os genomas humanos haplóides, que estão contidos nas células germinativas (as células do gameta do óvulo e do espermatozóide criadas na fase meiose da reprodução sexual antes da fertilização criar um zigoto) consistem em três bilhões de pares de bases de DNA, enquanto os genomas diplóides (encontrados nas células somáticas) têm o dobro o conteúdo de DNA. Embora existam diferenças significativas entre os genomas de indivíduos humanos (na ordem de 0,1% devido a variantes de nucleotídeo único [3] e 0,6% ao considerar indels), [4] estes são consideravelmente menores do que as diferenças entre humanos e seus mais próximos parentes vivos, os bonobos e chimpanzés (

1,1% de variantes fixas de nucleotídeo único [5] e 4% quando incluindo indels). [6]

Embora a sequência do genoma humano tenha sido (quase) completamente determinada por sequenciamento de DNA, ela ainda não está totalmente compreendida. A maioria (embora provavelmente não todos) os genes foram identificados por uma combinação de abordagens experimentais e bioinformáticas de alto rendimento, mas ainda há muito trabalho a ser feito para elucidar ainda mais as funções biológicas de suas proteínas e produtos de RNA. Resultados recentes sugerem que a maioria das vastas quantidades de DNA não codificador no genoma têm atividades bioquímicas associadas, incluindo regulação da expressão gênica, organização da arquitetura cromossômica e sinais que controlam a herança epigenética.

Antes da aquisição da sequência completa do genoma, as estimativas do número de genes humanos variavam de 50.000 a 140.000 (com vagas ocasionais sobre se essas estimativas incluíam genes que não codificam proteínas). [7] À medida que a qualidade da sequência do genoma e os métodos para identificar genes codificadores de proteínas melhoraram, [8] a contagem de genes codificadores de proteínas reconhecidos caiu para 19.000-20.000. [9] No entanto, uma compreensão mais completa do papel desempenhado por sequências que não codificam proteínas, mas, em vez disso, expressam RNA regulador, aumentou o número total de genes para pelo menos 46.831, [10] mais outros 2300 genes de micro-RNA. [11] Em 2012, foram observados elementos funcionais de DNA que não codificam nem RNA nem proteínas. [12] Uma pesquisa populacional de 2018 encontrou outras 300 milhões de bases do genoma humano que não estavam na sequência de referência. [13]

As sequências de codificação de proteína representam apenas uma fração muito pequena do genoma (aproximadamente 1,5%), e o resto está associado a genes de RNA não codificantes, sequências de DNA regulatórias, LINEs, SINEs, íntrons e sequências para as quais ainda não funcionam foi determinado. [14]


B.1 Intervalos de confiança

Sabemos que dada uma amostra aleatória de uma população de interesse, é improvável que o valor de uma estatística de interesse seja exatamente igual ao valor real da população dessa estatística. No entanto, nossas simulações nos ensinaram uma série de coisas:

Conforme o tamanho da amostra aumenta, o estimativa de amostra da estatística fornecida é mais provável que esteja próximo do valor verdadeiro dessa estatística

Conforme o tamanho da amostra aumenta, o erro padrão da estatística diminui

Vamos definir um “intervalo de confiança percentual de X% para uma estatística de interesse”, como um intervalo (limite superior e inferior) que, quando calculado a partir de uma amostra aleatória, incluiria o valor real da população da estatística de interesse, X% do Tempo.

Esta citação da página NIST sobre intervalos de confiança, que adaptei para se referir a qualquer estatística, ajuda a tornar isso concreto em relação aos intervalos de confiança:

Como uma nota técnica, um intervalo de confiança de 95% não significa que haja uma probabilidade de 95% de que o intervalo contenha a [estatística] verdadeira. O intervalo calculado a partir de uma determinada amostra contém a verdadeira [estatística] ou não. Em vez de, o nível de confiança está associado ao método de cálculo do intervalo ... Ou seja, para um intervalo de confiança de 95%, se muitas amostras forem coletadas e o intervalo de confiança calculado, no longo prazo cerca de 95% desses intervalos conteriam a verdadeira [estatística].

A ideia por trás de um intervalo de confiança de 95% é ilustrada na figura a seguir:

Figura B.1: Estimativas pontuais e intervalos de confiança para uma estatística teórica de interesse.


Materiais e métodos

Identificação de LFY, PHYC, e TOR Seqüências na cana-de-açúcar

Para avaliar se LFY, PHYC, e TOR são genes de cópia única putativos na cana-de-açúcar, usamos Arabidopsis thaliana sequências como consultas em um banco de dados desenvolvido em nosso laboratório contendo vários proteomas preditivos de plantas verdes (Viridiplantae 1.0 Papini-Terzi et al. 2009) e o banco de dados de ESTs de cana-de-açúcar SUCEST. Sequências redundantes, incluindo variantes de splice (sequências diferem pela presença ou ausência de pequenos domínios), foram eliminadas e as sequências restantes alinhadas (MAFFT Katoh et al. 2002) para gerar árvores filogenéticas pelo método de máxima verossimilhança (PhylML 3.0 Guindon e Gascuel 2003) .

Triagem da Biblioteca BAC

Usamos pares específicos de primers (tabela suplementar S1, Material Suplementar online) para rastrear a biblioteca R570 BAC usando reações de PCR e um pool 3D como modelo (Adam-Blondon et al. 2005). BACs positivos para amplificação por PCR foram purificados usando o kit QIAGEN® Large-Construct e sequenciados pela tecnologia de sequenciamento 454 (Roche). A montagem do BAC foi conduzida conforme descrito em de Setta et al. (2014).

Determinação de haplótipo

Comparamos a sequência de todos os BACs homo / homeólogos selecionados para identificar possíveis sequências redundantes derivadas do mesmo haplótipo de cana-de-açúcar. Ferramenta de alinhamento online MAFFT (http://mafft.cbrc.jp/alignment/software/ acessado pela última vez em 28 de dezembro de 2016) e GEvo (Análise da evolução do genoma — https: //genomevolution.org/CoGe/GEvo.pl. Acessado pela última vez em dezembro 28, 2016), da plataforma CoGe online (Comparative Genomics Platform), foram usados ​​para o alinhamento.

Quando as sequências inteiras de dois BACs tiveram sobreposição total com identidade de nucleotídeos acima de 99,8%, eles foram considerados o mesmo haplótipo e apenas um BAC foi considerado nas análises subsequentes. Quando os BACs não se sobrepuseram completamente, mas tinham mais de 99,8% de identidade em uma janela de sobreposição mínima de 20 kb em suas fronteiras, eles foram considerados como partes do mesmo haplótipo. Neste caso, as sequências não alinhadas foram incorporadas a um dos BACs dando origem a um novo haplótipo de sequência única maior denominado "BAC 1 + 2" (por exemplo, BAC 202G24 + 013O24). Em ambos os casos, os SNPs (polimorfismos de nucleotídeo único) potenciais (& lt0,2%) foram preservados e podem representar alelos ou artefatos técnicos recentes.

Anotação e comparações da sequência BAC

A anotação automática do BAC foi realizada usando o GNPAnnot Community Annotation System (Guignon et al. 2012) disponível na plataforma South Green Bioinformatics (http://www.southgreen.fr último acesso em 28 de dezembro de 2016). Artemis: Genome Browser and Annotation Tool (Rutherford et al. 2000 Berriman e Rutherford 2003) e ACT: Artemis Comparison Tool (Carver et al. 2005) foram usados ​​para corrigir manualmente a anotação de genes e elementos transponíveis (TEs), conforme descrito por Garsmeur et al. (2011). Anotações de genoma de sorgo, arroz e milho (Phytozome v5.0 Goodstein et al. 2012), bem como a ferramenta de software online CENSOR (Kohany et al. 2006) e bancos de dados NCBI (National Center for Biotechnology Information) foram usados ​​para anotar manualmente genes e TEs, respectivamente. As sequências e anotações de BACs foram depositadas no NCBI sob os números de acesso do GenBank KF184957, KF184754, KF184931 e KX608891 – KX608914 (tabela suplementar S2, Material suplementar online). As representações gráficas de BACs foram feitas usando GENOGRAPH (não publicado) desenvolvido por Olivier Garsmeur (CIRAD, Structure et Evolution des Génomes, Montpellier, França).

Origem do haplótipo

Para identificar a origem dos haplótipos, com base em SNPs, cerca de 25 milhões de leituras de fim pareado de 100 bp de S. officinarum e 23 milhões de leituras em pares de 100 bp de S. spontaneum (Grativol et al. 2014) foram mapeados contra LFY, PHYC, e TOR sequências de codificação usando o software Bowtie 2 com parâmetros padrão no modo sensível (Langmead e Salzberg 2012). O resultado ∼8200 e ∼7000 leituras mapeadas de S. officinarum e S. spontaneum, respectivamente, foram analisados ​​por QualitySNPng (Nijveen et al. 2013) com o objetivo de identificar SNPs específicos de S. officinarum e S. spontaneum que estão presentes em haplótipos R570 de LFY, PHYC, e TOR genes, incluindo exões e intrões.

Indels (inserções / deleções) e polimorfismos de aminoácidos compartilhados por 043C15 e 156D23 TOR haplótipos foram identificados por alinhamentos usando a ferramenta online MAFFT e o software MEGA 5.05. Nós sequenciamos TOR 27º e 43º exons, que abrigam esses polimorfismos, de um acesso de S. officinarum e um de S. spontaneum. Os exons foram amplificados por primers específicos, clonados no vetor pGEM®-T Easy (Promega) e sequenciados pela metodologia de Sanger. Seis clones de cada acesso foram sequenciados, obtendo-se pelo menos quatro sequências de boa qualidade de cada exon para ambas as espécies.

Análise Evolutiva de Genes

As árvores filogenéticas foram construídas pelo método de união de vizinhos (Saitou e Nei 1987) com distâncias de nucleotídeos calculadas com o modelo Jukes-Cantor (Jukes e Cantor 1969), no software MEGA 5.05 (Tamura et al. 2011). Diferentes modelos de estimativa de distância, como p-distance, Kimura 2-parameter (Kimura 1980) e Tajima-Nei distance (Tajima e Nei 1984), foram testados para construir as árvores e as topologias resultantes foram altamente consistentes.

O número de substituições não sinônimas por site não sinônimo (dN) e o número de substituições sinônimas por site sinônimo (dS) foram calculados para LFY, PHYC, e TOR genes usando o método Nei – Gojobori com correção Jukes – Cantor, implementado no software MEGA 5.05. Os tempos de divergência foram estimados por T = d/2r, estavam "T”Corresponde ao tempo de divergência,“d"Corresponde ao número de substituições entre duas sequências e"r”É a taxa de substituição. Ao estimar tempos de divergência de alelos (haplótipos de genes), “d”Foi substituído por dS e“r”Pela taxa de substituição de monocotiledônea amplamente usada 6,5 ​​× 10 - 9 (Gaut et al. 1996) substituições por local por ano ou a taxa de substituição sinônima específica de cada gene.

Taxas de substituição de sinônimos específicas para LFY, PHYC, e TOR genes foram estimados usando o tempo médio de divergência entre sorgo e cana-de-açúcar (7 Ma) (Al-Janabi et al. 1994 Jannoo et al. 2007 Kim et al. 2014) para calibrar o relógio molecular.

Expressão específica de haplótipo

O alinhamento de múltiplas sequências foi realizado usando LFY, PHYC, e TOR haplótipos para estimar a dosagem de alelos para loci SNP usando CLUSTALW versão 2.0 (Larkin et al. 2007). Para estimar a expressão relativa dos alelos, cerca de 52 milhões de leituras curtas de RNA-Seq (leituras de extremidade emparelhadas de 72 bp) da cultivar de cana-de-açúcar R570 foram mapeadas contra LFY (011C13), PHYC (038J02), e TOR (007C22) haplótipos usando o software Bowtie2 (Langmead e Salzberg 2012). A detecção de SNP foi realizada usando o software Freebayes 0.9.5 (Garrison e Marth 2012), considerando 10 leituras por posição SNP, mínimo de duas leituras que suportam o SNP variante, frequência mínima do haplótipo variante de 0,02 e qualidade 30 na base central. A dosagem genômica e o nível de expressão relativa de cada SNP foram comparados pelo teste binomial exato, enquanto o teste de correlação de Pearson foi realizado para avaliar o nível de expressão global dos SNPs e as dosagens dos haplótipos, estimando R e P-valor. Os dados de RNA-Seq deste estudo foram depositados no NCBI Sequence Read Archive (SRA) sob o número de acesso SRX1822635.

Análise Evolutiva de TEs

Tempos de divergência de inserções (TEs ou outras inserções indefinidas) compartilhados por diferentes BACs foram estimados por T = d/2r. Todas as sequências de inserções foram usadas para calcular as distâncias aos pares (d) e "r”Foi substituída pela taxa de mutação de 1,3 × 10 - 8 mutações por local por ano, conforme proposto por Ma e Bennetzen (2004). A distancia "d”Foi determinado usando o modelo de dois parâmetros Kimura, disponível no software MEGA 5.05 (Tamura et al. 2011). A estimativa das idades de inserção de retrotransposons LTR foi baseada no número acumulado de substituições entre os dois LTRs (d) (SanMiguel et al. 1998), usando a taxa de mutação de 1,3 × 10 - 8 mutações por local por ano.


Conclusões

Nos últimos anos, extensos estudos sobre processos epigenéticos revelaram como genomas complexos geram diferentes tipos de células de uma forma altamente dinâmica. Uma vez estabelecidos, os fatores epigenéticos, como metilação do DNA e modificação de histonas, precisam ser transmitidos fielmente nas células durante a divisão celular ou reparo de danos no DNA para manter a identidade celular. O grande volume de transações epigenômicas e sua necessidade contínua de manutenção sugerem uma grande chance de erros. No entanto, praticamente nada se sabe sobre o epimosaicismo em populações de células aparentemente idênticas. Aqui, ao empregar um protocolo para WGBS de células individuais, mostramos que a frequência de epivariação nos padrões de metilação do DNA é pelo menos duas ordens de magnitude maior do que as frequências de mutação somática [11, 14]. Embora, ao nosso conhecimento, isso nunca tenha sido analisado diretamente em mamíferos, está de acordo com relatórios que sugerem que mudanças epigenéticas transgeracionais espontâneas no Arabidopsis thaliana metiloma são três ordens de magnitude mais freqüentes do que mutações de DNA [15, 16]. A alta freqüência de epivariação observada no fígado de camundongo também está de acordo com os níveis relativamente altos de infidelidade de transmissão de metilação do DNA previamente observados [1].

Nossos dados atuais também indicam que o nível de heterogeneidade de 5mC é dependente de características genômicas, com sítios não funcionais, como elementos repetidos e íntrons, principalmente sítios instáveis ​​e potencialmente funcionais, como promotores de genes, principalmente estáveis. Uma exceção interessante parece ser a assinatura epigenética H3K4me1 de potenciadores ativos, que foi previamente encontrada associada à perda de metilação do DNA durante o envelhecimento [12]. Esses resultados estão de acordo com os obtidos por Smallwood et al. [5], que também mostrou os níveis mais altos de heterogeneidade em H3K4me1 quando comparado com outras características genômicas em células-tronco embrionárias de camundongo único. Este resultado parece sugestivo de uma assinatura de heterogeneidade comum entre os diferentes tipos de células.Digno de nota, não encontramos nenhum aumento marcante na heterogeneidade de 5mC com o envelhecimento, especulamos que, pelo menos em parte, isso poderia ser devido ao fato de que as epivariações são afetadas por fatores genéticos e ambientais, e estudamos camundongos geneticamente idênticos criados sob condições controladas. Também é possível que o fígado, sendo um órgão pós-mitótico reversível, em condições normais tenha muito pouca atividade proliferativa e, portanto, uma chance limitada de acumular erros de manutenção de 5mC ao longo do tempo [1, 2, 5]. Finalmente, um efeito da idade pode realmente estar presente, como sugerido por uma tendência clara de uma variação mais alta nos animais mais velhos, mas simplesmente obscurecido pela linha de base muito alta da variação célula a célula.

Os possíveis efeitos fisiológicos da alta heterogeneidade do epigenoma no fígado adulto permanecem desconhecidos. É concebível que o epimosaicismo observado reflita uma variação sutil, mas fisiologicamente relevante, dentro da população de hepatócitos, semelhante ao que foi postulado para neurônios no cérebro [17]. O fígado dos mamíferos desempenha uma ampla gama de funções críticas para manter a homeostase metabólica (variando da regulação da glicose e estoques de lipídios até a desintoxicação do sangue). Portanto, uma hipótese direta é que o fígado atinge essa diversidade por meio do comportamento coletivo de hepatócitos heterogêneos operando em microambientes altamente estruturados. Mais especificamente, hepatócitos com epigenomas diferentes terão fenótipos moleculares distintos e essa heterogeneidade, até certo ponto, pode ser benéfica para a manutenção da funcionalidade do órgão. No entanto, como a heterogeneidade epigenômica observada no fígado de camundongo parecia ser bastante aleatória, e embora tenhamos observado enriquecimento em sequências geralmente consideradas não funcionais, pontos de acesso específicos não foram detectados, é provavelmente mais provável que a heterogeneidade epigenômica realmente reflita erros. A esse respeito, o que falta esclarecer é quanto ruído pode ser tolerado dentro de um órgão antes que sua funcionalidade seja prejudicada. Esperamos que o desenvolvimento contínuo de tecnologias de célula única permitirá que os efeitos do ruído sejam testados medindo o status da informação celular em vários níveis, ou seja, genoma, epigenoma e transcriptoma das mesmas células individuais [18-21]. A redução contínua nos custos de sequenciamento provavelmente facilitará a análise do grande número de células necessárias para esse propósito.


Auge-Gouillou C, Hamelin MH, Demattei MV et al (2001) A conformação de tipo selvagem das repetições terminais invertidas de Mos-1 é subótima para transposição em bactérias. Mol Genet Genomics 265 (1): 51-57

Auge-Gouillou C, Brillet B, Germon S et al (2005a) Mariner Mos1 transposase dimeriza antes da ligação ITR. J Mol Biol 351 (1): 117-130

Auge-Gouillou C, Brillet B, Hamelin MH et al (2005b) Assembly of the mariner Mos1 synaptic complex. Mol Cell Biol 25 (7): 2861-2870

Bae T, Banger AK, Wallace A et al (2004) Staphylococcus aureus virulence genes identificados por bursa aurealis mutagenesis and nematode kill. Proc Natl Acad Sci USA 101 (33): 12312–12317

Barry EG, Witherspoon DJ, Lampe DJ (2004) Uma tela genética bacteriana identifica sequências codificadoras funcionais do elemento transponível Famar1 do inseto marinheiro amplificado a partir do genoma da tesourinha, Forficula auricularia. Genética 166 (2): 823-833

Beare PA, Howe D, Cockrell DC et al (2008) Characterization of a Coxiella burnetii Mutante ftsZ gerado por mutagênese do transposon Himar1. J Bacteriol 191 (5): 1369–1381

Bessereau JL (2006) Mutagênese por inserção em C. elegans usando o transposon Mos1 de Drosophila: um método para a identificação rápida de genes mutantes. Métodos Mol Biol 351: 59-73

Bextine B, Lampe D, Lauzon C et al (2005) Estabelecimento de um simbionte derivado de inseto geneticamente marcado em várias plantas hospedeiras. Curr Microbiol 50 (1): 1–7

Boulin T, Bessereau JL (2007) Mos1-mediated insertional mutagenesis in Caenorhabditis elegans. Nat Protoc 2 (5): 1276–1287

Bryan GJ, Jacobson JW, Hartl DL (1987) Heritable somatic excision of a Drosophila transposon. Science 235 (4796): 1636-1638

Butler MG, Chakraborty SA, Lampe DJ (2006) O terminal N da transposase Himar1 mariner medeia atividades múltiplas durante a transposição. Genetica 127 (1-3): 351-366

Coates CJ, Jasinskiene N, Morgan D et al (2000) A transposase do marinheiro purificado (Mos1) catalisa a integração de elementos marcados na linha germinativa do mosquito da febre amarela, Aedes aegypti. Insect Biochem Mol Biol 30 (11): 1003–1008

Cowan RK, Hoen DR, Schoen DJ et al (2005) MUSTANG é uma nova família de genes de transposase domesticados encontrados em diversas angiospermas. Mol Biol Evol 22 (10): 2084–2089

Crisostomo MI, Vollmer W, Kharat AS et al (2006) Atenuação da resistência à penicilina em um mutante de peptidoglicano O-acetil transferase de Streptococcus pneumoniae. Mol Microbiol 61 (6): 1497-1509

De Aguiar D, Hartl DL (1999) Regulatory potenciais of nonautonomous mariner elements and subfamily crosstalk. Genetica 107 (1-3): 79-85

Fedoroff N (2002) Controle de DNA móvel. Em: Craig NL, Craigie R, Gellert M, Lambowitz AM (eds) Mobile DNA II. ASM Press, Washington, DC, pp 997-1007

Felek S, Krukonis ES (2009) A proteína Yersinia pestis Ail medeia a ligação e entrega de Yop às células hospedeiras necessárias para a virulência da peste. Infect Immun 77 (2): 825-836

Garza D, Medhora M, Koga A et al (1991) Introdução do elemento transponível mariner na linha germinativa de Drosophila melanogaster. Genética 128 (2): 303–310

Guo BP, Mekalanos JJ (2001) Helicobacter pylori mutagênese por transposição mariner in vitro. FEMS Immunol Med Microbiol 30 (2): 87-93

Guzman LM, Belin D, Carson MJ et al (1995) Tight regulação, modulação e expressão de alto nível por vetores contendo o promotor de arabinose PBAD. J Bacteriol 177 (14): 4121–4130

Hammer SE, Strehl S, Hagemann S (2005) Homologs of Drosophila P transposons eram móveis no peixe-zebra, mas foram domesticados em um ancestral comum de frango e humano. Mol Biol Evol 22 (4): 833-844

Hartl D (2001) Discovery of the transposable element mariner. Genética 157 (2): 471-476

Hartl DL, Lohe AR, Lozovskaya ER (1997a) Pensamentos modernos sobre um ancyent marinere: função, evolução, regulação. Annu Rev Genet 31: 337-358

Hartl DL, Lohe AR, Lozovskaya ER (1997b) Regulation of the transposable element mariner. Genetica 100 (1-3): 177-184

Hartl DL, Lozovskaya ER, Nurminsky DI et al (1997c) O que restringe a atividade de elementos transponíveis do tipo marinheiro. Trends Genet 13 (5): 197–201

Huisman O, Kleckner N (1987) Um novo teste generalizável para a detecção de mutações que afetam a transposição de Tn10. Genética 116 (2): 185-189

Ivics Z, Hackett PB, Plasterk RH et al (1997) Reconstrução molecular da bela adormecida, um transposon semelhante a Tc1 de peixe e sua transposição em células humanas. Cell 91 (4): 501-510

Jacobson JW, Medhora MM, Hartl DL (1986) Molecular structure of a somaticamente instável transposable element in Drosophila. Proc Natl Acad Sci USA 83 (22): 8684-8688

Krebs MP, Reznikoff WS (1988) Uso de um derivado Tn5 que cria fusões translacionais lacZ para obter um mutante de transposição. Gene 63 (2): 277-285

Kunze R, Behrens U, Courage-Franzkowiak U et al (1993) Dominante transposition-deficient mutants of maize Activator (Ac) transposase. Proc Natl Acad Sci USA 90 (15): 7094–7098

Lampe DJ, Churchill ME, Robertson HM (1996) Uma transposase mariner purificada é suficiente para mediar a transposição in vitro. EMBO J 15 (19): 5470–5479 publicada errata aparece em EMBO J 1997 Jul 116 (13): 4153

Lampe DJ, Grant TE, Robertson HM (1998) Fatores que afetam a transposição do transposon mariner Himar1 in vitro. Genética 149 (1): 179-187

Lampe DJ, Akerley BJ, Rubin EJ et al (1999) Hyperactive transposase mutants of the Himar1 mariner transposon. Proc Natl Acad Sci USA 96 (20): 11428–11433

Lampe DJ, Witherspoon DJ, Soto-Adames FN et al (2003) Transferência horizontal recente da subfamília mellifera marinheiro transposons em linhagens de insetos que representam quatro ordens diferentes mostram que a seleção atua apenas durante a transferência horizontal. Mol Biol Evol 20 (4): 554–562

Le Breton Y, Mohapatra NP, Haldenwang WG (2006) Mutagênese aleatória in vivo de Bacillus subtilis pelo uso de TnYLB-1, um transposon baseado em mariner. Appl Environ Microbiol 72 (1): 327–333

Lipkow K, Buisine N, Lampe DJ et al (2004) Primeiros intermediários da transposição mariner: catálise sem sinapsis das extremidades do transposon sugere uma nova arquitetura do complexo sináptico. Mol Cell Biol 24 (18): 8301-8311

Lohe AR, Hartl DL (1996) Autoregulation of mariner transposase activity by overproduction and dominante-negativo complementation. Mol Biol Evol 13 (4): 549–555

Lohe AR, Hartl DL (2002) A mobilização eficiente do mariner in vivo requer múltiplas sequências internas. Genética 160 (2): 519-526

Lohe AR, Sullivan DT, Hartl DL (1996) Subunit interações na transposase mariner. Genética 144 (3): 1087–1095

Lohe AR, De Aguiar D, Hartl DL (1997) Mutations in the mariner transposase: the D, D (35) E consensus sequence is nonfunctional. Proc Natl Acad Sci USA 94 (4): 1293–1297

Louvel H, Saint Girons I, Picardeau M (2005) Isolamento e caracterização de sistemas de aquisição de ferro mediados por FecA e FeoB da espiroqueta Leptospira biflexa por mutagênese de inserção aleatória. J Bacteriol 187 (9): 3249–3254

Maruyama K, Schoor KD, Hartl DL (1991) Identificação de substituições de nucleotídeos necessárias para a transativação de elementos transponíveis mariner em Drosophila: análise de elementos de ocorrência natural. Genetics 128 (4): 777-784

McClintock B (1984) A importância das respostas do genoma ao desafio. Science 226 (4676): 792–801

Medhora MM, MacPeek AH, Hartl DL (1988) Excision of the Drosophila transposable element mariner: identificação e caracterização do fator Mos. EMBO J 7 (7): 2185-2189

Medhora M, Maruyama K, Hartl DL (1991) Análise molecular e funcional do elemento mariner mutator Mos1 em Drosophila. Genética 128 (2): 311-318

Medina AA, Shanks RM, Kadouri DE (2008) Desenvolvimento de um novo sistema para isolar genes envolvidos em interações predador-presa usando derivados independentes de hospedeiro de Bdellovibrio bacteriovorus 109 J. BMC Microbiol 8:33

Munoz-Elias EJ, Marcano J, Camilli A (2008) Isolation of Streptococcus pneumoniae mutantes de biofilme e sua caracterização durante a colonização nasofaríngea. Infect Immun 76 (11): 5049–5061

Pledger DW, Coates CJ (2005) Mutant Mos1 mariner transposons are hyperactive in Aedes aegypti. Insect Biochem Mol Biol 35 (10): 1199-1207

Pledger DW, Fu YQ, Coates CJ (2004) Análises de elementos cis-atuantes que afetam a transposição de transposons do Mariner Mos1 in vivo. Mol Genet Genomics 272 (1): 67-75

Richardson JM, Dawson A, O’Hagan N et al (2006) Mecanismo de transposição de Mos1: insights da análise estrutural. EMBO J 25 (6): 1324–1334

Robert V, Bessereau JL (2007) Engenharia direcionada do Caenorhabditis elegans genoma após quebras cromossômicas desencadeadas por Mos1. EMBO J 26 (1): 170-183

Robertson HM (2002) Evolution of DNA transposons in ekaryotes. Em: Craig NL, Craigie R, Gellert M, Lambowitz AM (eds) Mobile DNA II. ASM Press, Washington, D.C, pp 1093-1110

Robertson HM, Lampe DJ (1995) Transferência horizontal recente de um elemento transponível mariner entre e entre Diptera e Neuroptera. Mol Biol Evol 12 (5): 850-862

Robertson HM, Martos R (1997) A evolução molecular do segundo transposon de marinheiro humano antigo, Hsmar2, ilustra os padrões de evolução neutra na linhagem do genoma humano. Gene 205 (1-2): 219-228

Robertson HM, Zumpano KL (1997) Evolução molecular de um antigo transposon mariner, Hsmar1, no genoma humano. Gene 205 (1–2): 203–217

Rubin EJ, Akerley BJ, Novik VN et al (1999) Transposição in vivo de elementos baseados em mariner em bactérias entéricas e micobactérias. Proc Natl Acad Sci USA 96 (4): 1645–1650

Schweizer H (2008) Genética bacteriana: realizações passadas, estado atual do campo e desafios futuros. Biotechniques 44 (5): 633-634 636-41

Shanks RM, Caiazza NC, Hinsa SM et al (2006) Kit de ferramentas moleculares com base em Saccharomyces cerevisiae para manipulação de genes de bactérias gram-negativas. Appl Environ Microbiol 72 (7): 5027–5036

Stewart PE, Rosa PA (2008) Transposon mutagenesis of the lyme disease agent Borrelia burgdorferi. Métodos Mol Biol 431: 85-95

Tosi LR, Beverley SM (2000) fatores cis e trans que afetam a evolução e transposição do mariner Mos1 in vitro, e seu potencial para genômica funcional. Nucleic Acids Res 28 (3): 784-790

Wang W, Swevers L, Iatrou K (2000) Mariner (Mos1) transposase e integração genômica de sequências de genes estranhos em Bombyx mori células. Insect Mol Biol 9 (2): 145-155

Williams DC, Boulin T, Ruaud AF et al (2005) Characterization of Mos1-mediated mutagenesis in Caenorhabditis elegans: um método para a identificação rápida de genes mutantes. Genetics 169 (3): 1779-1785

Witherspoon DJ, Robertson HM (2003) Evolução neutra de dez tipos de transposons mariner nos genomas de Caenorhabditis elegans e C. briggsae. J Mol Evol 56 (6): 751-769

Wong SM, Akerley BJ (2008) Identificação e análise de genes essenciais em Haemophilus influenzae. Métodos Mol Biol 416: 27-44

Wu SC, Meir YJ, Coates CJ et al (2006) piggyBac é um transposon flexível e altamente ativo em comparação com a bela adormecida, Tol2 e Mos1 em células de mamíferos. Proc Natl Acad Sci USA 103 (41): 15008-15013

Yook K, Hodgkin J (2007) Mutagênese de Mos1 revela uma diversidade de mecanismos que afetam a resposta de Caenorhabditis elegans para o patógeno bacteriano Microbacterium nematophilum. Genética 175 (2): 681-697

Zhang JK, Pritchett MA, Lampe DJ et al (2000) In vivo transposon mutagenesis of the methanogenic archaeon Methanosarcina acetivorans C2A usando uma versão modificada do elemento transponível da família de marinheiros de insetos Himar1. Proc Natl Acad Sci USA 97 (17): 9665–9670

Zhang L, Dawson A, Finnegan DJ (2001) DNA-binding activity and subunit interact of the mariner transposase. Nucleic Acids Res 29 (17): 3566-3575


Tecnologias de avaliação para perigos / riscos de águas residuais

Xiwei He PhD, Kailong Huang PhD, em Poluentes de Alto Risco em Águas Residuais, 2020

7.2.1 Avaliação de risco ecológico

A avaliação de risco ecológico (ERA) visa avaliar os efeitos de estressores, geralmente HRPs químicos, no meio ambiente local. Na ERA, o evento indesejado geralmente depende dos HRPs químicos de interesse e do cenário de avaliação de risco. Esse evento indesejado geralmente é um efeito prejudicial aos organismos, populações ou ecossistemas, especialmente para o ambiente aquático. Os métodos ERA incluem principalmente o método do quociente e o método probabilístico (por exemplo, curvas de distribuição de probabilidade de risco conjunto) (Chen, 2005 Wang et al., 2002), entre os quais o método do quociente é o método mais comum e amplamente utilizado.

O risco ecológico na área investigada que pode representar para o ambiente aquático foi estimado por meio de seus quocientes de perigo (HQs) em três níveis tróficos, representativos do ecossistema aquático (algas, dáfnias e peixes). De acordo com as diretrizes da UE (EMEA, 2006), a abordagem combina as concentrações ambientais previstas ou medidas (PECs ou MECs) dos poluentes com dados de toxicidade (concentração previsível sem efeito (PNEC)) para avaliar se um poluente pode representar um risco para organismos aquáticos ou não (Guillén et al., 2012).

Os HQs foram determinados como a razão entre o MEC e seu PNEC, onde o MEC representa a maior concentração do poluente detectado nas amostras, enquanto o PNEC é calculado dividindo o valor de toxicidade aguda mais baixo (CE mediano50 ou LC50) para os três níveis tróficos selecionados pelo fator de avaliação pertinente (FA) (Papageorgiou et al., 2016). Quando nenhum valor de toxicidade experimental está disponível na literatura publicada, EC50 ou LC50 os valores podem ser estimados com o modelo preditivo ECOSAR (USEPA, 2012). Devido à incerteza do processo de extrapolação, um AF apropriado precisa ser selecionado ao extrapolar PNEC por meio da CE50 ou LC50 dos três níveis tróficos. O AF é derivado da experiência e os detalhes do AF recomendado são mostrados na Tabela 7.4.

Tabela 7.4. Os fatores de avaliação recomendados.

Valores de toxicidade experimentais disponíveisFator de avaliação
Pelo menos um LC50 ou EC50 de curto prazo de cada um dos três níveis tróficos1000
Um experimento de longo prazo da concentração de efeito não observado (NOEC)100
Um experimento de longo prazo de NOEC com dois níveis tróficos50
Um experimento de longo prazo de NOEC com três níveis tróficos10

O potencial risco ecológico foi avaliado de acordo com um critério de classificação de risco comumente usado. Um risco baixo ou desprezível pode ser esperado se os valores de HQ estiverem entre 0,1 e 1. Para valores de HQ entre 1 e 10, um risco médio pode ser esperado, enquanto valores de HQ maiores que 10 indicam um alto risco ecológico (Mendoza et al., 2015). Deve-se notar que o método ERA mencionado anteriormente se concentra principalmente na avaliação da toxicidade de produtos químicos individuais, no entanto, a mistura ou exposição combinada de águas residuais (as misturas químicas) pode representar riscos potenciais, embora cada um dos poluentes esteja abaixo de sua concentração segura. Portanto, novas abordagens devem ser desenvolvidas para avaliar os efeitos combinados em ecotoxicologia aquática no futuro (Beyer et al., 2014 Diamond et al., 2018).

Finalmente, a ERA foi amplamente aplicada para avaliar os efeitos ecológicos adversos de poluentes (produtos farmacêuticos e de cuidados pessoais (Ashfaq et al., 2017 Mater et al., 2014 Molins-Delgado et al., 2016 Rivera-Jaimes et al., 2018 ), nutrientes (Efroymson et al., 2007), parabenos de desregulação endócrina (Molins-Delgado et al., 2016), subprodutos de desinfecção (Li et al., 2019), andrógenos (Zhang et al., 2018), butilparabeno e benzilparabeno (Yamamoto et al., 2007), bem como misturas químicas (Beyer et al., 2014 Coors et al., 2018 Diamond et al., 2018) em efluentes de estação de tratamento de águas residuais (Coors et al., 2018 Diamond et al. ., 2018 Efroymson et al., 2007 Molins-Delgado et al., 2016 Rivera-Jaimes et al., 2018 Yamamoto et al., 2007 Zhang et al., 2018), águas residuais farmacêuticas (Ashfaq et al., 2017), águas residuais hospitalares (Mater et al., 2014), efluentes clorados (Li et al., 2019) e águas residuais recuperadas (Zeng et al., 2016)).


Resultados

Seleção e anotação de clones BAC

Regiões genômicas de Frondoso (LFY), Fitocromo C (PHYC), e Alvo de rapamicina quinase (TOR) genes foram escolhidos para análise porque desempenham um papel importante no desenvolvimento das plantas e, portanto, sua expressão deve ser bem regulada para manter a estequiometria dos complexos reguladores de proteínas em que estão envolvidos. Mais importante, LFY, PHYC, e TOR são genes de cópia única em várias gramíneas e dicotiledôneas (Mathews et al. 1995 Mathews e Sharrock 1996 Howe et al. 1998 Chujo et al. 2003 Wullschleger et al. 2006 Hamès et al. 2008 Moyroud et al. 2009 Agredano-Moreno et al. . 2007 Robaglia et al. 2012). Isso é especialmente verdadeiro na linhagem do sorgo, que não experimentou nenhum WGD devido à paleoduplicação comum a todas as gramíneas em torno de 70 Ma (Paterson et al. 2009). Pesquisas blast no banco de dados de ESTs de cana-de-açúcar (SUCEST) não detectaram redundância, indicando que esses genes também podem ser de cópia única na cana-de-açúcar.Essa precaução garante que os BACs que abrigam esses genes representem de fato regiões homo / homeólogas e não regiões duplicadas contendo genes parálogos no genoma da cana-de-açúcar.

A estratégia de triagem por 3D pool PCR da biblioteca R570 BAC, utilizando pares de primers específicos para cada gene, levou ao isolamento de 10 BACs positivos para LFY, sete para PHYC, e 10 para TOR. Todos eles foram sequenciados e montados. Até 12 BACs homo / homeólogos diferentes seriam esperados para os três genes com base na estrutura do genoma R570 descrita (D’Hont et al. 1998 Ha et al. 1999).

A redundância foi encontrada entre os 27 BACs sequenciados e aqueles com mais de 99,8% de identidade de nucleotídeos sobre seu alinhamento foram considerados como representando o mesmo (se totalmente sobrepostos) ou partes do mesmo haplótipo (se parcialmente sobrepostos) (detalhes consulte Materiais e Métodos) . Depois de fundir os BACs parcialmente sobrepostos, obtivemos sete haplótipos diferentes, ou seja, BACs homo / homeólogos, para LFY região genômica, quatro para PHYC e sete para TOR. Considerando que as variedades de cana-de-açúcar (incluindo R570) são susceptíveis de transportar entre seis a 14 loci homo / homeólogos com oito a dez sendo os mais esperados (D’Hont et al. 1996 Garcia et al. 2013), os sete haplótipos descobertos para TOR e LFY os loci estão, portanto, dentro da faixa do número esperado de loci homo / homeólogos. Além disso, com base em SNPs chamando de dados R570 RNAseq, para a sequência de 2 kb comum aos sete TOR haplótipos (ver a seguir), 26 SNPs (∼90%) corresponderam a um dos sete haplótipos e apenas três (∼10%) não (dados não mostrados). Assim, com base na proporção de SNPs correspondentes aos haplótipos BACs (∼3.7 SNPs por BAC), pode-se concluir que provavelmente perdemos um TOR haplótipo.

Análise filogenética e sintaxe esquemática de TOR (UMA), PHYC (B), e LFY (C) regiões genômicas para haplótipos de cana-de-açúcar (homo / homeólogos), sorgo e arroz. TOR BACs têm apenas um gene e um pseudogene não colinear. Filogenias foram geradas por análise de união de vizinhos de LFY, PHYC, e TOR alinhamentos de sequências de codificação de nucleotídeos (cds). A barra de escala representa a distância genética relativa (número de substituições por site). Os números próximos às ramificações são valores de bootstrap. Os genes são representados por setas pretas e os pseudogenes por setas texturizadas. Os genes colineares são ligados por faixas cinza. Elementos transponíveis (TEs) são representados por setas coloridas: setas azuis são semelhantes a ciganos TEs setas verdes são semelhantes a copia TEs vermelhas e setas laranja são não LTR TEs setas rosa são transposons de DNA cinza e setas brancas são inserções indefinidas. Tons da mesma cor representam semelhança entre TEs ou inserções indefinidas. Setas texturizadas e coloridas são TEs e inserções indefinidas que não têm semelhança com nenhuma outra na região genômica. TEs compartilhados são ligados por faixas da cor TE e identificados de “a” a “l” de acordo com a tabela suplementar S4, Material suplementar online. Os tempos de inserção previstos de retrotransposons LTR compartilhados são indicados abaixo das respectivas setas. Os eventos de inserção previstos da maioria dos TEs compartilhados são relatados na árvore filogenética usando símbolos (círculos pretos, estrelas, quadrados, losangos e triângulos). Os números 1–12 indicam genes anotados da cana-de-açúcar (tabela 1) I e II indicam genes não colineares do sorgo i – vi indicam genes não colineares do arroz. LFY é o gene número 9, PHYC é o número 4 e TOR é o número 1. Setas curvas tracejadas conectam genes duplicados. Linhas vermelhas delineiam genes de sorgo editados em um gene, com base na estrutura de suas contrapartes ortólogas em outras gramíneas.

Análise filogenética e sintaxe esquemática de TOR (UMA), PHYC (B), e LFY (C) regiões genômicas para haplótipos de cana-de-açúcar (homo / homeólogos), sorgo e arroz. TOR BACs têm apenas um gene e um pseudogene não colinear. As filogenias foram geradas por análise de vizinhança de LFY, PHYC, e TOR alinhamentos de sequências de codificação de nucleotídeos (cds). A barra de escala representa a distância genética relativa (número de substituições por site). Os números próximos às ramificações são valores de bootstrap. Os genes são representados por setas pretas e os pseudogenes por setas texturizadas. Genes colineares são ligados por faixas cinza. Elementos transponíveis (TEs) são representados por setas coloridas: setas azuis são semelhantes a ciganos TEs setas verdes são semelhantes a copia TEs vermelhas e setas laranja são não LTR TEs setas rosa são transposons de DNA cinza e setas brancas são inserções indefinidas. Tons da mesma cor representam semelhança entre TEs ou inserções indefinidas. Setas texturizadas e coloridas são TEs e inserções indefinidas que não têm semelhança com nenhuma outra na região genômica. TEs compartilhados são ligados por faixas da cor TE e identificados de “a” a “l” de acordo com a tabela suplementar S4, Material suplementar online. Os tempos de inserção previstos de retrotransposons LTR compartilhados são indicados abaixo das respectivas setas. Os eventos de inserção previstos da maioria dos TEs compartilhados são relatados na árvore filogenética usando símbolos (círculos pretos, estrelas, quadrados, losangos e triângulos). Os números 1–12 indicam genes anotados da cana-de-açúcar (tabela 1) I e II indicam genes não colineares do sorgo i – vi indicam genes não colineares do arroz. LFY é o gene número 9, PHYC é o número 4 e TOR é o número 1. Setas curvas tracejadas conectam genes duplicados. Linhas vermelhas delineiam genes de sorgo editados em um gene, com base na estrutura de suas contrapartes ortólogas em outras gramíneas.

Anotação de LFY, PHYC, e TOR Os BACs consistiram em identificar e anotar os genes por comparação com proteomas preditos de outras gramíneas e caracterizar os TEs com base em padrões de estrutura (presença de LTRs e IRs) e semelhança com bancos de dados de elementos repetitivos (CENSOR e NCBI) (fig. 1).

PHYC e TOR os genes não mostraram diferenças no número de exões e no comprimento entre as gramíneas. Contudo, TOR haplótipo de BAC 043C15 tem uma mutação de frameshift no exon 35, provavelmente uma mutação recente ou um artefato gerado durante as replicações de BAC em Escherichia coli, porque a mutação foi confirmada para estar presente no clone BAC por ressequenciamento usando o método de Sanger. LFY a partir de S. bicolor tem um exon adicional em comparação com outras gramíneas (fig. S1 suplementar, Material Suplementar online) e Arabidopsis thaliana. LFY é o único desses genes que mostra variação de comprimento de exon entre haplótipos (versões de genes) causada por indels de 6–18 nt (fig. S2 suplementar, Material Suplementar online).

No geral, os BACs homo / homeólogos mostraram grande heterogeneidade em relação ao número de TEs e, em menor grau, ao número de genes codificadores de proteínas (fig. 1 e tabela suplementar S3, Material Suplementar online). Retroelementos LTR (RTEs) da família cigana foram os TE mais abundantes observados em PHYC e TOR regiões circunvizinhas (tabela suplementar S3, Material suplementar online), compreendendo cerca de 21% e 30%, respectivamente, do comprimento BAC combinado. LTR RTEs semelhantes a Copia, que compreendem 10% e 14% de PHYC e TOR comprimento total de BAC, foi o mais abundante em LFY região (21%).

Genômica Comparativa entre Cana-de-Açúcar, Sorgo e Arroz

O arranjo dos genes nos BACs da cana-de-açúcar e suas regiões ortólogas correspondentes no sorgo e arroz foram encontrados, como esperado (Jannoo et al. 2007 Wang et al. 2010 Garsmeur et al. 2011), como sendo altamente colinear (tabela 1). TOR foi o único gene em seus BACs junto com um pseudogene não colinear, portanto, a análise de sintenia com sorgo (Chr9: 44029597.44061461) e arroz (Chr5: 8264831.8290232) foi impossível.

Genes anotados em BACs de cana-de-açúcar e suas relações ortólogas com os genes do sorgo e do arroz

Região genômica. Gene No.. Anotação funcional. Valor eletrônico BLASTX. Locus ortólogo em sorgo. Locus ortólogo em arroz.
LFY1 Brachypodium distachyon COBW contendo domínio contendo proteína 1 0,0E + 00 Sb06g027386 Os04g51100
2 Oryza sativa Proteína hipotética do Grupo Indica OsI_17248 0,0E + 00 Sb06g027382 + Sb06g027384 c Os04g51090
3 Zea mays proteína da família scramblase 0,0E + 00 Sb06g027380 Os04g51080
4 Zea mays WAK53a – precursor da proteína quinase semelhante ao receptor OsWAK – Pseudogene 0,0E + 00 Sb01g013060 Os04g51040 e Os04g51050 d
5 a Zea mays isoforma X2-Pseudogene do receptor da cinase 1 associada à parede
6 Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase 0,0E + 00 Sb06g027350 + Sb06g027360 c Os04g51030
7 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase
8 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante à quinase - Pseudogene
9 Zea mays floricaula / folhosa 2 5.0E-171 Sb06g027340 Os04g51000
10 Zea mays Proteína ribossomal L12 60S 1.0E − 108 Sb06g027330 Os04g50990
11 Zea mays proteína específica de semente Bn15D1B 6.0E54− Sb06g027320 Os04g50970
12 Sorghum bicolor proteína hipotética 0,0E + 00 Sb06g027315 Os04g50960
PHYC1 Hordeum vulgare canal KCO1 / TPK1 da membrana plasmática de retificação externa dependente da voltagem 0,0E + 00 Sb01g007830 Os03g54100
2 Zea mays proteína de recombinação meiótica SPO11 0,0E + 00 Sb01g007840 Os03g54091
3 b Hordeum vulgare canal de K + da membrana plasmática de retificação externa dependente da voltagem KCO1 / TPK1 – Pseudogene
4 Zea mays apoproteína fitocromo C1 0,0E + 00 Sb01g007850 Os03g54084
5 Sorghum bicolor proteína hipotética 3.0E-27 Sb01g007870 Os03g54050
6 Eulaliopsis binata proteína da flor 2 embrionária 0,0E + 00 Sb01g007878 Os09g13630
7 Zea mays transportador de glutationa 0,0E + 00 Sb01g007880 e Sb01g007900 d Os03g54000
8 Oryza sativa Proteína hipotética do Grupo Japonica 0,0E + 00 Sb01g007890 e Sb01g007910 + Sb01g007920 c, d Os03g53990
9 Sorghum bicolor proteína hipotética 8.0E − 69 Sb01g007930 Os03g53980
TOR1 Setaria italica predisse DNA primase pequena subunidade-like-Pseudogene
2 Setaria italica prevista serina / treonina-proteína quinase semelhante a TOR 0,00E + 00 Sb09g017790 Os05g14550
Região genômica. Gene No.. Anotação funcional. Valor eletrônico BLASTX. Locus ortólogo em sorgo. Locus ortólogo em arroz.
LFY1 Brachypodium distachyon COBW contendo domínio contendo proteína 1 0,0E + 00 Sb06g027386 Os04g51100
2 Oryza sativa Proteína hipotética do Grupo Indica OsI_17248 0,0E + 00 Sb06g027382 + Sb06g027384 c Os04g51090
3 Zea mays proteína da família scramblase 0,0E + 00 Sb06g027380 Os04g51080
4 Zea mays WAK53a – precursor da proteína quinase semelhante ao receptor OsWAK – Pseudogene 0,0E + 00 Sb01g013060 Os04g51040 e Os04g51050 d
5 a Zea mays isoforma X2-Pseudogene do receptor da cinase 1 associada à parede
6 Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase 0,0E + 00 Sb06g027350 + Sb06g027360 c Os04g51030
7 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase
8 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante à quinase - Pseudogene
9 Zea mays floricaula / folhosa 2 5.0E-171 Sb06g027340 Os04g51000
10 Zea mays Proteína ribossomal L12 60S 1.0E − 108 Sb06g027330 Os04g50990
11 Zea mays proteína específica de semente Bn15D1B 6.0E54− Sb06g027320 Os04g50970
12 Sorghum bicolor proteína hipotética 0,0E + 00 Sb06g027315 Os04g50960
PHYC1 Hordeum vulgare canal KCO1 / TPK1 da membrana plasmática de retificação externa dependente da voltagem 0,0E + 00 Sb01g007830 Os03g54100
2 Zea mays proteína de recombinação meiótica SPO11 0,0E + 00 Sb01g007840 Os03g54091
3 b Hordeum vulgare canal de K + da membrana plasmática de retificação externa dependente da voltagem KCO1 / TPK1 – Pseudogene
4 Zea mays apoproteína fitocromo C1 0,0E + 00 Sb01g007850 Os03g54084
5 Sorghum bicolor proteína hipotética 3.0E-27 Sb01g007870 Os03g54050
6 Eulaliopsis binata proteína da flor 2 embrionária 0,0E + 00 Sb01g007878 Os09g13630
7 Zea mays transportador de glutationa 0,0E + 00 Sb01g007880 e Sb01g007900 d Os03g54000
8 Oryza sativa Proteína hipotética do Grupo Japonica 0,0E + 00 Sb01g007890 e Sb01g007910 + Sb01g007920 c, d Os03g53990
9 Sorghum bicolor proteína hipotética 8.0E − 69 Sb01g007930 Os03g53980
TOR1 Setaria italica predisse DNA primase pequena subunidade-like-Pseudogene
2 Setaria italica prevista serina / treonina-proteína quinase semelhante a TOR 0,00E + 00 Sb09g017790 Os05g14550

O pseudogene não possui contrapartida ortóloga na região genômica do sorgo e arroz.

Genes do sorgo editados em um gene com base na estrutura de suas contrapartes ortólogas no arroz (Oryza sativa), milho (Zea mays), e braquipódio (Brachypodium distachyon) Esses loci foram denominados Sb06g027350 + Sb06g027360, Sb06g027382 + Sb06g027384 e Sb01g007910 + Sb01g007920.

O gene previsto na cana-de-açúcar possui ortologia com dois genes distintos nas espécies relacionadas (fig. 1).

Genes anotados em BACs de cana-de-açúcar e suas relações ortólogas com os genes do sorgo e do arroz

Região genômica. Gene No.. Anotação funcional. Valor eletrônico BLASTX. Locus ortólogo em sorgo. Locus ortólogo em arroz.
LFY1 Brachypodium distachyon COBW contendo domínio contendo proteína 1 0,0E + 00 Sb06g027386 Os04g51100
2 Oryza sativa Proteína hipotética do Grupo Indica OsI_17248 0,0E + 00 Sb06g027382 + Sb06g027384 c Os04g51090
3 Zea mays proteína da família scramblase 0,0E + 00 Sb06g027380 Os04g51080
4 Zea mays WAK53a – precursor da proteína quinase semelhante ao receptor OsWAK – Pseudogene 0,0E + 00 Sb01g013060 Os04g51040 e Os04g51050 d
5 a Zea mays isoforma X2-Pseudogene do receptor da cinase 1 associada à parede
6 Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase 0,0E + 00 Sb06g027350 + Sb06g027360 c Os04g51030
7 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase
8 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante à quinase - Pseudogene
9 Zea mays floricaula / folhosa 2 5.0E-171 Sb06g027340 Os04g51000
10 Zea mays Proteína ribossomal L12 60S 1.0E − 108 Sb06g027330 Os04g50990
11 Zea mays proteína específica de semente Bn15D1B 6.0E54− Sb06g027320 Os04g50970
12 Sorghum bicolor proteína hipotética 0,0E + 00 Sb06g027315 Os04g50960
PHYC1 Hordeum vulgare canal KCO1 / TPK1 da membrana plasmática de retificação externa dependente da voltagem 0,0E + 00 Sb01g007830 Os03g54100
2 Zea mays proteína de recombinação meiótica SPO11 0,0E + 00 Sb01g007840 Os03g54091
3 b Hordeum vulgare canal de K + da membrana plasmática de retificação externa dependente da voltagem KCO1 / TPK1 – Pseudogene
4 Zea mays apoproteína fitocromo C1 0,0E + 00 Sb01g007850 Os03g54084
5 Sorghum bicolor proteína hipotética 3.0E-27 Sb01g007870 Os03g54050
6 Eulaliopsis binata proteína da flor 2 embrionária 0,0E + 00 Sb01g007878 Os09g13630
7 Zea mays transportador de glutationa 0,0E + 00 Sb01g007880 e Sb01g007900 d Os03g54000
8 Oryza sativa Proteína hipotética do Grupo Japonica 0,0E + 00 Sb01g007890 e Sb01g007910 + Sb01g007920 c, d Os03g53990
9 Sorghum bicolor proteína hipotética 8.0E − 69 Sb01g007930 Os03g53980
TOR1 Setaria italica predisse DNA primase pequena subunidade-like-Pseudogene
2 Setaria italica prevista serina / treonina-proteína quinase semelhante a TOR 0,00E + 00 Sb09g017790 Os05g14550
Região genômica. Gene No.. Anotação funcional. Valor eletrônico BLASTX. Locus ortólogo em sorgo. Locus ortólogo em arroz.
LFY1 Brachypodium distachyon COBW contendo domínio contendo proteína 1 0,0E + 00 Sb06g027386 Os04g51100
2 Oryza sativa Proteína hipotética do Grupo Indica OsI_17248 0,0E + 00 Sb06g027382 + Sb06g027384 c Os04g51090
3 Zea mays proteína da família scramblase 0,0E + 00 Sb06g027380 Os04g51080
4 Zea mays WAK53a – precursor da proteína quinase semelhante ao receptor OsWAK – Pseudogene 0,0E + 00 Sb01g013060 Os04g51040 e Os04g51050 d
5 a Zea mays isoforma X2-Pseudogene do receptor da cinase 1 associada à parede
6 Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase 0,0E + 00 Sb06g027350 + Sb06g027360 c Os04g51030
7 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante a quinase
8 b Brachypodium distachyon receptor associado à parede semelhante a 17 semelhante à quinase - Pseudogene
9 Zea mays floricaula / folhosa 2 5.0E-171 Sb06g027340 Os04g51000
10 Zea mays Proteína ribossomal L12 60S 1.0E − 108 Sb06g027330 Os04g50990
11 Zea mays proteína específica de semente Bn15D1B 6.0E54− Sb06g027320 Os04g50970
12 Sorghum bicolor proteína hipotética 0,0E + 00 Sb06g027315 Os04g50960
PHYC1 Hordeum vulgare canal KCO1 / TPK1 da membrana plasmática de retificação externa dependente da voltagem 0,0E + 00 Sb01g007830 Os03g54100
2 Zea mays proteína de recombinação meiótica SPO11 0,0E + 00 Sb01g007840 Os03g54091
3 b Hordeum vulgare canal de K + da membrana plasmática de retificação externa dependente da voltagem KCO1 / TPK1 – Pseudogene
4 Zea mays apoproteína fitocromo C1 0,0E + 00 Sb01g007850 Os03g54084
5 Sorghum bicolor proteína hipotética 3.0E-27 Sb01g007870 Os03g54050
6 Eulaliopsis binata proteína da flor 2 embrionária 0,0E + 00 Sb01g007878 Os09g13630
7 Zea mays transportador de glutationa 0,0E + 00 Sb01g007880 e Sb01g007900 d Os03g54000
8 Oryza sativa Proteína hipotética do Grupo Japonica 0,0E + 00 Sb01g007890 e Sb01g007910 + Sb01g007920 c, d Os03g53990
9 Sorghum bicolor proteína hipotética 8.0E-69 Sb01g007930 Os03g53980
TOR1 Setaria italica predisse DNA primase pequena subunidade-like-Pseudogene
2 Setaria italica prevista serina / treonina-proteína quinase semelhante a TOR 0,00E + 00 Sb09g017790 Os05g14550

O pseudogene não possui contrapartida ortóloga na região genômica do sorgo e arroz.

Genes do sorgo editados em um gene com base na estrutura de suas contrapartes ortólogas no arroz (Oryza sativa), milho (Zea mays), e braquipódio (Brachypodium distachyon) Esses loci foram denominados Sb06g027350 + Sb06g027360, Sb06g027382 + Sb06g027384 e Sb01g007910 + Sb01g007920.

O gene previsto na cana-de-açúcar possui ortologia com dois genes distintos nas espécies relacionadas (fig. 1).

PHYC a região genômica é altamente conservada entre cana-de-açúcar, sorgo (Chr1: 6739771.6842927) e arroz (Chr3: 30949716.31017449). No entanto, as regiões ortólogas do sorgo e do arroz têm um conjunto de genes exclusivos (fig. 1B, genes I – II e i – vi para sorgo e arroz, respectivamente). Para o LFY Na região genômica, todos os oito genes anotados do sorgo (Chr6: 55262341.55337043) têm ortólogos colineares na cana-de-açúcar, enquanto o arroz (Chr4: 30167235.30267397) tem cinco (i – v— fig. 1C) genes não colineares com sorgo e cana-de-açúcar. Além da orientação relativa de LFY no arroz é invertido (gene número 9 na fig. 1C).

Análise Evolutiva

Árvores filogenéticas geradas a partir de sequências de codificação de nucleotídeos alinhadas (cds) de TOR haplótipos (homo / homeólogos TOR genes da cana-de-açúcar) permitiram a organização TOR- contendo BACs em dois grupos distintos: Grupo I com cinco haplótipos (102H05 + 236B24 + 077E22, 214B20, 030H10, 187L21 e 007C22) e Grupo II com dois (043C15 e156D23) (fig. 1A).

A maior parte do genoma R570 deriva de S. officinarum (80-90%) com uma pequena porção de S. spontaneum (10-20%) (Cuadrado et al. 2004 D’Hont 2005 Piperidis et al. 2010). Com base neste desequilíbrio, inferimos que o Grupo I provavelmente contém haplótipos originados de S. officinarum e Grupo II de S. spontaneum ( Figura 1).

Origem de TOR haplótipos baseados em inserções compartilhadas e polimorfismos de sequência consistentes com a topologia da árvore. “O” indica a evidência para S. officinarum origem, “S”, S. spontaneum origem e “-” origem indeterminada (para detalhes ver texto, figura complementar S3 e tabela S5, Material Complementar online).

Origem de TOR haplótipos baseados em inserções compartilhadas e polimorfismos de sequência consistentes com a topologia da árvore. “O” indica a evidência para S. officinarum origem, “S”, S. spontaneum origem e “-” origem indeterminada (para detalhes ver texto, figura complementar S3 e tabela S5, Material Complementar online).

Para caracterizar ainda mais como LFY, PHYC, e TOR haplótipos estão evoluindo na cana-de-açúcar, substituições sinônimas por sítio sinônimo (dS) foram calculadas por comparação par a par entre haplótipos de cana-de-açúcar e entre haplótipos de cana-de-açúcar e seus ortólogos de sorgo e arroz. Os haplótipos de cada gene, LFY, PHYC, e TOR, apresentam valores de dS semelhantes quando comparados aos respectivos ortólogos de sorgo ou arroz, indicando que todos os haplótipos estão evoluindo de forma homogênea (tabela 2). No entanto, os valores de dS variam entre os genes, o que indica que esses genes estão evoluindo em taxas diferentes. Essas taxas não são mantidas proporcionalmente ao comparar os valores de dS entre cana-de-açúcar e sorgo e cana-de-açúcar e arroz, indicando variação genética específica nas taxas de evolução entre essas linhagens de gramíneas (tabela 2).

DS, dN e dN / dS estimados para LFY, PHYC, e TOR Genes

. . Cana-de-açúcar × Sorgo. Cana-de-açúcar × Arroz.
Gene. BACs. dS. dN. dN / dS a. dS. dN. dN / dS a.
TOR007C22 0.064 0.007 0.108 0.545 0.033 0.060
030H10 0.062 0.008 0.124 0.551 0.033 0.060
102H05 0.061 0.008 0.126 0.556 0.033 0.060
187L21 0.062 0.007 0.116 0.554 0.033 0.060
043C15 0.070 0.005 0.075 0.568 0.031 0.054
156D23 0.069 0.005 0.071 0.569 0.030 0.053
Média 0.065 0.007 0.103 0.557 0.032 0.058
σ 0.004 0.001 0.022 0.009 0.001 0.003
PHYC038J02 0.066 0.014 0.206 0.414 0.056 0.136
056J11 0.070 0.013 0.183 0.418 0.055 0.132
095E16 0.077 0.014 0.187 0.414 0.056 0.136
173M11 0.075 0.014 0.190 0.414 0.056 0.136
Média 0.072 0.014 0.192 0.415 0.056 0.135
σ 0.004 0.000 0.009 0.002 0.000 0.002
LFY011C13 0.087 0.008 0.097 0.290 0.072 0.249
015P19 0.096 0.012 0.123 0.302 0.073 0.240
070I10 0.093 0.009 0.101 0.302 0.075 0.249
202G24 0.089 0.012 0.132 0.296 0.073 0.245
239D06 0.095 0.013 0.135 0.308 0.073 0.236
236J21 0.085 0.013 0.158 0.285 0.076 0.267
253I01 0.076 0.010 0.127 0.287 0.068 0.235
Média 0.089 0.011 0.125 0.296 0.073 0.246
σ 0.006 0.002 0.019 0.008 0.002 0.010
. . Cana-de-açúcar × Sorgo. Cana-de-açúcar × Arroz.
Gene. BACs. dS. dN. dN / dS a. dS. dN. dN / dS a.
TOR007C22 0.064 0.007 0.108 0.545 0.033 0.060
030H10 0.062 0.008 0.124 0.551 0.033 0.060
102H05 0.061 0.008 0.126 0.556 0.033 0.060
187L21 0.062 0.007 0.116 0.554 0.033 0.060
043C15 0.070 0.005 0.075 0.568 0.031 0.054
156D23 0.069 0.005 0.071 0.569 0.030 0.053
Média 0.065 0.007 0.103 0.557 0.032 0.058
σ 0.004 0.001 0.022 0.009 0.001 0.003
PHYC038J02 0.066 0.014 0.206 0.414 0.056 0.136
056J11 0.070 0.013 0.183 0.418 0.055 0.132
095E16 0.077 0.014 0.187 0.414 0.056 0.136
173M11 0.075 0.014 0.190 0.414 0.056 0.136
Média 0.072 0.014 0.192 0.415 0.056 0.135
σ 0.004 0.000 0.009 0.002 0.000 0.002
LFY011C13 0.087 0.008 0.097 0.290 0.072 0.249
015P19 0.096 0.012 0.123 0.302 0.073 0.240
070I10 0.093 0.009 0.101 0.302 0.075 0.249
202G24 0.089 0.012 0.132 0.296 0.073 0.245
239D06 0.095 0.013 0.135 0.308 0.073 0.236
236J21 0.085 0.013 0.158 0.285 0.076 0.267
253I01 0.076 0.010 0.127 0.287 0.068 0.235
Média 0.089 0.011 0.125 0.296 0.073 0.246
σ 0.006 0.002 0.019 0.008 0.002 0.010

Todos os valores dN / dS são estatisticamente significativos para a seleção de purificação (dN / dS ≪ 1 Z-test P-valor = 0).

DS, dN e dN / dS estimados para LFY, PHYC, e TOR Genes

. . Cana-de-açúcar × Sorgo. Cana-de-açúcar × Arroz.
Gene. BACs. dS. dN. dN / dS a. dS. dN. dN / dS a.
TOR007C22 0.064 0.007 0.108 0.545 0.033 0.060
030H10 0.062 0.008 0.124 0.551 0.033 0.060
102H05 0.061 0.008 0.126 0.556 0.033 0.060
187L21 0.062 0.007 0.116 0.554 0.033 0.060
043C15 0.070 0.005 0.075 0.568 0.031 0.054
156D23 0.069 0.005 0.071 0.569 0.030 0.053
Média 0.065 0.007 0.103 0.557 0.032 0.058
σ 0.004 0.001 0.022 0.009 0.001 0.003
PHYC038J02 0.066 0.014 0.206 0.414 0.056 0.136
056J11 0.070 0.013 0.183 0.418 0.055 0.132
095E16 0.077 0.014 0.187 0.414 0.056 0.136
173M11 0.075 0.014 0.190 0.414 0.056 0.136
Média 0.072 0.014 0.192 0.415 0.056 0.135
σ 0.004 0.000 0.009 0.002 0.000 0.002
LFY011C13 0.087 0.008 0.097 0.290 0.072 0.249
015P19 0.096 0.012 0.123 0.302 0.073 0.240
070I10 0.093 0.009 0.101 0.302 0.075 0.249
202G24 0.089 0.012 0.132 0.296 0.073 0.245
239D06 0.095 0.013 0.135 0.308 0.073 0.236
236J21 0.085 0.013 0.158 0.285 0.076 0.267
253I01 0.076 0.010 0.127 0.287 0.068 0.235
Média 0.089 0.011 0.125 0.296 0.073 0.246
σ 0.006 0.002 0.019 0.008 0.002 0.010
. . Cana-de-açúcar × Sorgo. Cana-de-açúcar × Arroz.
Gene. BACs. dS. dN. dN / dS a. dS. dN. dN / dS a.
TOR007C22 0.064 0.007 0.108 0.545 0.033 0.060
030H10 0.062 0.008 0.124 0.551 0.033 0.060
102H05 0.061 0.008 0.126 0.556 0.033 0.060
187L21 0.062 0.007 0.116 0.554 0.033 0.060
043C15 0.070 0.005 0.075 0.568 0.031 0.054
156D23 0.069 0.005 0.071 0.569 0.030 0.053
Média 0.065 0.007 0.103 0.557 0.032 0.058
σ 0.004 0.001 0.022 0.009 0.001 0.003
PHYC038J02 0.066 0.014 0.206 0.414 0.056 0.136
056J11 0.070 0.013 0.183 0.418 0.055 0.132
095E16 0.077 0.014 0.187 0.414 0.056 0.136
173M11 0.075 0.014 0.190 0.414 0.056 0.136
Média 0.072 0.014 0.192 0.415 0.056 0.135
σ 0.004 0.000 0.009 0.002 0.000 0.002
LFY011C13 0.087 0.008 0.097 0.290 0.072 0.249
015P19 0.096 0.012 0.123 0.302 0.073 0.240
070I10 0.093 0.009 0.101 0.302 0.075 0.249
202G24 0.089 0.012 0.132 0.296 0.073 0.245
239D06 0.095 0.013 0.135 0.308 0.073 0.236
236J21 0.085 0.013 0.158 0.285 0.076 0.267
253I01 0.076 0.010 0.127 0.287 0.068 0.235
Média 0.089 0.011 0.125 0.296 0.073 0.246
σ 0.006 0.002 0.019 0.008 0.002 0.010

Todos os valores dN / dS são estatisticamente significativos para a seleção de purificação (dN / dS ≪ 1 Z-test P-valor = 0).

Com base em valores dS e usando as taxas de substituição calculadas para Adh (Gaut et al. 1996) e para TOR, o tempo de divergência estimado entre TOR haplótipos provavelmente derivados de S. spontaneum e S. officinarum está entre 2,5 e 3,5 Ma (tabela suplementar S6uma e b, Material Suplementar online).

Além disso, todos os haplótipos dos três genes estão sob seleção de purificação (dN / dS ≪ 1 Z-teste P-valor = 0,0) (tabela 2), sugerindo que todos eles são funcionais e possivelmente expressos. Esta última hipótese foi investigada posteriormente.

Análise de Expressão

A fim de avaliar se todos os haplótipos de LFY, PHYC e TOR genes são expressos, quantificamos a expressão das cópias homo / homeólogas em dados de RNA-seq de folhas R570 (dados não publicados) com base em contagens de leitura mapeadas de SNPs discriminatórios previamente identificados.

Análise de 27 SNPs presentes entre TOR haplótipos revelaram uma alta correlação global da dosagem genômica SNP e seu nível de expressão relativa (R 2 = 0.8857 P-valor & lt 0,01), sugerindo que nenhum padrão bruto de expressão preferencial está prevalecendo. Um exame mais atento de TOR SNPs de dose dupla revelaram que todos eles correspondem aos dois S. spontaneum haplótipos, o que indica que os haplótipos de S. officinarum e S. spontaneum origem são expressas (tabela 3 e tabela suplementar S7, Material suplementar online). Ainda, o SNP de dose única de 007C22 TOR haplótipo de S. officinarum origem não foi encontrada expressa (SNP 7356 tabela 3 e tabela suplementar S7, Material Suplementar online), bem como o SNP de dose única do haplótipo 043C15 de S. spontaneum (SNP 6315 tabela 3 e tabela suplementar S7, Material Suplementar online) que mal é expresso. Assim, podemos concluir que nem todos os haplótipos de TOR são igualmente expressos em folhas R570. Uma análise semelhante foi realizada com 33 SNPs de PHYC e nenhuma correlação foi observada entre a dosagem e expressão do SNP genômico (R 2 = 0.0023 P-valor = 0,7007). Na verdade, os haplótipos 173M11 e 056J11 mal são expressos em folhas R570 (SNPs 2619, 2961, 3207 e 3353, tabela 3 e tabela suplementar S7, Material Suplementar online). Para LFY não houve leituras mapeadas suficientes para realizar a análise de expressão, provavelmente porque sua expressão é principalmente restrita aos tecidos florais durante o desenvolvimento.

Correlação entre a dosagem genômica SNP e o nível de expressão relativa de TOR e PHYC Haplótipos

. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 030H10. 214B20. 187L21. 102H05. 007C22. 043C15. 156D23.
TOR5463 C T 6 1 34 6 40 0.86 0.14 0.85 0.15 0.823 X
5887 G UMA 5 2 48 18 66 0.71 0.29 0.73 0.27 0.892 X X
6315 G UMA 6 1 30 1 31 0.86 0.14 0.97 0.03 0.117 X
6604 UMA T 6 1 65 9 74 0.86 0.14 0.88 0.12 0.740 X
6646 G T 5 2 44 15 59 0.71 0.29 0.75 0.25 0.667 X X
6924 C T 6 1 96 11 107 0.86 0.14 0.90 0.10 0.271 X
7295 T C 4 3 102 67 169 0.57 0.43 0.60 0.40 0.437 X X X
7356 C T 6 1 216 0 216 0.86 0.14 1.00 0.00 7,84E-15 X
7380 T C 4 3 117 58 175 0.57 0.43 0.67 0.33 0.009 X X X
. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 030H10. 214B20. 187L21. 102H05. 007C22. 043C15. 156D23.
TOR5463 C T 6 1 34 6 40 0.86 0.14 0.85 0.15 0.823 X
5887 G UMA 5 2 48 18 66 0.71 0.29 0.73 0.27 0.892 X X
6315 G UMA 6 1 30 1 31 0.86 0.14 0.97 0.03 0.117 X
6604 UMA T 6 1 65 9 74 0.86 0.14 0.88 0.12 0.740 X
6646 G T 5 2 44 15 59 0.71 0.29 0.75 0.25 0.667 X X
6924 C T 6 1 96 11 107 0.86 0.14 0.90 0.10 0.271 X
7295 T C 4 3 102 67 169 0.57 0.43 0.60 0.40 0.437 X X X
7356 C T 6 1 216 0 216 0.86 0.14 1.00 0.00 7,84E-15 X
7380 T C 4 3 117 58 175 0.57 0.43 0.67 0.33 0.009 X X X
. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 095E16. 173M11. 038J02. 056J11.
PHYC2484 G T 2 2 30 24 54 0.50 0.50 0.56 0.44 0.497 X X
2531 C T 3 1 52 15 67 0.75 0.25 0.78 0.22 0.675 X
2619 T C 3 1 99 0 99 0.75 0.25 1.00 0.00 7.48E-13 X
2871 G UMA 2 2 62 64 126 0.50 0.50 0.49 0.51 0.929 X X
2961 UMA G 3 1 139 3 142 0.75 0.25 0.98 0.02 6,18E-14 X
3207 G UMA 3 1 86 1 87 0.75 0.25 0.99 0.01 9.03E-10 X
3353 T C 3 1 110 2 112 0.75 0.25 0.98 0.02 1.48E-11 X
. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 095E16. 173M11. 038J02. 056J11.
PHYC2484 G T 2 2 30 24 54 0.50 0.50 0.56 0.44 0.497 X X
2531 C T 3 1 52 15 67 0.75 0.25 0.78 0.22 0.675 X
2619 T C 3 1 99 0 99 0.75 0.25 1.00 0.00 7.48E-13 X
2871 G UMA 2 2 62 64 126 0.50 0.50 0.49 0.51 0.929 X X
2961 UMA G 3 1 139 3 142 0.75 0.25 0.98 0.02 6,18E-14 X
3207 G UMA 3 1 86 1 87 0.75 0.25 0.99 0.01 9.03E-10 X
3353 T C 3 1 110 2 112 0.75 0.25 0.98 0.02 1.48E-11 X

Nota. - Células preenchidas em cinza indicam correlação estatisticamente significativa entre a dosagem genômica de loci SNP e a frequência SNP RNA-seq (P-valor & lt 0,05, Teste Binomial Exato). “X” indica os haplótipos que contêm o SNP alternativo.

Correlação entre a dosagem genômica SNP e o nível de expressão relativa de TOR e PHYC Haplótipos

. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 030H10. 214B20. 187L21. 102H05. 007C22. 043C15. 156D23.
TOR5463 C T 6 1 34 6 40 0.86 0.14 0.85 0.15 0.823 X
5887 G UMA 5 2 48 18 66 0.71 0.29 0.73 0.27 0.892 X X
6315 G UMA 6 1 30 1 31 0.86 0.14 0.97 0.03 0.117 X
6604 UMA T 6 1 65 9 74 0.86 0.14 0.88 0.12 0.740 X
6646 G T 5 2 44 15 59 0.71 0.29 0.75 0.25 0.667 X X
6924 C T 6 1 96 11 107 0.86 0.14 0.90 0.10 0.271 X
7295 T C 4 3 102 67 169 0.57 0.43 0.60 0.40 0.437 X X X
7356 C T 6 1 216 0 216 0.86 0.14 1.00 0.00 7,84E-15 X
7380 T C 4 3 117 58 175 0.57 0.43 0.67 0.33 0.009 X X X
. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 030H10. 214B20. 187L21. 102H05. 007C22. 043C15. 156D23.
TOR5463 C T 6 1 34 6 40 0.86 0.14 0.85 0.15 0.823 X
5887 G UMA 5 2 48 18 66 0.71 0.29 0.73 0.27 0.892 X X
6315 G UMA 6 1 30 1 31 0.86 0.14 0.97 0.03 0.117 X
6604 UMA T 6 1 65 9 74 0.86 0.14 0.88 0.12 0.740 X
6646 G T 5 2 44 15 59 0.71 0.29 0.75 0.25 0.667 X X
6924 C T 6 1 96 11 107 0.86 0.14 0.90 0.10 0.271 X
7295 T C 4 3 102 67 169 0.57 0.43 0.60 0.40 0.437 X X X
7356 C T 6 1 216 0 216 0.86 0.14 1.00 0.00 7,84E-15 X
7380 T C 4 3 117 58 175 0.57 0.43 0.67 0.33 0.009 X X X
. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 095E16. 173M11. 038J02. 056J11.
PHYC2484 G T 2 2 30 24 54 0.50 0.50 0.56 0.44 0.497 X X
2531 C T 3 1 52 15 67 0.75 0.25 0.78 0.22 0.675 X
2619 T C 3 1 99 0 99 0.75 0.25 1.00 0.00 7.48E-13 X
2871 G UMA 2 2 62 64 126 0.50 0.50 0.49 0.51 0.929 X X
2961 UMA G 3 1 139 3 142 0.75 0.25 0.98 0.02 6,18E-14 X
3207 G UMA 3 1 86 1 87 0.75 0.25 0.99 0.01 9.03E-10 X
3353 T C 3 1 110 2 112 0.75 0.25 0.98 0.02 1.48E-11 X
. . . . Dosagem de haplótipo (dados genômicos). Leia contagens RNA-seq. Profundidade de RNA-seq (# leituras mapeadas). Dosagem relativa do haplótipo (gDNA). Expressão relativa do haplótipo (mRNA). Valor p de teste binomial exato. Haplótipos com SNP alternativo.
Gene. Posição SNP. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. Haplótipo principal. Haplótipo alternativo. 095E16. 173M11. 038J02. 056J11.
PHYC2484 G T 2 2 30 24 54 0.50 0.50 0.56 0.44 0.497 X X
2531 C T 3 1 52 15 67 0.75 0.25 0.78 0.22 0.675 X
2619 T C 3 1 99 0 99 0.75 0.25 1.00 0.00 7.48E-13 X
2871 G UMA 2 2 62 64 126 0.50 0.50 0.49 0.51 0.929 X X
2961 UMA G 3 1 139 3 142 0.75 0.25 0.98 0.02 6,18E-14 X
3207 G UMA 3 1 86 1 87 0.75 0.25 0.99 0.01 9.03E-10 X
3353 T C 3 1 110 2 112 0.75 0.25 0.98 0.02 1.48E-11 X

Nota. - Células preenchidas em cinza indicam correlação estatisticamente significativa entre a dosagem genômica de loci SNP e a frequência SNP RNA-seq (P-valor & lt 0,05, Teste Binomial Exato). “X” indica os haplótipos que contêm o SNP alternativo.

Juntos, esses dados indicam que em deixa a expressão de TOR e PHYC os genes envolvem a expressão diferencial dos haplótipos. Embora o mecanismo responsável por essas diferenças na expressão seja desconhecido, podemos especular que a variação da sequência nas regiões promotoras e / ou silenciamento epigenético pode ser responsável pela baixa ou não expressão de alguns haplótipos.

Avaliação de PHYC e TOR sequências cis-regulatórias putativas (códon de início a montante de 1 kb) mostraram que a conservação de sequência entre todos os haplótipos é limitada a ∼600 bp e ∼460 bp, respectivamente, e então é interrompida por TE e outras inserções (figura suplementar S4, Material Suplementar online ) Este padrão de conservação seria compatível com alguma semelhança de expressão entre os haplótipos, enquanto as inserções de TE poderiam promover a diversificação da expressão.

Análise de inserções compartilhadas entre BACs

Para as três regiões genômicas analisadas, BACs que compartilham inserções colineares foram encontrados (isto é, TEs ou outras sequências indefinidas inseridas na mesma posição exata em BACs diferentes). Todas as inserções colineares mostraram-se altamente conservadas, apresentando mais de 93% de identidade. Essas inserções compartilhadas podem representar pegadas de WGD (Whole Genome Duplication - definido neste trabalho como sinônimo de autopoliploidização) de S. officinarum ou S. spontaneum evolução do genoma e pode ajudar a reconstruir a história evolutiva dos haplótipos que coexistem no moderno genoma da cana-de-açúcar.

O tempo de divergência (T = d/2r) dessas inserções compartilhadas foram estimadas comparando suas sequências inteiras e aplicando uma taxa de mutação de 1,3 × 10 - 8 substituições por local por ano (Ma e Bennetzen 2004), o que deve, pelo menos para algumas inserções, definir o momento aproximado em que o genoma duplicação ocorreu. As inserções são compartilhadas entre 2-5 regiões genômicas homo / homeólogas e todas elas, exceto duas (TE "d", em TOR região genômica, e TE "b", em LFY região genômica fig. 1A e C), divergiram menos de 2,6 Ma (tabela suplementar S4, Material Suplementar online), sugerindo que esses haplótipos podem ter divergido após a separação de S. officinarum e S. spontaneum (2,5–3,5 Ma). Além disso, a inserção compartilhada pelo mais provável S. officinarum e S. spontaneum haplótipos de TOR região (TE “d”, fig. 1A e tabela suplementar S4, Material Complementar online) divergiu em torno de 3,2 Ma, próximo ao tempo estimado de S. officinarum e S. spontaneum separação.

Para um RTE inserido no 25º intron de TOR gene em BACs 030H10 e 102H05 + 236B24 + 077E22 (TE "g", fig. 1A e tabela suplementar S4, Material Suplementar online) e uma pequena inserção não caracterizada (∼500 bp) no segundo íntron de LFY gene, nos BACs 070I10 e 239D06 (TE "d", fig. 1C e tabela complementar S4 e fig.S5, Material Suplementar online), desenhamos primers específicos (tabela complementar S8 e fig. S6, Material Suplementar online) para verificar sua presença em espécies do “complexo Saccharum” e, portanto, avaliar sua origem.

As amplificações confirmaram que a inserção "d" compartilhada por LFY BACs 070I10 e 239D06 e a inserção "g" compartilhada por TOR BACs 030H10 e 102H05 + 236B24 + 077E22 estão presentes apenas em S. officinarum e S. robustum (o ancestral selvagem de S. officinarum) acessos (fig. S7 complementar, Material Suplementar online), sustentando a possibilidade de que essas inserções tenham ocorrido após a separação de S. officinarum e S. spontaneum. Esses resultados indicam que pelo menos um WGD de S. officinarum linhagem aconteceu após divergência de S. officinarum e S. spontaneum.


Discussão

O CFG de RLV3841

Young et al. (2006) usaram a filogenia de genes conservados e GC% para descrever um genoma central e acessório dentro do RLV3841. O presente estudo ajuda a melhorar o nível de resolução para distinguir entre os genes principais RLV3841 e genes acessórios usando triagem genética funcional. Propomos que RLV3841 tem um CFG que pode ser definido como o conjunto principal de genes necessários para o crescimento normal, independente de qualquer condição ambiental específica. Neste estudo, aproximamos o CFG de RLV3841 contrastando conjuntos de dados gerados por INSeq a partir do crescimento em meios complexos ricos em peptídeos e minimamente definidos com manitol como única fonte de carbono. A referência cruzada dos genes cromossômicos VGI e TGI identificou um conjunto de sobreposição de 491 genes que atribuímos ao CFG de RLV3841, pois sua perda de função resultou em um fenótipo GI que parece ser independente do meio de crescimento usado. O número de genes CFG foi menor do que os genes TGI e VGI, que representaram 563 e 661 genes, respectivamente (Figura 1). Isso é esperado se o CFG representar um conjunto central de genes necessários para funções celulares centrais.

Definir um CFG em RLV3841 fornece contexto para o INSeq subsequente e estudos genéticos clássicos. Por exemplo, o CFG descrito para RLV3841 ajudará a explicar se uma mutação que resulta em um fenótipo GI em um ambiente associado à planta é o resultado de prejudicar algum aspecto do CFG RLV3841 ou, em vez disso, é o resultado de uma interação específica da planta. Isso é particularmente importante para genes que codificam proteínas hipotéticas de função desconhecida. Resumindo a distribuição das funções do gene no CFG identificou 20 agrupamentos funcionais (Figura 2). Cinco categorias principais responderam por mais da metade do CFG total (287 genes). Essas 5 categorias funcionais incluíram: síntese e modificação de macromoléculas (98 genes), metabolismo de energia e carbono (50 genes), constituintes do ribossomo (48 genes), envelope celular (46 genes) e proteínas hipotéticas (50 genes) (Figura 2). Proteínas hipotéticas à parte, essas 4 categorias logicamente compõem a maioria do CFG, pois representam os genes centrais necessários para a síntese dos principais componentes celulares, conversão central de carbono para geração de redutor e ATP, produção e modificação do maquinário de síntese de proteínas, e síntese do envelope celular.

O fato de que os genes que codificam proteínas hipotéticas eram uma das cinco categorias principais atribuídas ao CFG reforça a observação amplamente reconhecida entre os geneticistas de que a função de muitos genes envolvidos em processos celulares centrais ainda permanece incaracterizada. INSeq é uma técnica poderosa que pode ajudar a identificar proteínas hipotéticas necessárias para a sobrevivência em condições de crescimento específicas e, em última análise, aumentará nossa taxa de descoberta nesta grande e subestimada categoria de genes. Por exemplo, neste estudo, identificamos um total de 103 proteínas hipotéticas observadas como tendo um fenótipo de crescimento prejudicado em pelo menos uma condição de crescimento, das quais 19 eram VGI, 20 eram TGI, 14 eram associadas ao plasmídeo e o restante pertencia ao CFG ( Tabela 1).

VMM cromossômico e deficiência de crescimento específico de TY

O crescimento em meios mínimos requer a biossíntese de vários metabólitos que podem ser eliminados de um meio de crescimento complexo. Portanto, era esperado que houvesse mais genes VGI em comparação com genes TGI, e que uma porção substancial dos genes VGI fossem funcionalmente classificados para a biossíntese de aminoácidos (30 genes), cofatores e carreadores (25 genes), nucleotídeos (20 genes) e intermediários metabólicos (15 genes) (Figura 2).

Para interrogar ainda mais o conjunto de dados VGI, dois genes anteriormente não caracterizados, RL0920 uma proteína da família mrp de ligação a ATP putativa e RL3335 uma lisofosfolipase putativa, foram selecionados para mutagênese direcionada. Uma curva de crescimento em cultura líquida foi usada para caracterizar o tempo de geração e a resposta de crescimento dos mutantes. Como esperado, MA0920 e MA3335 tiveram seu crescimento substancialmente prejudicado com tempos de geração aumentados em VMM-manitol. Após 72 h de crescimento, as culturas mutantes tinham 1/3 da densidade do tipo selvagem em VMM-manitol, enquanto em TY haviam alcançado densidades semelhantes ao tipo selvagem (Figura 3).

Os genes TGI eram compostos do menor número de genes GI e da menor complexidade funcional (Figura 2). Ao contrário dos genes VGI, o mecanismo geral subjacente aos genes TGI não depende da biossíntese metabólica, o que não é surpreendente, pois os meios complexos conterão muitos, senão todos, intermediários metabólicos necessários para o crescimento. As maiores categorias funcionais observadas nos genes TGI foram proteínas hipotéticas (20 genes), envelope celular (11 genes), síntese e modificação de macromoléculas (9 genes) e proteínas de transporte e ligação (8 genes). Estudos anteriores identificaram vários genes TGI, que coletivamente estão implicados na integridade da membrana externa ou função periplasmática, sugerindo que o crescimento em meios complexos pode exigir características de envelope específicas (Gilbert et al., 2007 Vanderlinde et al., 2009, 2011 Foreman et al. , 2010 Vanderlinde e Yost, 2012a, b). Além disso, observamos uma proteína de resposta ao choque frio putativa (RL2964), um regulador transcricional da família LysR, reguladores de resposta transcricional múltiplos de sistemas de dois componentes previstos (RL0036, RL1433, RL1729), um componente de histidina quinase de um sistema de dois componentes (RL1382 ), bem como proteínas hipotéticas contendo domínios transmembrana (RL1526, RL2641), domínio AAA & # x02013ATPase (RL2625) ou sinais de secreção N-terminal (RL3761, RL1528, RL1618A, RL2086, RL4716) que eram GI em meio TY (arquivo suplementar 1). Essas descobertas sugerem que o fenótipo TGI coletivamente pode ser centrado em torno da detecção celular e da resposta ao estresse na interface do envelope celular-ambiente.

Metabolismo de carbono central do manitol

Usando INSeq, fomos capazes de rastrear as 4 principais vias metabólicas centrais conservadas do carbono para os genes necessários para o crescimento em manitol (Figura 4 Tabela 2). Como esperado, a interrupção dos genes necessários para o transporte de manitol e a conversão em F6P, junto com a glicose-6-fosfato isomerase (pgi) necessária para a conversão de F6P em glicose-6P (Keele et al., 1969 Arias et al., 1979), resultou em um fenótipo GI. Os genes necessários para a conversão de G6P em gluconato-6P (GN6P) através da via ED (sobrepondo-se ao ramo oxidativo da via da pentose fosfato) resultou em um fenótipo GI quando mutado em ambos TY e VMM (Figura 4: reação 1.1 & # x020132) . A natureza essencial dessas reações pode ser devido a vários fatores: (1) o NADPH gerado durante a conversão (Spaans et al., 2015), (2) o acúmulo possivelmente tóxico de intermediários fosforilados (Cerve & # x000F1ansk & # x000FD e Arias, 1984 Kadner et al., 1992), (3) o papel do G6P na biossíntese de osmoprotetores (Barra et al., 2003), e (4) a necessidade de fluxo de carbono na via ED para o crescimento glicolítico (Arias et al. , 1979, Glenn et al., 1984 Stowers, 1985). A conversão de GN6P em piruvato através da via ED foi determinada como sendo VGI (Figura 4: reação 1.3 & # x020134). Mutações na via superior do EMP, além de pgi, foram observados como neutros, o que está de acordo com trabalhos anteriores (Glenn et al., 1984). A via de EMP inferior (às vezes considerada compartilhada pela via de ED), converte gliceraldeído-3P (GA3P) em piruvato, com mutantes em todas as etapas enzimáticas aparecendo GI em manitol, e em algumas etapas em TY também (Figura 4: reação 2.5 & # x020139). A natureza VGI do EMP inferior quando cultivado em manitol é possivelmente devido aos mutantes serem incapazes de metabolizar GA3P produzido a partir da via de ED nos precursores de aminoácidos glicerato-3P (G3P) ou fosfoenolpiruvato (PEP), e também catabolizar GA3P em piruvato (Finan et al., 1988) para uso no ciclo de TCA. O fenótipo GI geral de mutantes em toda a via ED, em contraste com a via EMP, sugere que é a via central para a conversão glicolítica de carbono no piruvato intermediário de carbono central. Isso está de acordo com pesquisas anteriores que indicam que a via ED é a rota preferida do metabolismo do carbono para o crescimento glicolítico de rizóbios e gêneros relacionados (Stowers, 1985 Fuhrer et al., 2005 Geddes e Oresnik, 2014).

A conversão de piruvato no ciclo de TCA foi observada para ter 2 vias GI únicas (Figura 4: reação 3.1 & # x0201314). A conversão de piruvato em TCA através de acetil-CoA como um intermediário é uma via menos direta do que a conversão direta de piruvato em oxaloacetato, e mutantes em piruvato carboxilase (Figura 4: reação 3.14) foram observados como sendo mais solidariamente GI do que em citrato sintase (Figura 4: reação 3.2). Além disso, no meio TY os mutantes na piruvato desidrogenase apareceram GI, enquanto os mutantes na piruvato carboxilase não. Esses achados estão de acordo com a produção anaplerótica de oxaloacetato (OAA), via pyc- fixação mediada de CO2, sendo importante para reabastecer os pools de OAA sob condições mínimas de crescimento (Gokarn et al., 2001 Sirithanakorn et al., 2014).

Quando cultivados em manitol como única fonte de carbono, os mutantes nos genes do ciclo do TCA foram todos observados como sendo GI, além da conversão de fumarato em malato (Figura 4: reação 3.2 & # x020133.9). Mutantes em fumC e fumA (RL2701 e RL2703) foram observados como neutros em termos de crescimento, possivelmente devido à redundância funcional entre as duas isozimas, que foi relatado anteriormente em Bradyrhizobium japonicum (Acu & # x000F1a et al., 1991). Estudos futuros de INSeq com exposição prolongada à pressão seletiva podem identificar qual isoenzima é dominante. Várias etapas do TCA foram observadas como GI em ambos os meios VMM-manitol e TY, confirmando que o ciclo do TCA é um componente importante do CFG em RLV3841. Mutantes em isocitrato desidrogenase (icd) foram VGI e TGI (Figura 4: reação 3.4). Foi demonstrado anteriormente que mutantes em icd desenvolver auxotrofia para glutamato (McDermott e Kahn, 1992), o que pode explicar o fenótipo de crescimento prejudicado em meio mínimo, mas não explica a deficiência de crescimento em meio TY rico em peptídeos. Mutantes em sucB e citM (sucA) também foram observados como tendo o crescimento prejudicado em ambos os meios (Figura 4: reação 3.5). Para o crescimento em VMM-manitol, a natureza GI desses mutantes é possivelmente devido ao aumento da concentração de & # x003B1-cetoglutarato devido à incapacidade de metabolizar em succinil-CoA e, possivelmente, perturbação do ciclo GOGAT via desvio do excesso & # x003B1- cetoglutarato (Bravo e Mora, 1988 Dunn, 1998).

Os genes que codificam enzimas para o desvio de glioxalato, fosfoenolpiruvato carboxicinase e frutose bifosfato aldolase, foram observados como GN em meios VMM-manitol e TY, sugerindo que a gliconeogênese não é necessária para o crescimento em qualquer condição (Kornberg, 1966 McKay et al. , 1985, Stowers, 1985). Isso parece razoável, visto que o crescimento do manitol é presumivelmente glicolítico, portanto, a conversão do açúcar pode ser realizada em intermediários metabólicos gerados durante a quebra do manitol. E na mídia TY, muitos carboidratos e polióis provavelmente já estão presentes em pequenas quantidades, mitigando a necessidade de gliconeogênese.

Quase todos os genes envolvidos no ramo não oxidativo das vias do PP foram observados como tendo um impacto neutro no crescimento quando mutados. As únicas duas reações na via do PP que foram GI em manitol foram para a conversão de ribulose-5P em ribose-5P ou, alternativamente, xilulose-5P (Figura 4: reação 4.2 e 4.3). A mutação da ribose-5-fosfato isomerase A aparecendo GI é lógica, pois a ribose-5P é um precursor para 5-fosforiboosil - & # x003B1-1-pirofosfato, que é o ponto de ramificação para o fluxo de carbono no nucleotídeo, histidina, nicotinamida, e biossíntese de triptofano (Kilstrup et al., 2005 Switzer, 2009). A conversão de GN6P em ribulose-5P, entretanto, foi observada para ser GN. Existem duas explicações possíveis para mutantes nesta etapa que aparecem como GN: (1) redundância funcional em isozimas Gnt e GntZ compensa a mutação de (Figura 4: reação 4.1) ou (2) a ribulose-5P pode ser reabastecida a partir de xilulose-5P derivada de F6P e G3P sendo desviada para a via PP (Figura 4: reação 4.4 & # x020136) ou a via da fosfocetolase (EC 4.1.2.9). Em geral, a interconexão da via PP torna difícil estudar nocautes de um único gene, pois os mutantes podem se adaptar a vias interrompidas usando rotas metabólicas alternativas ou isoenzimas (Geddes e Oresnik, 2014).

Genes de crescimento de plasmídeo prejudicados

Existem oportunidades e desafios únicos para explorar a biologia de plasmídeos ao conduzir experimentos INSeq em espécies bacterianas com genomas contendo vários plasmídeos grandes. As mutações que resultam na perda de um plasmídeo do genoma acessório, devido à estabilidade prejudicada do plasmídeo, aparecerão fenotipicamente idênticas a um mutante GI perdido do conjunto de mutantes devido a uma taxa de crescimento diminuída. Portanto, não pode ser concluído diretamente a partir dos dados de INSeq se a inserção de um transposon específico dentro de um plasmídeo resultou em um fenótipo GI ou, em vez disso, comprometeu a estabilidade ou replicação do plasmídeo. Todos os plasmídeos continham um grupo de três genes de representante genes que foram observados como essenciais (PGI) quando mutados (Figura 5 Arquivo Suplementar 1), que em conjunto com a função anotada desses genes sugere que a perda dessas marcas de inserção Tn da população mutante foi devido à replicação deficiente do plasmídeo.

Além de identificar putativos representante genes, INSeq podem ser úteis na identificação de genes de plasmídeo que fornecem à célula hospedeira benefícios de crescimento sob condições específicas. Por exemplo, pRL11 contém um operon de 8 gene putativo (pRL110625-32) previsto para estar envolvido na biossíntese de cobalamina, que era severamente PGI em VMM-manitol e moderadamente PGI em TY quando mutado. Estudos anteriores em R. etli identificaram fenótipos de crescimento semelhantes quando um cluster biossintético de cobalamina homóloga em p42e foi excluído (Landeta et al., 2011). Além disso, pRL120209 (putativo tpiA) e pRL120210 (putativo rpiB), que codificam enzimas previstas para funcionar no metabolismo central do carbono, foram consideradas PGI quando cultivadas em manitol como única fonte de carbono. Seus homólogos cromossômicos RL2513 (tpiA) e RL2547 (rpiB) foram observados como GN (Tabela 2). Em um estreitamente relacionado R. leguminosarum bv. viciae estirpe VF39, os homólogos de pRL120209 e pRL120210 são necessários para o crescimento em eritritol como única fonte de carbono (Yost et al., 2006). Isso sugere que pRL12 pode carregar genes importantes para o crescimento normal de RLV3841 sob condições específicas, o que está de acordo com estudos anteriores que mostraram cepas curadas de pRL12 de R. leguminosarum foram incapazes de crescer em meio mínimo (Hynes et al., 1989).

Considerações técnicas de INSeq em RLV3841

O INSeq, como todas as técnicas moleculares de alto rendimento, tem limitações. Genes com grandes regiões de duplicação de sequência, ou sem locais de inserção mariner & # x0201CTA & # x0201D, não podem ser testados usando INSeq. Esses genes representam apenas 1,9% do genoma. No entanto, o método de preparação da biblioteca direcionada e a análise estatística robusta proporcionada pelo uso de MmeI adaptado marinheiro o transposon parece superar suas desvantagens. Uma saturação suficiente de locais de inserção mariner neutros dentro da comunidade mutante permite a identificação confiável de regiões que carecem de inserções devido à seleção negativa resultante de um fenótipo GI. Neste trabalho e no anterior, um nível suficiente de saturação de site neutro & # x0201CTA & # x0201D foi recuperado para permitir métodos Bayesianos de análise, usando uma quantidade relativamente modesta de dados de sequenciamento quando comparados a outros marinheiro Estudos INSeq. Considerações sobre a densidade de inoculação, o número de gerações de crescimento durante a seleção negativa e a capacidade de recuperar populações mutantes precisam ser cuidadosamente consideradas para garantir que complexidade suficiente seja retida nos conjuntos de mutantes pós-seleção para permitir a análise estatística.


Sobre a origem das células mitosantes

Uma teoria da origem das células eucarióticas (células "superiores" que se dividem por mitose clássica) é apresentada. Por hipótese, três organelas fundamentais - a mitocôndria, os plastídios fotossintéticos e os (9 + 2) corpos basais dos flagelos já foram células de vida livre (procarióticas). A evolução da fotossíntese sob as condições anaeróbicas da atmosfera inicial para formar bactérias anaeróbias, bactérias fotossintéticas e eventualmente algas azul-esverdeadas (e protoplastídeos) é descrita. A evolução subsequente do metabolismo aeróbio em procariotos para formar bactérias aeróbicas (protoflagella e protomitocôndria) provavelmente ocorreu durante a transição para a atmosfera oxidante. A mitose clássica evoluiu em células do tipo protozoário milhões de anos após a evolução da fotossíntese. Um esquema plausível para a origem da mitose clássica em ameboflagelados primitivos é apresentado. Durante o curso da evolução da mitose, os plastídeos fotossintéticos (eles próprios derivados de procariotos) foram adquiridos simbioticamente por alguns desses protozoários para formar as algas eucarióticas e as plantas verdes.

A evidência citológica, bioquímica e paleontológica para esta teoria é apresentada, juntamente com sugestões para posterior verificação experimental possível. As implicações deste esquema para a sistemática dos organismos inferiores são discutidas.


Assista o vídeo: Retrotransposons (Agosto 2022).