Em formação

Comparando os níveis de expressão gênica entre o controle e a doença em diferentes momentos

Comparando os níveis de expressão gênica entre o controle e a doença em diferentes momentos


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Eu tenho um conjunto de dados com níveis de expressão de uma lista de genes, medidos em replicar em dois pontos de tempo diferentes entre dois grupos; um grupo de controle e um grupo de doenças.

Quero identificar as mudanças na expressão entre os dois grupos, no entanto, estou tendo alguns problemas em formular a melhor forma de fazer isso. Por exemplo, se eu tiver $ [C_0] $ e $ [C_1] $ como o grupo de controle medido em $ t = 0 $ e $ t = 1 $ respectivamente, e $ [D_0] $ e $ [D_1] $ como o grupo de doenças, eu tentei fazer:

$$ frac {([D_1] - [D_0]) - ([C_1] - [C_0])} {[C_1] - [C_0]} $$

Eu sinto que uma mudança dobrada seria apropriada, no entanto, não parece fazer nenhum sentido logicamente para os genes onde $ [C_0] = [C_1] $ ou $ [D_0] = [D_1] $.

Alguém poderia sugerir uma proporção ou medida apropriada? Isso é bastante simples quando se trata de uma simples comparação entre C e D (por exemplo, você acabou de encontrar $ frac {D} {C} $), no entanto, não tenho certeza de como tratar os diferentes pontos no tempo.


O perfil de expressão do gene pode mudar em pontos de tempo diferentes entre os dois grupos; você deve decidir o que realmente deseja medir. Se você quiser ver se o grupo de doentes é diferente do controle, você deve compará-los a cada momento. Para a maioria das situações, você precisaria comparar apenas o comportamento em estado estacionário.

Imagine um indivíduo doente que mostra algumas diferenças fisiológicas em certos estágios de desenvolvimento em comparação com o controle, mas no final acaba sendo perfeitamente normal. Portanto, o que importa na maioria dos casos é o estado estacionário e não os transitórios.

No entanto, se você estiver interessado no mudança na expressão então você deve comparar ([D1] - [D0]) com ([C1] - [C0]). Isto irá dizer-lhe se a dinâmica das amostras doentes e das amostras de controlo são semelhantes ou não.

Existem problemas com as alterações de dobra. Embora sejam medidas decentes, você não pode realmente aplicar um teste t com alterações de dobra (normalizar para 1 é uma coisa diferente).

Você pode fazer outro teste t entre [C1] e [C0] (da mesma forma para D) Isso diria se a população doente ou controle muda sua expressão no momento t = 1 ou não.

AFAIK você não pode comparar a dinâmica e os valores simultaneamente. O que você deve testar depende do seu interesse.


Um atlas circadiano de expressão gênica em mamíferos: implicações para a biologia e a medicina

Geramos dados de expressão de múltiplos órgãos de alta resolução, mostrando que quase metade de todos os genes no genoma do camundongo oscilam com o ritmo circadiano em algum lugar do corpo. Essas oscilações transcricionais generalizadas não foram relatadas anteriormente em mamíferos. Aplicando a análise de caminhos, observamos novas relações espaço-temporais mediadas por relógio. Além disso, descobrimos que a maioria dos medicamentos mais vendidos nos Estados Unidos tem como alvo produtos do gene circadiano. Muitos desses medicamentos têm meias-vidas relativamente curtas e nossos dados preveem quais podem se beneficiar com a dosagem cronometrada.


Materiais e métodos

Tratamento de peixes e coleta de amostras

Para investigar o efeito da temperatura na expressão gênica em Austrofundulus limnaeus Myers, expusemos peixes a quatro regimes de aclimatação de temperatura de laboratório (Fig. 1B): temperaturas constantes de 20 °, 26 ° ou 37 ° C ou um regime de temperatura de ciclo diário de 20–37 ° C. O regime de flutuação de temperatura foi projetado para imitar as variações naturais de temperatura experimentadas diariamente por A. limnaeus(Podrabsky et al., 1998 Fig. 1A). Peixes machos adultos com um tamanho médio de 2,1 ± 1,1 g (média ± dp) foram usados ​​neste estudo para evitar complicações associadas ao tamanho e à expressão gênica específica do sexo. No total, 432 peixes foram amostrados durante o regime de amostragem ao longo do tempo. Os peixes usados ​​neste experimento foram produzidos a partir de um estoque de laboratório que foi mantido por várias gerações a 26–28 ° C. Os peixes para cada regime de aclimatação foram alojados em aquários de vidro de 210 l. Os peixes foram alimentados diariamente durante o experimento às 09:00 h com vermes sanguíneos congelados (larvas de quironomídeos). O experimento foi iniciado (t= 0) às 12:30 h. Os peixes foram amostrados (Fig. 1Bsymbols) a cada 24 h para as aclimatações de 20 ° e 37 ° C e a cada 4 h durante os tratamentos de flutuação (20–37 ° C) e controle (26 ° C). Quatro peixes foram removidos dos tanques de aclimatação em cada momento e congelados rapidamente em nitrogênio líquido. Os peixes foram armazenados a –80 ° C por 2–4 semanas antes da extração do RNA total do tecido hepático.

Temperaturas naturais e de laboratório experimentadas por adultos Austrofundulus limnaeus. (A) Registro de temperatura por 5 dias consecutivos em uma lagoa efêmera típica habitada por A. limnaeus(Podrabsky et al., 1998). (B) Peixes machos adultos foram expostos a quatro diferentes aclimatações térmicas. Para o tratamento de temperatura de ciclo (20-37 ° C) (linha preta), peixes foram coletados (círculos abertos) a cada 4 h durante os primeiros três ciclos diários e, em seguida, novamente a cada 4 h no dia 5 e no dia 14. Peixes de controle (linha cinza ) mantidos a 26 ° C foram coletados (quadrados abertos) a cada 4 h no dia 1 e no dia 14. Os peixes expostos a constantes 20 ° C (linha azul) foram coletados (diamantes azuis abertos) em 24, 48,72, 96, 168 e 336 h. Os peixes expostos a constantes 37 ° C (linha rosa) foram coletados (quadrados rosa abertos) como os peixes a 20 ° C, exceto para o ponto de tempo de 336 h. O tempo 0 para a ciclagem de temperatura é 12:30 ha uma temperatura de 26 ° C. Observe o eixo quebrado em B. Enquanto cinco ciclos de temperatura foram amostrados durante a aclimatação de 2 semanas, a temperatura estava continuamente em ciclo.

Temperaturas naturais e de laboratório experimentadas por adultos Austrofundulus limnaeus. (A) Registro de temperatura por 5 dias consecutivos em uma lagoa efêmera típica habitada por A. limnaeus(Podrabsky et al., 1998). (B) Peixes machos adultos foram expostos a quatro diferentes aclimatações térmicas. Para o tratamento de temperatura de ciclo (20-37 ° C) (linha preta), peixes foram coletados (círculos abertos) a cada 4 h para os primeiros três ciclos diários e, em seguida, novamente a cada 4 h no dia 5 e no dia 14. Peixes de controle (linha cinza ) mantidos a 26 ° C (quadrados abertos) a cada 4 h no dia 1 e no dia 14. Os peixes expostos a constantes 20 ° C (linha azul) foram coletados (diamantes azuis abertos) em 24, 48,72, 96, 168 e 336 h. Os peixes expostos a constantes 37 ° C (linha rosa) foram coletados (quadrados rosa abertos) como os peixes a 20 ° C, exceto para o ponto de tempo de 336 h. O tempo 0 para a ciclagem de temperatura é 12:30 ha uma temperatura de 26 ° C. Observe o eixo quebrado em B. Enquanto cinco ciclos de temperatura foram amostrados durante a aclimatação de 2 semanas, a temperatura estava continuamente em ciclo.

Preparação de bibliotecas de cDNA

Os fígados foram dissecados de peixes congelados e o RNA total foi extraído com Trizol de acordo com as instruções do fabricante (Invitrogen, Carlsbad, CA, EUA). O RNA total dos fígados de quatro peixes foi agrupado para cada ponto de tempo. Essas amostras combinadas de RNA total foram usadas para preparar cDNA para a produção do microarray e para traçar o perfil das mudanças na expressão gênica durante a aclimatação à temperatura.

Uma biblioteca de cDNA foi preparada a partir de RNA total coletado de todos os peixes amostrados durante as aclimatações. A tecnologia de cDNA SMART (BD Biosciences, San Jose, CA, EUA) foi usada para preparar o cDNA antes da clonagem no vetor de plasmídeo de clonagem direcional pλTriplEx2 (ClonTech). Resumidamente, o RNA total foi usado como um modelo para criar uma cópia de cDNA de cada mRNA usando a transcriptase reversa (Powerscript, ClonTech). O cDNA de fita simples foi então amplificado através da reação em cadeia da polimerase de longa distância (LD-PCR Cheng et al., 1994). O cDNA amplificado foi então ligado ao vetor de clonagem. Competente E. coli (Células DH10B, Invitrogen) foram então transformadas com os plasmídeos ligados através da eletroporação. As células transformadas foram então selecionadas quanto à presença de um inserto de cDNA e resistência à ampicilina (100 μg l –1) através da rastreio azul / branco em placas de LB / agar (Sambrook et al., 1989). Um total de 4.992 clones de cDNA foram isolados em placas de microtitulação de 384 poços e cultivados durante a noite em meio LB (Sambrook et al., 1989) suplementado com 10% de glicerol. Essas placas foram replicadas e armazenadas a –80 ° C.

Construção do microarray de cDNA

As inserções de cDNA de cada clone isolado na biblioteca de cDNA foram amplificadas usando a reação em cadeia da polimerase (PCR). Foi preparada uma mistura mestre de PCR contendo 1 × Taq. Tampão de polimerase (Promega, Madison, WI, EUA), 0,2 mmol l –1 dNTPs e 0,2 μmol l –1 primers específicos do plasmídeo. Um único volume de reação foi de 25 μl. A mistura principal de PCR foi inoculada com uma pequena quantidade de uma única cultura de caldo bacteriano da placa de 384 poços usando uma ferramenta de replicação de placa de 96 poços (Nalgene / Nunc, Rochester, NY, EUA). As reações foram então aquecidas a 95 ° C por 2 min para lisar as bactérias e liberar o DNA de plasmídeo como molde para a reação. As reações foram então expostas a 40 ciclos de amplificação com uma etapa de desnaturação de 95 ° C por 0,25 min, uma etapa de recozimento de 56 ° C por 0,5 min e uma etapa de extensão de 72 ° C por 2,5 min. Uma linha de reações de cada placa de 96 poços foi verificada aleatoriamente através da eletroforese em agarose para garantir a amplificação adequada do DNA.

Uma pequena quantidade (7 μl) do DNA amplificado por PCR foi então transferido para uma placa de PCR de 384 poços correspondente ao local do clone original usado para semear a reação. A concentração de sal das reações de PCR foi levada a uma concentração de 3 × SSC (1 × SSC contém 150 mmol l –1 NaCl, 15 mmol l –1 citrato de sódio, pH 7,0) pela adição de 20 × SSC diretamente aos produtos de PCR. Microarrays foram impressos em lâminas de vidro revestidas com polil-lisina de acordo com protocolos padrão (www.microarray.org protocolos específicos também estão disponíveis em killifish.pdx.edu/protocols.htm). Lâminas de microscópio revestidas com polil-lisina foram produzidas usando lâminas de microscópio Gold Seal da Fisher Scientific (Hampton, NH, EUA) e solução de polil-lisina da marca Sigma Chemical (ver sites acima). As lâminas foram então armazenadas em um dessecador por 3 semanas para permitir que o revestimento de polil-lisina envelhecesse adequadamente. Microarrays foram impressos usando um robô caseiro tendo uma configuração de 16 pinos (pinos TeleChem Chip Maker II, Telechem ArrayIt, Sunnyvale, CA, EUA) e imprimindo um padrão de grade de pontos 18 × 18 com um espaçamento de 240 μm entre os pontos para cada pino. Esta configuração de pinos e concentração de sal nas amostras de DNA resultou em um tamanho de ponto típico em torno de 140-150 μm. Os microarrays foram pós-processados ​​de acordo com os procedimentos padrão (veja os sites acima).

Perfilando mudanças na expressão gênica usando o cDNA microarray

As sondas de cDNA marcadas com fluorescência foram preparadas a partir de amostras de RNA enriquecidas com poli (A) +. As amostras de RNA poli (A) + foram preparadas a partir de amostras de RNA total usando uma coluna de oligo-dT celulose. Todas as amostras de RNA poli (A) + são um pool de quantidades iguais de RNA de 4 indivíduos coletados em cada momento. 1 μg do poli (A) + RNA foi usado como modelo para fazer uma única cópia de cDNA do pool de mRNA usando transcriptase reversa (RT) e oligo-dT ancorado15e pdN6 iniciadores hexâmeros aleatórios na presença de amino-alil dUTP (veja os sites acima). O modelo de RNA foi removido das reações RT concluídas por incubação a 65 ° C por 30 min em 0,2 mol l –1 NaOH e 0,1 mol l –1 EDTA. O cDNA de fita simples foi então covalentemente ligado através da o amino-alil UTP para um corante monorreativo Cy3 ou Cy5 de acordo com as instruções do fabricante (Amersham, Piscataway, NJ, EUA). As sondas de cDNA marcadas foram então limpas usando colunas de purificação de PCR de acordo com as instruções do fabricante (Qiagen, Valencia, CA, EUA), exceto que o tampão PE foi substituído por etanol a 80%. As sondas foram preparadas para hibridização de acordo com procedimentos padrão (ver os sites acima). Resumidamente, as sondas limpas foram levadas a um volume final de 30 μl em uma solução contendo 25 mmol l –1 tampão Hepes pH 7,0, 0,75 mg ml –1 tRNA (Sigma), 3 × SSC e 0,2% SDS. As sondas foram fervidas por 2 min e deixadas resfriar à temperatura ambiente por 5 min antes de iniciar as hibridizações. As sondas foram adicionadas ao microarray colocando a lamínula LifterSlip (15 mm × 15 mm) sobre o array e usando a ação capilar para desenhar a solução sob a lamínula. As hibridizações foram realizadas a 65 ° C durante a noite em câmaras de hibridização Genomic Solutions (Ann Arbor, MI, EUA). Cada hibridização foi realizada uma vez para cada comparação. Um número total de 55 hibridizações é representado no conjunto de dados. Dois ciclos diários, separados por 2 semanas, foram amostrados para as condições de controle (26 ° C). Cinco ciclos de temperatura foram amostrados para o ciclo de aclimatação da temperatura, resultando em um padrão muito consistente de expressão gênica durante múltiplos ciclos de temperatura.

Após a hibridização, as matrizes foram breve e suavemente lavadas para remover qualquer corante não ligado e, em seguida, rapidamente secas por centrifugação (www.microarray.org). Resumidamente, as lâminas foram colocadas em uma solução de 0,6 × SSC e 0,03% de dodecilsulfato de sódio (SDS) e a lamela foi cuidadosamente lavada da lâmina. As lâminas foram então transferidas para um suporte de lâminas e suavemente mergulhadas 10 vezes em um novo recipiente de 500 ml da mesma solução de lavagem. As lâminas foram então transferidas individualmente e suavemente mergulhadas 10 vezes em um segundo 500 ml de solução de lavagem contendo 0,06 × SSC. Após esta lavagem, as lâminas foram mergulhadas 5 vezes em 500 ml de água desionizada e depois centrifugadas a baixa velocidade. As lâminas lavadas foram digitalizadas usando um scanner de microarray Axon GenePix 4000B (Axon Instruments, Union City, CA, EUA). Os dados foram extraídos das imagens digitalizadas usando o software GenePix 4.0 (Axon Instruments). Os dados foram então inseridos no Stanford Microarray Database (SMD). A filtragem e classificação de dados foram realizadas no banco de dados SMD. Após a entrada no banco de dados, todos os dados foram normalizados para equilibrar os níveis gerais de Cy5 e Cy3 para uma proporção de 1: 1 usando um fator de correção simples aplicado aos dados de Cy5. Para cada ponto em cada matriz, os dados foram selecionados para análise apenas se eles tivessem um coeficiente de regressão de fluorescência Cy5 / Cy3 de & gt0,6 e tivessem uma intensidade de sinal de 2,5 vezes o fundo. Esses pontos são chamados de `fair'data. Este método de normalização e definição de dados 'razoáveis' eram as configurações padrão no SMD.

Análise e apresentação de dados

Os níveis de expressão gênica foram determinados em cada ponto de tempo, comparando a quantidade de transcrição de mRNA presente na amostra experimental (agrupada de quatro peixes em cada momento) em comparação com uma amostra de referência (agrupada de mais de 400 peixes usados ​​no experimento). O uso de uma amostra de referência permitiu a comparação da quantidade relativa de cada transcrição em cada momento com uma amostra comum. As amostras de referência foram rotineiramente rotuladas com Cy3, enquanto as amostras experimentais foram rotuladas com Cy5. No entanto, experimentos de reversão de corante foram realizados para os primeiros dois ciclos de temperatura diários (12 amostras) para investigar possível viés Cy Dye em nossos dados e para avaliar a variação nos dados (Fig. 2). Esses experimentos de reversão de corante indicam uma correlação muito alta entre hibridizações duplicadas (r= 0,96), para clones de cDNA que experimentam alterações na expressão do gene maior do que o dobro em comparação com as amostras de referência (Fig. 2).

Replicar hibridizações e experimentos de marcação de corante recíproco. (A) Hibridizações duplicadas foram realizadas para cada ponto de tempo nos primeiros dois ciclos de temperatura. Os dados de expressão foram filtrados aceitando apenas pontos que mudaram duas vezes em pelo menos 1 ponto de tempo. Esses dados não são corrigidos em relação a t= 0, mas eles estão centrados na mediana. Cy3 foi usado para rotular a amostra de referência, enquanto Cy5 foi usado para rotular a amostra experimental nas hibridizações diretas (F). Os corantes foram invertidos (R) no segundo conjunto de hibridizações. A inspeção visual revela uma forte relação entre os dois conjuntos de hibridizações, especialmente para pontos que mudam mais do que duas vezes em comparação com a referência. (B) Há uma forte correlação entre os dados para as hibridizações direta e reversa (r= 0,96) para pontos na matriz que mudam mais do que duas vezes (N= 831). A equação para a linha de regressão no gráfico é y=1.061x+0,04056. Esses dados indicam que não há viés significativo de corante neste conjunto de dados. Além disso, ele apóia a conclusão de que as mudanças na expressão gênica observadas neste estudo não são provavelmente devido à variação nas hibridizações, mas, em vez disso, são biologicamente relevantes.

Replicar hibridizações e experimentos de marcação de corante recíproco. (A) Hibridizações duplicadas foram realizadas para cada ponto de tempo nos primeiros dois ciclos de temperatura. Os dados de expressão foram filtrados aceitando apenas pontos que mudaram duas vezes em pelo menos 1 ponto de tempo. Esses dados não são corrigidos em relação a t= 0, mas eles estão centrados na mediana. Cy3 foi usado para rotular a amostra de referência, enquanto Cy5 foi usado para rotular a amostra experimental nas hibridizações diretas (F). Os corantes foram invertidos (R) no segundo conjunto de hibridizações. A inspeção visual revela uma forte relação entre os dois conjuntos de hibridizações, especialmente para pontos que mudam mais do que duas vezes em comparação com a referência. (B) Há uma forte correlação entre os dados para as hibridizações direta e reversa (r= 0,96) para pontos na matriz que mudam mais do que duas vezes (N= 831). A equação para a linha de regressão no gráfico é y=1.061x+0,04056. Esses dados indicam que não há viés significativo de corante neste conjunto de dados. Além disso, ele apóia a conclusão de que as mudanças na expressão gênica observadas neste estudo não são provavelmente devido à variação nas hibridizações, mas, em vez disso, são biologicamente relevantes.

Embora o uso de uma amostra de referência forneça uma base comum de comparação para cada amostra experimental, os dados expressos neste formato não são necessariamente biologicamente relevantes porque cada comparação é de uma amostra experimental em comparação com o nível médio de cada transcrição que foi expressa durante todo o experimentar. A interpretação desses dados é difícil e, portanto, optamos por ajustar ainda mais os dados para um padrão biologicamente relevante. Existem vários caminhos para ajustar os dados para esse propósito, cada um com seus próprios pontos fortes e fracos.

Uma técnica comumente usada é ajustar os dados de expressão do gene para que o nível médio de expressão seja igual a 0 em um log2 escala para cada ponto na matriz em todos os tratamentos (ou seja,uma proporção de 1: 1) este método é denominado 'centralização mediana' (Eisen et al., 1998). Este método é lógico para comparações de diferentes tipos de células ou células em diferentes condições de estado estacionário, mas em nossa opinião não era adequado para a apresentação de dados de curso de tempo devido à suposição subjacente de que o nível de expressão mediana de um determinado gene deveria ser 0 em um registo2 escala. Por exemplo, se um gene é fortemente induzido em todos os pontos de tempo amostrados, essa forte indução seria representada como o nível mediano de expressão do gene e provavelmente faria com que o verdadeiro padrão de expressão fosse amplamente atenuado após a centralização mediana. Observamos esse tipo de padrão para muitos chaperones moleculares neste estudo.

Outra possibilidade, e talvez a mais lógica para dados de curso do tempo, é ajustar todas as taxas de expressão para serem relativas a t= 0. Este método assume que o ponto de tempo inicial representa alguma condição fisiológica de estado estacionário no organismo que deve ser ajustada em resposta ao tratamento experimental. No entanto, os dados de expressão gênica apresentados desta maneira são dependentes de dados de alta qualidade para o t= 0 ponto no tempo. Além disso, se faltarem dados para o t= 0 ponto no tempo, então é impossível ajustar os outros pontos no tempo. Esses problemas podem ser amplamente evitados replicando o t= 0 hibridizações e usando a média dessas réplicas para ajustar o resto do conjunto de dados. Em nosso caso, usamos a média de duas hibridizações do controle (26 ° C, t= 0 e t= 336 h) para ajustar o conjunto de dados em relação à condição inicial. Um problema adicional com esse método é que os efeitos da temperatura não são separados dos efeitos dos ritmos diários normais nos dados de expressão gênica para ciclos de temperatura. Em muitos casos, os ritmos naturais na expressão gênica sob exposição a constantes 26 ° C eram fortes e mascaravam os efeitos da temperatura na expressão gênica.

Para controlar as mudanças diárias na expressão gênica que não estavam associadas ao ciclo de temperatura, normalizamos os dados do ciclo de temperatura para serem relativos aos padrões diários de controle da expressão gênica (uma média de dois ciclos diários a 26 ° C). Esta operação com efeito 'subtrai' os ritmos diários na expressão do gene não devido à temperatura dos dados do ciclo de temperatura. Esta operação foi feita multiplicando a razão Cy5: Cy3 para cada ponto de tempo experimental no tratamento de temperatura de ciclo pela razão Cy5: Cy3 para o ponto de tempo de controle correspondente (por exemplo, ciclagem t= 4 h multiplicado pelo controle t= 4 h). Chamamos essa permutação dos dados de 'efeito da temperatura'. Os dados apresentados desta maneira ilustram o efeito líquido da temperatura sobre os padrões naturais de expressão gênica. No entanto, esses dados podem ser enganosos se não forem apresentados de forma adequada. Por exemplo, se houver um forte ritmo circadiano na expressão do gene que não é afetado pela temperatura, isso resultará em um padrão de expressão diário uniforme quando apresentado dessa maneira, mesmo que o gene possa mudar várias vezes a cada dia. Portanto, optamos por apresentar os dados em dois formatos neste artigo, relativos a t= 0 e após a subtração dos ritmos diários, porque cada método de apresentação de dados tem pontos fortes e ilustra diferentes componentes do conjunto de dados.

A análise de correlação cruzada (Chatfield, 1989) foi usada para determinar se os padrões de expressão gênica estavam significativamente correlacionados com o ciclo de temperatura. Usando este método, é possível identificar a mudança de fase nos dados que produz o maior coeficiente de correlação e, portanto, a relação mais significativa entre os padrões de expressão gênica e os padrões de temperatura. Os coeficientes de correlação foram identificados como estatisticamente significativos ao nível de 0,05.

Os dados da razão de expressão gênica foram agrupados de acordo com a similaridade no padrão de expressão usando o software Cluster (Eisen et al., 1998). O agrupamento hierárquico de ligação completa não centrado de Pearson foi usado para organizar os dados. A visualização dos dados agrupados foi realizada usando o software TreeView (Eisen et al., 1998).

Sequenciamento de DNA

Os pontos de microarray com padrões de expressão interessantes foram identificados por sequenciação da inserção de cDNA isolada do DNA de plasmídeo do clone de interesse. O sequenciamento foi realizado usando um sequenciador ABI 373 com mistura de reação de terminador de corante. Iniciadores específicos de plasmídeo foram usados ​​para as reações de sequenciação. Todos os cDNAs de interesse foram sequenciados da extremidade 5 'para maximizar a possibilidade de identificação do transcrito. As sequências foram identificadas por homologia a sequências conhecidas usando uma pesquisa NCBI Blastx do banco de dados GenBank. Os resultados mais significativos ou relevantes dessas pesquisas de Blast, bem como os números de acesso do GenBank para clones de cDNA sequenciados apresentados neste documento, estão disponíveis na Tabela 1 suplementar.


Introdução

O ataque de parasitóides é uma das principais causas de mortalidade em muitas espécies de insetos (Godfray e Shimada 1999 Asgari e Rivers 2011), exercendo uma forte seleção de características que afetam a probabilidade ou o resultado de um ataque. Os mecanismos de defesa contra endoparasitóides que completam seu desenvolvimento dentro do hospedeiro frequentemente envolvem o sistema imunológico do hospedeiro, que evolui rapidamente em resposta à mudança de virulência dos endoparasitóides e mostra grande variação entre as espécies (Carton et al. 2008). Por exemplo, Drosófila espécies apresentam grande variação na imunocompetência contra o parasitóide Asobara tabida, onde a maioria das espécies no Drosophila obscura grupo mostra deficiência imunológica e nenhum encapsulamento de ovo, enquanto outros taxa mostram respostas imunológicas muito fortes (Eslin e Doury 2006 Havard et al. 2009 Singh et al. 2009 Salazar-Jaramillo et al. 2014). Padrões semelhantes foram recentemente documentados no gênero besouro-das-folhas Galerucella, onde três espécies intimamente relacionadas que compartilham um inimigo de vespa parasitóide comum diferem em relação à taxa de parasitismo, sucesso de encapsulamento e produção de hemócitos (Fors et al. 2014, 2016).

A base celular subjacente à variação na imunocompetência contra endoparasitóides em insetos não modelos, como Galerucella é muito semelhante a Drosófila (Fors et al. 2014). Em geral, a resposta imune após um ataque do parasitóide começa com o reconhecimento do ovo do parasitóide. Os sinais imunológicos subsequentemente induzem um rápido aumento e diferenciação dos hemócitos que se fixam na superfície do ovo, levando à formação de uma cápsula ao redor do ovo com múltiplas camadas de hemócitos (Carton et al. 2008). No Drosófila, este processo de encapsulamento envolve três tipos principais de hemócitos: plasmatócitos, lamelócitos e células cristalinas. Os plasmócitos são os principais responsáveis ​​pela fagocitose e constituem a maioria dos hemócitos circulantes (& gt95%). Este último também consiste em uma pequena proporção de células cristalinas (& lt5%), que contêm enzimas cristalinas que são necessárias para a melanização humoral (Schmid et al. 2019). Finalmente, os lamelócitos são produzidos especificamente após o ataque de parasitóides e participam da formação da cápsula (Lavine e Strand 2002 Meister e Lagueux 2003). O encapsulamento geralmente termina com a melanização, que é a liberação e ativação da fenoloxidase, levando ao escurecimento no local da ferida ou ao redor do ovo encapsulado (Honti et al. 2014). Os ovos de parasitóides dentro da cápsula morrem normalmente por asfixia em 48 horas, sob o efeito conjunto de encapsulamento e melanização (Wertheim et al. 2005).

No Galerucella, seis tipos de hemócitos foram descobertos com base em suas morfologias e três (lamelócitos, fagócitos e granulócitos) foram especificamente envolvidos no processo de encapsulamento (Fors et al. 2014). Lamelócitos, que têm a mesma função que em Drosophila melanogaster, são essenciais para que a formação da cápsula seja concluída. Os fagócitos, embora não sejam o fator principal, também contribuem para o processo de encapsulamento em Galerucella (Carton et al. 2008 Fors et al. 2014). Finalmente, os granulócitos em Galerucella compartilham seu modo de secreção com células cristalinas em Drosófila (Fors et al. 2014), que estão envolvidos na melanização da ferida e da cápsula.

Embora os hemócitos subjacentes às respostas imunes a insetos sejam amplamente caracterizados, sua regulação é apenas parcialmente compreendida e caracterizada principalmente em Drosófila. Os genes envolvidos nas respostas imunes podem ser classificados em sete categorias funcionais, conforme proposto por Salazar-Jaramillo et al. (2014). A primeira classe de genes envolve genes de reconhecimento, por exemplo, proteínas de reconhecimento de peptidoglicanos (PGRPs) e proteínas de ligação a bactérias Gram-negativas que estão envolvidas no reconhecimento de objetos estranhos, como ovos de parasitóides. A segunda classe de genes envolve genes de sinalização para vias de transdução (Toll, JAK-STAT, JNK e IMD) que iniciam a proliferação de hemócitos necessários para encapsular o objeto estranho. A terceira classe envolve genes efetores que codificam para peptídeos antimicrobianos que têm como alvo as membranas bacterianas ou fúngicas, causando danos à membrana e morte da célula (Bulet et al. 1999). A quarta classe de genes envolve a modulação de genes que codificam para serpinas e serina proteases com função imune principalmente desconhecida (por exemplo, Spn88Eb) A quinta classe compreende genes de hematopoiese que estão especificamente envolvidos na imunidade relacionada a parasitóides (diferenciação de hemócitos, proliferação e regulação do processo de hematopoiese, por exemplo, gcm, wg, e Yantar) A sexta categoria inclui genes que codificam para profenoloxidases e seus reguladores (por exemplo, PPO3, amarelo), que produzem intermediários citotóxicos e de reticulação e, em última análise, a melanina necessária para completar a cápsula em torno do ovo do parasitóide. A classe final de genes é principalmente aquela que codifica quitinases responsáveis ​​pela cicatrização de feridas após a oviposição do parasitóide. A elucidação desses genes e vias facilitou significativamente a nossa compreensão da dinâmica evolutiva que atua sobre os genes envolvidos na imunidade antiparasitóide, mas sua ocorrência e relevância fora Drosófila espécies têm recebido pouca atenção.

Uma abordagem poderosa para compreender as diferenças nas respostas imunológicas é comparar os padrões de expressão gênica entre espécies intimamente relacionadas que diferem em sua imunocompetência. Aqui, examinamos as diferenças na expressão do gene após o ataque do parasitóide em besouros intimamente relacionados Galerucella pusilla e G. calmariensis (Coleoptera: Chrysomelidae). Eles compartilham a mesma planta hospedeira, Lythrum salicaria (Lythraceae) e são atacados pelo mesmo parasitóide larval koinobiont, Asecodes parviclava (Hymenoptera: Eulophidae) (Fors et al. 2014). Essas espécies foram selecionadas para estudo por apresentarem grandes diferenças em sua capacidade de encapsular ovos de parasitóides, apesar de só recentemente terem divergido de um ancestral comum (Hambäck et al. 2013 Fors et al. 2014). A taxa de parasitismo nas duas espécies hospedeiras varia entre as localidades, mas, em geral, G. pusilla experimenta uma taxa de parasitismo menor do que G. calmariensis se eles co-ocorrem (Fors et al. 2014). Ambos os eventos de encapsulamento e melanização são muito comuns em G. pusilla larvas infectadas por vespas, enquanto em G. calmariensis, a formação de cápsulas e a melanização de ovos de vespa raramente são observadas. Se o encapsulamento ocorre com sucesso após o parasitismo, a formação da cápsula geralmente começa dentro de 4-6 he é concluída após ∼48 h (Fors et al. 2014). Durante o processo de encapsulamento, a cápsula é frequentemente melanizada e os ovos melanizados do parasitóide podem ser claramente observados após a digestão após 48 h. A cicatrização geralmente ocorre rapidamente nos locais da ferida nas primeiras horas após o parasitismo, onde a melanização também desempenha um papel no escurecimento da ferida. Em geral, G. pusilla exerce uma resposta imunológica mais potente contra A. parviclava que G. calmariensis, com investigações em nível celular documentando que duas classes de hemócitos envolvidos no encapsulamento, fagócitos e lamelócitos, aumentaram sua produção após a infecção em G. pusilla (Fors et al. 2014). A fim de ir além do estudo de nível de fenótipo celular, examinamos aqui as diferenças na expressão gênica entre essas duas espécies, usando um projeto de amostragem de curso de tempo após o ataque do parasitóide. Além das análises em nível de transcriptoma completo, também nos concentramos em genes imunes anotados com base no conhecimento prévio de D. melanogaster e outras espécies de artrópodes (Wertheim et al. 2005 Tribolium Genome Sequencing Consortium 2008). Com base no trabalho anterior, esperávamos que mais genes imunológicos, especialmente genes de hematopoiese, fossem expressos diferencialmente após o ataque de parasitóides nas espécies com forte resposta imunológica, G. pusilla.


3.8.3 Usando projetos de genoma (apenas nível A)

Oportunidades para o desenvolvimento de habilidades

Projetos de sequenciamento leram os genomas de uma ampla gama de organismos, incluindo humanos.

A determinação do genoma de organismos mais simples permite que sejam determinadas as sequências das proteínas que derivam do código genético (o proteoma) do organismo. Isso pode ter muitas aplicações, incluindo a identificação de antígenos potenciais para uso na produção de vacinas.

Em organismos mais complexos, a presença de DNA não codificador e de genes reguladores significa que o conhecimento do genoma não pode ser facilmente traduzido para o proteoma.

Os métodos de sequenciamento são continuamente atualizados e automatizados.


DISCUSSÃO

Foi sugerido que o AICD tem um importante papel biológico no desenvolvimento da patologia da DA por meio de sua capacidade de atuar como um produto de clivagem com potencial de transativação (Cao e Sudhof, 2001). Até agora, poucos genes candidatos dependentes de AICD haviam sido descritos, e faltava uma abordagem de rastreamento em todo o genoma. Neste estudo, estabelecemos um modelo de cultura de células de neuroblastoma induzível com AICD, FE65 ou AICD e FE65 sob o controle de um promotor responsivo à tetraciclina. A análise de alterações transcricionais após a expressão de AICD e / ou seu cofator FE65 usando Affymetrix U133A GeneChips revelou uma lista de 182 genes alvo de AICD putativos (ver Tabela Suplementar).

A PCR quantitativa em tempo real de genes selecionados demonstrou que alguns genes eram dependentes apenas da indução de AICD, outros mostraram expressão elevada quando FE65 foi co-expresso, enquanto um terceiro subconjunto só foi regulado diferencialmente após a expressão de AICD e FE65.

A sinalização independente de Fe65 pode ser explicada pela ligação direta de AICD a TIP60 (Kinoshita et al., 2002). No entanto, a maioria dos genes alvo descritos neste trabalho demonstrou uma necessidade de coexpressão de FE65, sugerindo um papel importante para esta proteína de ligação na expressão de genes dependentes de AICD, uma observação que também foi relatada por outros estudos (Cao e Sudhof, 2001 von Rotz et al., 2004). Na verdade, há evidências de que a ligação de FE65 a AICD é necessária para a translocação nuclear (Kimberly et al., 2001 Muresan e Muresan, 2004 von Rotz et al., 2004). Dois complexos diferentes de AICD transcricionalmente ativos com base na ligação de AICD-FE65 a TIP60 e a CP2 / LSF / LBP1 foram sugeridos (Cao e Sudhof, 2001 Kim et al., 2003). TIP60 é parte de um grande complexo nuclear com ligação ao DNA, atividade de ATPase e DNA helicase (Ikura et al., 2000). Em experimentos do gene repórter Gal4, o complexo ternário AICD-FE65-TIP60 é um transativador potente, dependente do nível de expressão de FE65 (Cao e Sudhof, 2001). Um mecanismo alternativo baseado em modificações estruturais de FE65 por AICD foi sugerido que não requer a translocação de AICD do citoplasma para o núcleo (Cao e Sudhof, 2004). Essa hipótese não está em contraste com nossos achados, pois níveis elevados de AICD citosólicos podem ser suficientes para causar uma alteração na conformação de FE65. Este segundo complexo ternário (AICD-FE65-CP2 / LSF / LBP1) foi sugerido para modular a expressão de glicogênio sintase quinase-3β (Kim et al., 2003). Portanto, diferentes complexos transcricionais de AICD podem explicar diferentes padrões de regulação.

A indução de longo tempo de genes expressos ectopicamente pode resultar em efeitos de regulação secundária, uma vez que os próprios genes induzidos primários podem atuar como ativadores para outros genes. Portanto, usamos a indução de 72 h (lavagem dox) para nossos estudos, correspondendo ao ponto de tempo mais antigo de indução mensurável de AICD e / ou FE65. Nessas condições, não observamos regulação diferencial de genes alvo de AICD descritos anteriormente, como KAI1 (Tabela 2). Não foi possível detectar a regulação de outros genes alvo putativos, incluindo SERCA2B (Leissring et al., 2002) ou GSK3β (Kim et al., 2003). No entanto, nossos dados estão de acordo com outros grupos que não puderam detectar a regulação dependente de AICD desses genes em camundongos transgênicos AICD / FE65 (Ryan e Pimplikar, 2005) ou em linhagens celulares com inibição farmacológica ou deficiência da atividade da γ-secretase (Hebert et al., 2006). Além disso, é provável que a expressão diferencial de genes de alvos de AICD ocorra de uma maneira específica para o tipo de célula e seja dependente dos níveis de expressão de cofatores endógenos. Nosso trabalho é o primeiro estudo analisando a expressão gênica dependente de AICD em células estáveis ​​de neuroblastoma SHEP-SF transfectadas. É importante ressaltar que os neurônios corticais primários transitoriamente transfectados com AICD50 / FE65 também demonstraram expressão aumentada de TAGLN, TPM1 apoiando a hipótese de um papel para AICD na regulação dos níveis de expressão desses genes. Além disso, dada a evidência emergente de um papel para a sinalização de AICD na fisiopatologia da DA, fomos capazes de verificar a expressão diferencial de vários dos genes alvo de AICD descritos neste trabalho no córtex frontal da doença de Alzheimer versus cérebros de controle. α2-Actina, IGFBP3 e TAGLN foram significativamente mais expressos em cérebros com DA em comparação com seu controle de mesma idade. Curiosamente, o IGFBP3 foi descrito anteriormente como associado a emaranhados neurofibrilares em cérebros com DA (Rensink et al., 2002). Além disso, outros grupos também relataram expressão diferencial de PRKC (Par-4) (El Guendy e Rangnekar, 2003) e TPM1 (Galloway et al., 1990) em amostras de cérebro com DA em comparação com cérebros de pacientes não afetados. Além disso, as placas neuríticas positivas para neuregulina (Chaudhury et al., 2003) e fibronectina 1 (Van Gool et al., 1994) foram demonstrados por imuno-histoquímica.Dado que vários de nossos genes alvo de AICD demonstraram anteriormente níveis de expressão diferencial durante a progressão da DA, é interessante postular que o aumento da expressão de AICD e de seus alvos pode desempenhar um papel importante na DA. Em contraste, não pudemos confirmar a regulação diferencial para KAI1 e outros genes-alvo discutidos em cérebros com DA versus controles.

Entre os genes regulados dependentes de AICD, identificamos vários candidatos que foram descritos anteriormente como reguladores da dinâmica da actina, incluindo α2-Actina, Transgelina e Tropomiosina 1. A transgelina, uma proteína de reticulação de actina, está envolvida na organização do citoesqueleto de actina e é pensado para ligar o envelhecimento à estabilidade da actina (Goodman et al., 2003 Nakano et al., 2005). Outros genes como Fibronectin1 e RAB3B também foram descritos como associados à organização do citoesqueleto. A visualização das estruturas da F-actina em células de neuroblastoma, bem como em neurônios corticais após a expressão de AICD e FE65, revelou desorganização das fibras de actina dentro do corpo celular e aglomeração de fibras de actina na periferia, sugerindo aumento da dinâmica da actina. Dado que esse fenótipo estava ausente em células que expressam FE65 sem AICD, nossos resultados sugerem que essa sinalização ocorre independentemente da família de proteínas Ena / Vasp, que interagem com os domínios WW das proteínas FE65 (Ermekova et al., 1997). Em contraste, nossos dados sugerem que a transativação dependente de AICD é responsável pela reorganização dos filamentos de actina e, portanto, pode desempenhar um papel importante durante o desenvolvimento e na reorganização das estruturas celulares em resposta à lesão. Além disso, a própria APP é regulada para cima transcricionalmente em resposta a transecções nervosas, trauma e isquemia cerebral no sistema nervoso (Banati et al., 1993 Shi et al., 2000 Ciallella et al., 2002), todos os processos que resultam na reorganização do citoesqueleto. No Drosófila, A expressão de APP está associada a aumentos na arborização axonal pós-desenvolvimento e perda de conexões neuronais, que estava estritamente ligada ao domínio intracelular de APP (Leyssen et al., 2005). Além disso, camundongos transgênicos Tg2576 desde 4 meses de idade são positivos para inclusões semelhantes a bastonetes no córtex posterior que são compostas de actina (Maloney et al., 2005). Um modelo em que APP e FE65 estão envolvidos na regulação complexa da motilidade do cone de crescimento à base de actina também é apoiado por outros dados (Sabo et al., 2003). Curiosamente, o bloqueio do transporte axonal, que pode ser resultado de citoesqueleto desorganizado, é o primeiro distúrbio medido no cérebro de camundongos transgênicos que expressam APP humana mutante (Stokin et al., 2005). Além disso, estudos recentes demonstram que fibroblastos meníngeos de camundongos FE65 - / - mais F65L1 - / - revelam um padrão perturbado de F-actina em comparação com camundongos do tipo selvagem (Guenette et al., 2006). Juntos, nosso estudo sugere um papel importante do AICD na regulação da dinâmica da actina celular.


16.6 Regulamento de Gene Pós-translacional e Translacional Eucariótico

Ao final desta seção, você será capaz de fazer o seguinte:

  • Compreenda o processo de tradução e discuta seus principais fatores
  • Descreva como o complexo de iniciação controla a tradução
  • Explique as diferentes maneiras em que ocorre o controle pós-tradução da expressão gênica

Depois que o RNA é transportado para o citoplasma, ele é traduzido em proteína. O controle desse processo é amplamente dependente da molécula de RNA. Conforme discutido anteriormente, a estabilidade do RNA terá um grande impacto em sua tradução em uma proteína. Conforme a estabilidade muda, a quantidade de tempo disponível para tradução também muda.

O Complexo de Iniciação e Taxa de Tradução

Como a transcrição, a tradução é controlada por proteínas que se ligam e iniciam o processo. Na tradução, o complexo que se monta para iniciar o processo é denominado complexo de iniciação da tradução. Em eucariotos, a tradução é iniciada pela ligação do met-tRNAi de iniciação ao ribossomo 40S. Este tRNA é trazido para o ribossomo 40S por um fator de iniciação de proteína, fator de iniciação eucariótico-2 (eIF-2). A proteína eIF-2 liga-se à molécula de alta energia trifosfato de guanosina (GTP). O complexo tRNA-eIF2-GTP então se liga ao ribossomo 40S. Um segundo complexo se forma no mRNA. Vários fatores de iniciação diferentes reconhecem o cap 5 'do mRNA e as proteínas ligadas à cauda poli-A do mesmo mRNA, formando o mRNA em uma alça. A proteína cap-binding eIF4F traz o complexo de mRNA junto com o complexo de ribossomo 40S. O ribossomo então faz a varredura ao longo do mRNA até encontrar um códon inicial AUG. Quando o anticódon do tRNA iniciador e o códon de início estão alinhados, o GTP é hidrolisado, os fatores de iniciação são liberados e a grande subunidade ribossômica 60S se liga para formar o complexo de tradução. A ligação de eIF-2 ao RNA é controlada por fosforilação. Se o eIF-2 for fosforilado, ele sofre uma mudança conformacional e não pode se ligar ao GTP. Portanto, o complexo de iniciação não pode se formar adequadamente e a tradução é impedida (Figura 16.13). Quando o eIF-2 permanece não fosforilado, o complexo de iniciação pode se formar normalmente e a tradução pode prosseguir.

Conexão Visual

Um aumento nos níveis de fosforilação de eIF-2 foi observado em pacientes com doenças neurodegenerativas, como Alzheimer, Parkinson e Huntington. Que impacto você acha que isso pode ter na síntese de proteínas?

Modificações químicas, atividade proteica e longevidade

As proteínas podem ser quimicamente modificadas com a adição de grupos, incluindo grupos metil, fosfato, acetil e ubiquitina. A adição ou remoção desses grupos das proteínas regula sua atividade ou o tempo de existência na célula. Às vezes, essas modificações podem regular onde uma proteína é encontrada na célula - por exemplo, no núcleo, no citoplasma ou ligada à membrana plasmática.

As modificações químicas ocorrem em resposta a estímulos externos, como estresse, falta de nutrientes, calor ou exposição à luz ultravioleta. Essas mudanças podem alterar a acessibilidade epigenética, a transcrição, a estabilidade do mRNA ou a tradução - todas resultando em mudanças na expressão de vários genes. Esta é uma maneira eficiente de a célula alterar rapidamente os níveis de proteínas específicas em resposta ao ambiente. Como as proteínas estão envolvidas em todos os estágios da regulação do gene, a fosforilação de uma proteína (dependendo da proteína que é modificada) pode alterar a acessibilidade ao cromossomo, pode alterar a tradução (alterando a ligação ou função do fator de transcrição), pode alterar o transporte nuclear ( influenciando modificações no complexo de poro nuclear), pode alterar a estabilidade do RNA (ligando-se ou não ao RNA para regular sua estabilidade), pode modificar a tradução (aumentar ou diminuir) ou pode alterar as modificações pós-tradução (adicionar ou remover fosfatos ou outras modificações químicas).

A adição de um grupo ubiquitina a uma proteína marca a degradação dessa proteína. Ubiquitina atua como uma bandeira indicando que a vida útil da proteína está completa. Essas proteínas são movidas para o proteassoma, uma organela que funciona para remover proteínas, para serem degradadas (Figura 16.14). Uma forma de controlar a expressão do gene, portanto, é alterar a longevidade da proteína.


3. Resultados

3.1. A. phagocytophilum modula a expressão gênica em células infectadas de I. scapularis e células ISE6 de carrapato

A infecção com A. marginale demonstrou modular a expressão do gene do carrapato [9]. No entanto, o efeito de A. phagocytophilum a infecção na expressão do gene do carrapato é desconhecida. Aqui, duas abordagens experimentais foram utilizadas para caracterizar perfis de expressão gênica em células de carrapatos infectadas com A. phagocytophilum. Na primeira abordagem, a expressão do gene do carrapato foi caracterizada por análise de microarray de RNA de células ISE6 de carrapato infectadas e não infectadas. Na segunda abordagem, os genes identificados como diferencialmente expressos em células IDE8 do carrapato e carrapatos infectados com A. marginale foram usados ​​para caracterizar o efeito de A. phagocytophilum na expressão do gene do carrapato em pessoas infectadas I. scapularis ninfas e células ISE6 do carrapato por RT-PCR em tempo real.

A análise de microarray mostrou em A. phagocytophilumcélulas do carrapato ISE6 infectadas com a regulação positiva dos genes C4B10 com homologia com o fator de von Willebrand e R1E12 com homologia com a proteína ribossomal L32, C4A10, C3C3, C4A1 e C3D9 com função desconhecida e a regulação negativa dos genes C3B2 com homologia com uma protease aspártica e R2A12 , C3A7, R2G1, R2D6, C3C11 e R3D4 com função desconhecida (Tabela 2). A expressão de outros genes com homologia à troponina I (C2E6), proteína salivar secretada putativa (C4G3) e proteína contendo o domínio ML (R4G5) não se alterou após a infecção de células ISE6 do carrapato com A. phagocytophilum ( Mesa 2 ).

Mesa 2

Análise de microarray do perfil de expressão gênica em UMA. marginale- e UMA. fagocitofilocélulas ISE6 do carrapato infectadas e não infectadas.

ID da sonda (a) Descrição (b) A. marginale infecção versus controle A. phagocytophilum infecção versus controle
Mudança de dobra (c) SD (d) Mudança de dobra (c) SD (d)
C4A10Nenhum homólogo encontrado6.2490.0002.2080.294
R1A6Nenhum homólogo encontrado2.5390.1621.0490.346
C3C5[Genbank: <"type": "entrez-nucleotide", "attrs": <"text": "L22271", "term_id": "347817", "term_text": "L22271" >> L22271] espaçador interno transcrito 1 (Ixodes Dammini)2.4061.2111.3830.000
C4A8Nenhum homólogo encontrado2.2390.1651.1880.442
R3A7Nenhum homólogo encontrado2.2090.805& # x022121.3840.562
C4G3[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAY66629", "term_id": "67083387", "term_text": "AAY66629" >> AAY66629] proteína salivar secretada putativa (Ixodes scapularis)2.1670.3261.0370.614
C2E6[Genbank: <"type": "entrez-protein", "attrs": <"text": "ABB89211", "term_id": "82698821", "term_text": "ABB89211" >> ABB89211] proteína troponina I (Rhipicephalus haemaphysaloides)2.0400.400& # x022121.0680.442
C3C3Nenhum homólogo encontrado1.9160.5593.4221.037
C4A1Nenhum homólogo encontrado1.8570.0002.1210.517
R2A12Nenhum homólogo encontrado1.1990.232& # x022122.2190.450
C3A7Nenhum homólogo encontrado1.1350.282& # x022123.0280.141
C3D9[Genbank: <"type": "entrez-protein", "attrs": <"text": "XP_791420", "term_id": "72037502", "term_text": "XP_791420" >> XP_791420] proteína hipotética (Strongylocentrotus purpuratus)1.0760.3354.8752.069
C3B2[Genbank: <"type": "entrez-protein", "attrs": <"text": "BAE53722", "term_id": "83319201", "term_text": "BAE53722" >> BAE53722] protease aspártica (Haemaphysalis longicornis)& # x022121.3110.330& # x022126.9860.379
R2G1Nenhum homólogo encontrado& # x022121.4970.495& # x022122.0860.826
R2D6Nenhum homólogo encontrado& # x022121.5380.309& # x022122.4400.563
C3C11Nenhum homólogo encontrado& # x022122.0530.401& # x022122.4770.488
C4D12Nenhum homólogo encontrado& # x022122.0660.547& # x022121.0220.533
R4G5[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAP84098", "term_id": "32481528", "term_text": "AAP84098" >> AAP84098] contendo o domínio ML proteína (Ixodes ricinus)& # x022122.0660.1611.0200.266
C4C9[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAH56007", "term_id": "33417096", "term_text": "AAH56007" >> AAH56007] Proteína H13-prov (Xenopus laevis)& # x022122.0700.2701.0810.689
C4G11[Genbank: <"type": "entrez-protein", "attrs": <"text": "EAA09467", "term_id": "157017076", "term_text": "EAA09467" >> EAA09467] ENSANGP00000010016 (Anopheles gambiae)& # x022122.0930.550& # x022121.1930.598
C4G9Nenhum homólogo encontrado& # x022122.0950.402& # x022121.5980.888
R3F5[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAY66764", "term_id": "67083657", "term_text": "AAY66764" >> AAY66764] proteína salivar secretada putativa (Ixodes scapularis)& # x022122.1180.310& # x022121.0370.320
R3G4Nenhum homólogo encontrado& # x022122.2920.2591.0900.415
R1F3Nenhum homólogo encontrado& # x022122.3390.570& # x022121.3440.855
R1E12[Genbank: <"type": "entrez-protein", "attrs": <"text": "NP_001119682", "term_id": "187115162", "term_text": "NP_001119682" >> NP_001119682] proteína ribossômica L32 (Acyrthosiphon pisum) & # x022122.3790.0002.4880.000
C3F10[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAM93633", "term_id": "22164256", "term_text": "AAM93633" >> AAM93633] proteína secretada putativa (Ixodes scapularis)& # x022122.3860.545& # x022121.6470.315
R3D4Nenhum homólogo encontrado& # x022122.5291.046& # x022122.3770.518
C4D2Nenhum homólogo encontrado& # x022122.7020.8601.0430.972
R3F4Nenhum homólogo encontrado& # x022122.9280.2981.1740.396
C1H10Nenhum homólogo encontrado& # x022123.3410.307& # x022121.0570.000
C4A4Nenhum homólogo encontrado& # x022123.6781.181& # x022121.4300.331
C4E12[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAY66942", "term_id": "67084015", "term_text": "AAY66942" >> AAY66942] proteína ribossômica S17 (Ixodes scapularis)& # x022123.9640.8221.4300.993
C4B10[Genbank: <"type": "entrez-protein", "attrs": <"text": "AAQ01562", "term_id": "33285889", "term_text": "AAQ01562" >> AAQ01562] fator de von Willebrand (Ixodes ricinus)& # x022124.4220.0002.4130.000

(a) A ID da sonda (placa da biblioteca e poço) identifica a amostra (clone) nas placas de estoque.

(b) Descrição da sonda com base no (melhor) alinhamento BLASTX superior.

(c) Mudança de dobramento é a mudança de dobramento da razão log2 normalizada dependente da intensidade de Lowess de médias corrigidas de fundo válidas em média entre réplicas válidas. Apenas as entradas que exibem uma alteração de expressão maior do que 2 vezes e P & # x0003c .05 em qualquer A. phagocytophilum ou A. marginale células infectadas são mostradas. Os valores positivos e negativos correspondem aos genes regulados positivamente e regulados negativamente nas células infectadas, respectivamente.

(d) SD é o desvio padrão determinado a partir da razão log2 média normalizada, mas determinado apenas nos dados de pontos válidos.

Os níveis de mRNA de genes selecionados diferencialmente expressos em A. phagocytophilumas células ISE6 do carrapato infectadas foram avaliadas por RT-PCR em tempo real em células infectadas e não infectadas (Figura 1). Semelhante aos resultados de hibridização de microarray, a análise dos níveis de mRNA por RT-PCR em tempo real mostrou aumento significativo de C4B10 (fator de von Willebrand) e R1E12 (proteína ribossômica L32) e regulação negativa de C3B2 (protease aspártica) em células do carrapato ISE6 infectadas com A. phagocytophilum ( Figura 1 ). Os níveis de mRNA de genes identificados anteriormente como diferencialmente expressos em células IDE8 de carrapatos e carrapatos infectados com A. marginale [9] também foram avaliados por RT-PCR em tempo real em células ISE6 de carrapatos infectadas e não infectadas. Os níveis de mRNA de genes diferencialmente expressos em A. marginaleas células ISE6 infectadas foram semelhantes às relatadas anteriormente em células IDE8 infectadas [9] e os dados não foram mostrados. Os resultados em A. phagocytophilumas células ISE6 infectadas mostraram que a infecção do patógeno aumentou significativamente a expressão de U2A8 (delta do receptor de sequência de sinal), 1I5B9 (proteína contendo ixodegrina-2A RGD) e 1I4G12 (função desconhecida) e regulou negativamente a expressão de 2I3A7 (NADH-ubiquinoe oxidoredutase) e 1I1H6 (glutationa S-transferase (GST)) em células ISE6 do carrapato (Figura 1).

Expressão diferencial de genes em A. phagocytophilum-infetado I. scapularis carrapatos e células ISE6 cultivadas. RT-PCR em tempo real foi feito em não infectados e infectados I. scapularis ninfas (três grupos de cada um de carrapatos não infectados, carrapatos infectados (barras pretas da cepa Gaillard) e carrapatos infectados (barras brancas da cepa Dawson) com 10 ninfas cada) e células ISE6 não infectadas e infectadas com isolado NY18 (três culturas independentes cada barra vermelha). As barras representam a razão entre os valores de Ct normalizados infectados / valores de Ct normalizados médios não infectados (+ DP). Os níveis de mRNA foram normalizados contra carrapato & # x003b2-actina (ACT) e comparada entre carrapatos e células de carrapatos infectados e não infectados por Student's t-teste (*P & # x02264 .05).

A expressão dos genes selecionados também foi analisada em I. scapularis ninfas infectadas com dois diferentes A. phagocytophilum cepas (Figura 1). No I. scapularis ninfas, a expressão de C4G3 (proteína salivar secretada putativa), C4B10 (fator de von Willebrand), R1E12 (proteína ribossômica L32) e R4G5 (proteína contendo o domínio ML) foi significativamente regulada positivamente, e a expressão de U2A8 (receptor delta de sequência de sinal ), UP8 (ferritina), 2I3A7 (NADH-ubiquinoe oxidoredutase), 2I3A3 (proteína semelhante à gama actina), 2IP10 (ubiquitina C variante 5 semelhante), 1I5B9 (ixodegrina-2A RGD contendo proteína), 1I1H6 (GST), C26E (troponina I), C3B2 (protease aspártica) e 1I4G12 e 1I3H6 com função desconhecida foram significativamente regulados para baixo. Curiosamente, os níveis de mRNA foram semelhantes em I. scapularis ninfas infectadas com duas cepas diferentes de A. phagocytophilum mas diferiam daqueles obtidos em células ISE6 infectadas para alguns genes, como U2A8, 1I5B9, 1I4G12, C2E6, C4G3 e R4G5 (Figura 1).

3.2. Expressão Gênica Diferencial em Ninfas e Células ISE6 Infectadas com A. phagocytophilum I. scapularis Diferente da Observada após a Infecção por A. marginale

Os resultados relatados aqui mostraram que os perfis de expressão gênica eram diferentes para A. phagocytophilum- e A. marginalecélulas infectadas com carrapatos (Figuras 2 e & # x200B e 3). 3). A análise de microarray em células ISE6 de carrapatos infectados e não infectados mostrou que a expressão de genes com homologia ao espaçador transcrito interno 1 (sonda C3C5), proteína salivar secretada putativa (C4G3), troponina I (C2E6), protease aspártica (C3B2), domínio ML contendo proteína (R4G5), proteína H13-prov (C4C9), proteína ribossomal L32 (R1E12), proteína secretada putativa (C3F10), proteína ribossômica S17 (C4E12), fator de von Willebrand (C4B10) e sequências com função desconhecida (R1A6 , C4A8, R3A7, R2A12, C3A7, C3D9, R2D6, C3C11, R3G4, R1F3, C4D2, R3F4, C1H10, C4A4) era diferente entre A. phagocytophilum- e A. marginalecélulas infectadas (Figura 2). A expressão de outros genes mudou de forma semelhante após a infecção das células do carrapato ISE6 com A. marginale ou A. phagocytophilum (C4A10, C3C3, C4A1, R2G1, C4D12, C4G11, C4G9, R3F5, R3D4 Figura 2).

Efeito de A. phagocytophilum e A. marginale infecção na expressão gênica das células ISE6 do carrapato. O RNA total foi extraído de três A. marginale-infetado, três A. phagocytophiluminfectados e três culturas de células ISE6 não infectadas. A mudança de dobra da expressão foi determinada por hibridização de microarray em 6 dias pós-infecção (dpi) (aproximadamente 70% das células infectadas, as culturas companheiras eram terminais em 8 dpi). As células não infectadas foram amostradas no mesmo ponto de tempo que as células infectadas para contabilizar os efeitos do tempo de cultura. As proporções foram calculadas como Anaplasma-células infectadas versus células de controle não infectadas.Os valores de razão normalizados obtidos para cada sonda foram calculados em média em 3 réplicas biológicas e quatro réplicas técnicas e apenas as entradas exibindo um significativo (P & # x02264 .05) alteração da dobra da expressão & # x0003e2 em qualquer A. phagocytophilum- ou A. marginale-células infectadas são mostradas. ID do clone (placa da biblioteca e poço) são mostrados. O gráfico foi construído com o software HCE (http://www.cs.umd.edu/hcil/hce/hce3.html).

Efeito de A. phagocytophilum e A. marginale infecção na expressão gênica das células ISE6 do carrapato. Os níveis de mRNA foram comparados entre A. phagocytophilum- (barras brancas) e A. marginale- (barras pretas) infectaram células ISE6 de carrapato por RT-PCR em tempo real. As barras representam a razão entre os valores de Ct normalizados infectados e os valores de Ct normalizados médios não infectados (+ DP). Os níveis de mRNA foram normalizados contra o rRNA 16S do carrapato e comparados entre A. phagocytophilum- e A. marginale-células de carrapatos infectadas por Student's t-teste (*P & # x02264 .05). Os valores positivos e negativos denotam a regulação positiva e a regulação negativa, respectivamente, em relação aos controles não infectados.

Por RT-PCR em tempo real, os níveis de mRNA de U2A8 (delta do receptor da sequência de sinal), 2I3G1 (subunidade do proteassoma 26S, não ATPase), 2I3A3 (proteína semelhante à gama actina), 2I1F6 (células tronco hematopoiéticas / células progenitoras semelhantes à proteína ), 1I5B9 (proteína contendo ixodegrin-2A RGD), 1I4G12 (função desconhecida), 1I3H6 (função desconhecida), 1I3F5 (ubiquitina) e 1I1H6 (GST) foram significativamente diferentes entre A. phagocytophilum- e A. marginalecélulas infectadas com ISE6 coletadas em 3 dpi com aproximadamente 40% de células infectadas (Figura 3). Exceto para U2A8, 1I5B9, 1I4G12, C2E6, C4G3 e R4G5 que tinham diferentes níveis de mRNA em A. phagocytophiluminfectadas com ninfas e células ISE6 do carrapato (Figura 1), os níveis de mRNA dos genes estudados também foram diferentes entre A. phagocytophilum-infetado I. scapularis ninfas e A. marginale-células infectadas com carrapatos (dados não mostrados).

Porque a cinética de genes expressos diferencialmente pode variar com Anaplasma níveis de infecção, a expressão dos genes selecionados foi comparada por RT-PCR em tempo real em A. phagocytophilum- e A. marginalecélulas infectadas com ISE6 coletadas em 2, 5 e 8 dpi (Figura 4 (a)). Os resultados mostraram variação dependente do tempo nas razões de mRNA dos genes estudados entre A. phagocytophilum- e A. marginalecélulas infectadas (Figura 4 (b)). No entanto, diferenças significativas foram observadas entre A. phagocytophilum e A. marginale infecção em todos os pontos temporais, sugerindo assim que as diferenças nos perfis de expressão gênica eliciados por esses patógenos estão presentes ao longo do ciclo de infecção nas células ISE6 do carrapato.

Comparação entre a expressão diferencial de genes em A. phagocytophilum- e A. marginalecélulas ISE6 do carrapato infectadas em diferentes pontos de tempo após a infecção. Estudos foram feitos em A. phagocytophilum- (A.p.-) e A. marginale- (Am-) células ISE6 de carrapato infectadas (duas culturas independentes cada) em 2, 5 e 8 dias pós-infecção (dpi) com aproximadamente 30% & # x0201340%, 60% & # x0201370% e & # x0003e90% de células infectadas , respectivamente. (a) A A.p. e A.m. os níveis de infecção foram avaliados por PCR em tempo real de msp4 e normalizado contra o rDNA 16S do carrapato. Quantidades conhecidas do comprimento total A.p. e A.m. msp4 O produto de PCR foi usado para construir uma curva padrão para quantificação de patógenos por célula. Os dados representam a média & # x000b1 SD. (b) Os níveis de mRNA dos genes selecionados foram avaliados por RT-PCR em tempo real e normalizados contra o rRNA 16S do carrapato. As barras representam a razão entre os valores médios de Ct em células infectadas com A.p. / valores de Ct médios em células infectadas com A.m. Os níveis de mRNA foram comparados entre células de carrapatos infectadas por A.p.- e A.m. por Student's t-teste (*P & # x02264 .05). Níveis de mRNA idênticos em A. phagocytophilum e A. marginale células infectadas são iguais a um.


RESULTADOS

Amostragem de diversidade:

Seis de nossos 7 acessos estão incluídos em um conjunto de 96 acessos de Arabidopsis dos quais 875 loci foram sequenciados (N ordborg et al. 2005) (walnut.usc.edu/2010/), permitindo-nos estimar a quantidade de polimorfismo de DNA em toda a espécie contido em nossa amostra de acessos. Identificamos os polimorfismos presentes em 875 loci distribuídos pelo genoma e pontuamos a frequência de cada polimorfismo entre os 96 acessos e se esse polimorfismo era variável em nossos 6 acessos. Nossos 6 acessos continham ∼80% dos polimorfismos de média a alta frequência em toda a espécie (frequência de alelo menor & gt10%) (Figura 1). Na classe de rara a baixa frequência, nossos acessos continham apenas 20-30% da diversidade de espécies (Figura 1). Portanto, nossos acessos foram representativos da maior parte da variação da sequência de média a alta frequência em Arabidopsis.

Amostragem da variação das espécies. A porcentagem de polimorfismos em 96 acessos de Arabidopsis que são polimórficos nos seis acessos em comum com este conjunto de dados (Col-0, Cvi-1, Kin-0, Mt-0, Tsu-1 e Van-0) são mostrados ( N ordborg et al. 2005). Os alelos são categorizados com base na porcentagem de alelos menores no conjunto de dados de 96 acessos (mostrado no x-eixo). A linha suave representa a distribuição de amostragem aleatória esperada para 6 acessos para cada classe de porcentagem de alelo.

ANOVA de dados de microarray para genes expressos diferencialmente:

O split-plot ANOVA revelou que quatro efeitos foram significativos para todos os 21 pares de acessos: array, gene, interação de gene com acesso e gene com ponto no tempo (dados não mostrados e Tabela 1). Uma vez que os níveis de expressão variam entre os diferentes genes, um efeito significativo do gene era esperado. O efeito significativo da interação gene × adesão indica que a expressão gênica se comportou de maneira diferente nos vários acessos. Uma vez que essas diferenças podem ser devido a potenciais ELPs ou polimorfismos de sequência, a análise estatística não pode distinguir entre essas duas alternativas. Um efeito significativo de interação gene × ponto no tempo indica que genes diferentes exibem padrões de expressão distintos ao longo do tempo. O efeito de matriz significativo mostra que há variação de chip para chip, mas o modelo de gráfico dividido foi responsável por essa fonte de variação. Ao longo dos 21 pares de acessos, não houve efeitos significativos para o tratamento de SA, interação de acesso × tratamento e acesso × tratamento × gene (interação de três vias), sugerindo que o tratamento de SA não afetou fortemente os níveis de expressão globais em todos 22.810 genes, o que é esperado dado que apenas um subconjunto de genes é induzido por SA. No entanto, a regulação da expressão ao longo do tempo foi definitivamente afetada pelo tratamento com SA, conforme evidenciado por efeitos significativos para pontos de tempo e todas as interações relacionadas ao tempo.

ANOVA de diferenças de expressão em pares

A ANOVA pareada identificou em média 2234 genes mostrando sinal de expressão diferencial (ELPs potenciais) entre quaisquer dois acessos entre os tratamentos, usando correção de teste múltiplo de taxa de descoberta falsa (FDR) (B enjamini e H ochberg 1995), e 331 genes ao usar múltiplos de Holm correção de teste (H olm 1979) (Figura 2). O acesso Cvi-1 teve mais ELPs potenciais em todas as suas comparações de pares do que qualquer um dos outros acessos (Figura 2). Para avaliar a variabilidade de ELPs potenciais, adicionamos o número de comparações de pares para as quais qualquer gene mostrou um sinal de expressão diferencial. A distribuição resultante foi de cauda pesada e enviesada para ELPs de frequência baixa a moderada e foi semelhante para listas de genes obtidas usando o procedimento de FDR ou Holm (Figura 3). Curiosamente, várias centenas de genes mostraram sinais de expressão diferencial em mais da metade dos testes de pares, sugerindo que esses genes têm vários alelos que podem conferir níveis de expressão distintos.

Expressão diferencial de genes por pares de acessos. O número de genes que mostram expressão diferencial por par de acesso é mostrado. A esquerda y-eixo e barras mostram o número de genes que mostram expressão polimórfica, conforme determinado por um H significativo01 (expresso diferencialmente entre dois acessos), com significância determinada pelo teste de Holm (ver materiais e métodos para detalhes). O certo y-eixo e losangos mostram o número de genes com polimorfismos de expressão que satisfazem H01 com o nível de significância determinado pelo teste de FDR. O par de acessão está listado no x-eixo: C, Col-0 I, Cvi-1 E, Est K, Kin-0 M, Mt-0 T, Tsu-1 e V, Van-0. Avg é a média em todas as comparações de pares.

Freqüência de diferenças na expressão do gene de acesso aos pares. O eixo horizontal indica o número de pares de acessos (n = 21 pares) para os quais os genes são detectados como expressos diferencialmente. Barras sólidas denotam o número de genes identificados com o procedimento de Holm; barras abertas denotam o número de genes identificados com o procedimento FDR.

Incluímos um tratamento de SA porque estamos interessados ​​na variação natural nas respostas à aplicação de SA. O uso de dois tratamentos (SA e controle) proporcionou uma oportunidade para examinar as consequências da variação do tratamento experimental no conjunto de genes que apresentam expressão diferencial. SA é a principal molécula de sinalização envolvida nas respostas de defesa da planta (G affney et al. 1993 D elaney et al. 1995). Utilizamos um tratamento com SA de 0,30 m m, pois níveis mais elevados de SA causaram fitotoxicidade em alguns acessos (dados não mostrados). A análise estatística identificou uma média de 660 genes com FDR e 25 genes com procedimento de Holm apresentando resposta SA diferencial entre pelo menos um par de acessos. Esses números representam ∼10–20% dos genes que mostram uma diferença na expressão entre os acessos que não exibiram uma interação de tratamento. Isso sugere que há uma variação considerável nas respostas a esta molécula de sinalização chave, mas como isso se relaciona com a variação na resistência a doenças é atualmente desconhecido.

Genes de controle:

Para testar a capacidade de nossa ANOVA de detectar genes que haviam sido relatados anteriormente como variáveis ​​entre acessos, estudamos um conjunto de genes que eram conhecidos por apresentar variação natural na sequência de DNA, acúmulo de mRNA e fenótipo. Esta comparação incluiu genes envolvidos na produção de glucosinolatos relacionados à defesa de plantas (ESP, AOP2, AOP3, GS-OH, Mam1, e MamL) (K Liebenstein et al. 2001 L ambrix et al. K roymann 2001 et al. 2003), época de floração (FLC, SEX, FLM, e HUA2) (J ohanson et al. C aicedo 2000 et al. 2004 D oyle et al. 2005 L empe et al. 2005 Werner et al. 2005), respostas de luz de hipocótilo (PHYA e CRY2) (E l -A ssal et al. M aloof de 2001 et al. 2001), e elicitação de resistência (RPM1, RPS2, RPS4, RPS5, e RPP5) (Conceder et al. 1995 P arker et al. 1997 G Assmann et al. 1999 H enk et al. 1999 M auricio et al. 2003). Esses genes foram classificados com base na natureza dos polimorfismos moleculares (Tabela 2). Qualquer polimorfismo (INDEL, polimorfismo de local de splice ou diferença observada de mRNA) que pudesse causar uma mudança na expressão do gene observada foi listado como um ELP potencial. Nossa análise estatística identificou 12 dos 13 genes previamente conhecidos ou previstos como sendo diferencialmente expressos (Tabela 2). Um gene (FLM) que não identificamos como polimórfico tem um INDEL em um acesso que não foi incluído em nosso estudo (Werner et al. 2005). Genes com polimorfismos sem sentido ou sem sentido serviram como controles e, como esperado, não foram detectados como diferencialmente expressos. Esses resultados sugerem que nosso experimento tem uma baixa taxa de falsos negativos para detecção de ELPs.

Identificação de genes conhecidos com variação esperada na expressão entre acessos

Para verificar se a análise acima foi enviesada pelo uso de genes conhecidos por causar polimorfismos fenotípicos, usamos os 12 genes que apresentam expressão diferencial nos sete acessos para análise de QRT-PCR para expressão diferencial de genes. A correlação média para os valores de expressão desses 12 genes entre os valores de QRT – PCR e ATH1 GeneChip foi de 0,69, indicando que a análise de microarray detecta com precisão genes com ELPs.

SFPs e expressão diferencial:

Para testar se a presença de SFPs altera significativamente as estimativas de expressão gênica, calculamos os níveis de expressão aparentes para 400 genes que continham SFPs entre Col-0 e Cvi-1 com e sem sinal das sondas contendo SFP e empregamos um split-split -plot ANOVA. Dos 400 genes contendo SFP, o SFP foi responsável por ± 0,13% da variância do sinal entre esses genes. Além disso, a inclusão das sondas com SFPs na estimativa do valor de expressão de um gene levou a apenas uma diminuição de 7% na estimativa. Portanto, SFPs não são uma fonte significativa de variação nas estimativas de expressão gênica e as diferenças entre os acessos foram predominantemente devido a ELPs reais.

Viés da função gênica:

Trabalhos anteriores haviam sugerido um viés na classificação funcional de genes que apresentam expressão diferencial entre acessos de Arabidopsis (C hen et al. 2005). Quando as anotações biológicas GO foram usadas para classificar os genes, os genes diferencialmente expressos foram significativamente enriquecidos para genes classificados como controle de respostas bióticas e abióticas, respostas de estresse e transdução de sinal (Figura 4). Essas diferenças nas frequências de classificação foram significativas por testes χ 2 em todas as comparações de pares por categoria, bem como para a média das comparações de pares após o ajuste para comparações múltiplas com correção de Bonferroni (dados não mostrados). Além disso, houve uma diminuição significativa nos genes classificados como envolvidos no transporte (Figura 4). Este resultado foi semelhante aos relatados anteriormente por C hen et al. (2005). Uma comparação semelhante usando as anotações moleculares GO identificou uma diferença significativa da expectativa do genoma inteiro (em mais da metade das comparações de pares) apenas para genes classificados como ligação ou atividade de receptor. Nenhuma classe nas anotações celulares GO foi significativa nas comparações de pares (dados não mostrados).

Comparação de anotação biológica GO para genes expressos diferencialmente. Barras sólidas mostram a porcentagem de anotações totais em cada classificação de anotação biológica GO usando o genoma de Arabidopsis completamente sequenciado de Col-0. Barras sombreadas (com erros padrão) mostram a porcentagem média do total de anotações para cada uma das classificações biológicas GO acima usando todas as 21 comparações entre pares de acessos. Os asteriscos indicam aquelas classificações que são significativamente diferentes da análise do genoma completo, conforme determinado por testes de χ 2, com correção de Bonferroni. As classificações biológicas GO que descrevem proteínas desconhecidas não foram incluídas (ou seja., outros processos fisiológicos, outros processos metabólicos, outros processos celulares e processos biológicos desconhecidos), uma vez que não eram informativos.

Relação de diferenças de expressão em pares para divergência de sequência:

Se não houver nenhum mecanismo de filtragem principal, como pressões de seleção diferencial sobre a sequência e polimorfismos de expressão ou transCom efeito, para influenciar o impacto da variação da sequência de DNA na variação da expressão gênica, espera-se uma relação ampla do genoma entre a variação da sequência de DNA e a variação de ELP. Para avaliar esta relação, determinamos o π pareado, divergência de nucleotídeo pareada média (T ajima 1983 N ei 1987) entre os seis acessos para os quais havia dados de sequência e, em seguida, comparamos π com o número de genes que detectamos como diferencialmente expressos entre os mesmo par de acessos (conforme determinado por FDR). Houve uma relação positiva significativa entre esses valores (Figura 5). Esta análise de regressão linear considerou se o par incluía Col-0, a partir do qual as sondas de oligômero no GeneChip ATH1 foram projetadas (N = 15, P & lt 0,0001, r = 0,83 Col-0 presença no par de acessão, d.f. = 1, P = 0,0483) (Figura 5). As estimativas de divergência de expressão gênica fornecidas pela correção de múltiplos testes de Holm geraram uma relação quase idêntica entre a sequência e a divergência de expressão gênica (N = 15, P & lt 0,0001, r = 0,86 presença de Col-0 no par de acessão, d.f. = 1, P = 0,0097). Esta associação também foi significativa ao comparar π contra o número de genes que mostram uma diferença de expressão dependente de uma interação de adesão × tratamento (N = 15, P & lt 0,0001, r = 0,95 presença de Col-0 no par de acessão, d.f. = 1, P = 0,001). Não é provável que esses genes tenham sido afetados por diferenças de hibridização, como aquelas causadas por polimorfismos INDEL, uma vez que esses genes exibiram expressão gênica não variável em um tratamento em dois acessos, mas mostraram expressão gênica diferencial no outro tratamento. Esta relação entre π e os genes significativos para as interações de tratamento x acesso apóia ainda mais a hipótese de que os SFPs não influenciaram significativamente as estimativas de variação da expressão gênica e que de fato medimos ELPs entre os acessos.

Divergência de sequência e diferenças de expressão gênica estão associadas. A relação entre π e o número de ELPs entre pares de seis acessos (Col-0, Cvi-1, Kin-0, Mt-0, Tsu-1 e Van-0), conforme determinado por regressão linear e lista de genes FDR (n = 15, P & lt 0,001, r 2 = 0,83), é mostrado. As comparações de pares contendo Col-0 são mostradas como círculos abertos e círculos sólidos denotam pares que não incluem Col-0. Uma relação linear semelhante foi identificada com a lista de genes de Holm (n = 15, P & lt 0,001, r = 0.80).

Distribuição genômica de diferenças de expressão e divergência de sequência:

A relação entre π e a variação da expressão gênica (seção anterior) é uma comparação média de todo o genoma. Para avaliar se havia uma relação entre a variação local da sequência de DNA e a variação da expressão gênica, realizamos uma análise de janela deslizante ao longo dos cromossomos de Arabidopsis (Figura 6). Uma relação distinta na variação da sequência local e na variação da expressão gênica foi detectada, pois os dois traços eram muito semelhantes entre os cromossomos (Figura 6). Picos locais de divergência de sequência de DNA entre os acessos tipicamente colocados com enriquecimentos locais no número de genes que apresentam expressão gênica polimórfica. Em particular, há uma região próxima ao meio do cromossomo III que apresenta uma elevação significativa no polimorfismo da expressão gênica e também é enriquecida na variação da sequência de DNA (Figura 6). Duas regiões com falta de correlação local entre a diversidade de sequência e a expressão do gene polimórfico podem ser explicadas por razões técnicas ou biológicas.A região plana para expressão diferencial de genes no topo do cromossomo IV é uma área de baixa densidade gênica devido à presença da região de organização nucleolar. A região ∼10-Mbp no cromossomo V que teve baixas estimativas de π também tem uma escassez de loci sequenciados e pode representar um viés de amostragem local.

Associação cromossômica local entre nucleotídeo e variação diferencial da expressão gênica. Comparação de janela deslizante da variação de nucleotídeos (π) vs. é mostrada a expressão diferencial do gene nos 6 acessos (Col-0, Cvi-1, Kin-0, Mt-0, Tsu-1 e Van-0) em comum com os 96 acessos do banco de dados de sequência (N ordborg et al. 2005). A linha preta é o número médio de ELPs por locus medido em uma janela deslizante de 500 genes. o x-eixo de cada gráfico está em pares de megabases conforme marcado. As linhas horizontais representam o P = 0,05 limiares para a janela deslizante diferencialmente expressa conforme obtido por meio da análise de permutação (0,056 é o P = Mínimo de 0,05 e 0,132 é o P = Máximo de 0,05). A linha cinza representa uma análise de janela deslizante de 5 Mbp de π médio por loci.


Comparando os níveis de expressão gênica entre o controle e a doença em diferentes momentos - Biologia

Para entender como a expressão gênica é regulada, devemos primeiro entender como um gene codifica uma proteína funcional em uma célula. O processo ocorre em células procarióticas e eucarióticas, apenas de maneiras ligeiramente diferentes.

Os organismos procarióticos são organismos unicelulares que carecem de um núcleo celular e, portanto, seu DNA flutua livremente no citoplasma da célula. Para sintetizar uma proteína, os processos de transcrição e tradução ocorrem quase simultaneamente. Quando a proteína resultante não é mais necessária, a transcrição é interrompida. Como resultado, o principal método para controlar que tipo de proteína e quanto de cada proteína é expressa em uma célula procariótica é a regulação da transcrição do DNA. Todas as etapas subsequentes ocorrem automaticamente. Quando mais proteína é necessária, ocorre mais transcrição. Portanto, em células procarióticas, o controle da expressão gênica ocorre principalmente no nível transcricional.

As células eucarióticas, em contraste, têm organelas intracelulares que aumentam sua complexidade. Em células eucarióticas, o DNA está contido dentro do núcleo da célula e lá é transcrito em RNA. O RNA recém-sintetizado é então transportado para fora do núcleo para o citoplasma, onde os ribossomos traduzem o RNA em proteína. Os processos de transcrição e tradução são fisicamente separados pela membrana nuclear, a transcrição ocorre apenas dentro do núcleo, e a tradução ocorre apenas fora do núcleo no citoplasma. A regulação da expressão gênica pode ocorrer em todas as etapas do processo (Figura 1). A regulação pode ocorrer quando o DNA é desenrolado e solto dos nucleossomos para ligar os fatores de transcrição (epigenético nível), quando o RNA é transcrito (nível de transcrição), quando o RNA é processado e exportado para o citoplasma após ser transcrito (pós-transcricional nível), quando o RNA é traduzido em proteína (nível de tradução), ou após a proteína ter sido feita (pós-tradução nível).

Figura 1. A transcrição e tradução procariótica ocorrem simultaneamente no citoplasma, e a regulação ocorre no nível transcricional. A expressão do gene eucariótico é regulada durante a transcrição e o processamento do RNA, que ocorrem no núcleo, e durante a tradução da proteína, que ocorre no citoplasma. A regulação posterior pode ocorrer por meio de modificações pós-tradução de proteínas.

As diferenças na regulação da expressão gênica entre procariotos e eucariotos estão resumidas na Tabela 1. A regulação da expressão gênica é discutida em detalhes nos módulos subsequentes.

Tabela 1. Diferenças na regulação da expressão gênica de organismos procarióticos e eucarióticos
Organismos procarióticos Organismos eucarióticos
Falta núcleo Contém núcleo
DNA é encontrado no citoplasma O DNA está confinado ao compartimento nuclear
A transcrição de RNA e a formação de proteínas ocorrem quase simultaneamente A transcrição do RNA ocorre antes da formação da proteína e ocorre no núcleo. A tradução do RNA em proteína ocorre no citoplasma.
A expressão do gene é regulada principalmente no nível transcricional A expressão gênica é regulada em vários níveis (epigenético, transcricional, transporte nuclear, pós-transcricional, translacional e pós-tradução)

Evolução da regulação do gene

As células procarióticas só podem regular a expressão do gene controlando a quantidade de transcrição. À medida que as células eucarióticas evoluíram, a complexidade do controle da expressão gênica aumentou. Por exemplo, com a evolução das células eucarióticas, veio a compartimentação de importantes componentes celulares e processos celulares. Uma região nuclear que contém o DNA foi formada. A transcrição e a tradução foram fisicamente separadas em dois compartimentos celulares diferentes. Portanto, tornou-se possível controlar a expressão gênica regulando a transcrição no núcleo e também controlando os níveis de RNA e a tradução de proteínas presentes fora do núcleo.

Alguns processos celulares surgiram da necessidade do organismo se defender. Processos celulares, como silenciamento de genes, desenvolvidos para proteger a célula de infecções virais ou parasitárias. Se a célula pudesse desligar rapidamente a expressão gênica por um curto período de tempo, ela seria capaz de sobreviver a uma infecção quando outros organismos não poderiam. Portanto, o organismo desenvolveu um novo processo que o ajudou a sobreviver e foi capaz de transmitir esse novo desenvolvimento aos descendentes.



Comentários:

  1. Mazukus

    Esta é a convenção

  2. Stevie

    Do not puzzle over it!

  3. Burt

    Quero dizer que você não está certo.Escreva para mim em PM, discutiremos.

  4. Mezizahn

    Parabenizo, a notável resposta...

  5. Ovadiah

    Você permite o erro. Eu posso defender minha posição. Escreva para mim em PM, conversaremos.



Escreve uma mensagem