Em formação

2.10: Regulação da Expressão Gênica - Biologia

2.10: Regulação da Expressão Gênica - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Introdução à regulação gênica

Regulação tem tudo a ver com a tomada de decisões. Na seção seguinte, discutiremos alguns dos mecanismos e princípios fundamentais usados ​​pelas células para regular a expressão gênica em resposta a mudanças em fatores celulares ou externos. Esta biologia é importante para entender como as células ajustam ambientes em mudança, incluindo como algumas células, em organismos multicelulares, decidem se tornar especializadas para certas funções (por exemplo, tecidos).

Uma vez que o assunto da regulação é um tópico de estudo muito profundo e amplo em biologia, em Bis2a não tentamos cobrir todos os detalhes - eles simplesmente são demais. Em vez disso, como fizemos para todos os outros tópicos, tentamos nos concentrar em (a) delinear algumas das principais construções lógicas e perguntas que você deve ter ao abordar QUALQUER cenário envolvendo regulamentação, (b) aprender algum vocabulário comum e mecanismos onipresentes e (c) examinar alguns exemplos concretos que ilustram os pontos apresentados em a e b.

Expressão genetica

Introdução

Todas as células controlam quando e quanto cada um de seus genes é expresso. Esta declaração simples - que poderia ser derivada simplesmente da observação do comportamento celular - traz muitas questões que podemos começar a formular usando o Desafio de Design.

Tentando definir "expressão gênica"

A primeira coisa que precisamos fazer, entretanto, é definir o que significa quando dizemos que um gene é "expresso". A "expressão" final de um gene é seu efeito no fenótipo. Se o gene codifica uma proteína, pode-se razoavelmente propor que a "expressão" de um gene significa quanta proteína funcional é produzida, e que medir a quantidade dessa proteína pode ser uma boa medida da "expressão do gene". Muitos biólogos moleculares referem-se ao nível de transcrição desse gene como um proxy facilmente medido ou sua expressão. Por essa definição, pode-se desejar contar quantas transcrições completas estão presentes em cada célula. Na prática, muitas vezes descobrimos que a definição depende do contexto da discussão. Tenha isso em mente. No Bis2A, tentaremos usar o termo "expressão" principalmente para descrever a criação do (s) produto (s) funcional (is) final (is).

O desafio do projeto de regular a expressão gênica

Para conduzir essa discussão de uma perspectiva de desafio de design, podemos estipular formalmente que o "grande problema" em que estamos interessados ​​é o de regular a abundância de proteínas em uma célula. Problema: a abundância de cada proteína funcional deve ser regulada. Podemos então começar apresentando subproblemas:

Vamos parar um momento, no entanto, primeiro para recarregar algumas ideias. O processo de expressão do gene requer várias etapas, dependendo de qual será o destino do produto final. No caso de RNAs estruturais e reguladores (isto é, tRNA, rRNA, etc.), o processo requer que um gene seja transcrito e que qualquer processamento pós-transcricional necessário ocorra. No caso de um gene codificador de proteína, o transcrito também deve ser traduzido em proteína e, se necessário, modificações na proteína também devem ser feitas. Obviamente, tanto a transcrição quanto a tradução são processos de várias etapas e a maioria dessas subetapas também são locais de controle em potencial.

Alguns dos subproblemas podem ser:

  1. Deve haver algum mecanismo (s) para regular a primeira etapa deste processo de várias etapas, o início da transcrição (apenas começando as coisas). Portanto, poderíamos afirmar, "precisamos de um mecanismo para regular o início da transcrição." Também poderíamos transformar isso em uma pergunta e perguntar, "como pode ser realizada a iniciação da transcrição"?
  2. Podemos usar um pensamento semelhante para afirmar "precisamos de um mecanismo para regular o fim da transcrição" ou para perguntar "como a transcrição termina?" (aqui estamos falando sobre parar a transcrição de um gene - desligar um gene, não terminar - determinar o último nucleotídeo de - uma molécula transcrita específica)
  3. Usando esta convenção, podemos afirmar, "precisamos regular o início da tradução e a interrupção da tradução". (novamente, ativando ou desativando a tradução de um tipo específico de transcrição)
  4. Falamos apenas sobre a síntese de proteínas e RNA. É bastante razoável afirmar também: "Precisamos de mecanismos para regular a degradação do RNA e da proteína".

Focando na transcrição

Neste curso, começamos focando principalmente no exame do primeiro par de problemas / questões, a regulação da iniciação e terminação da transcrição - da informação genômica para um RNA funcional, pronto como está (por exemplo, no caso de um RNA funcional) ou pronto para tradução. Isso nos permite examinar alguns conceitos fundamentais sobre a regulação da expressão gênica e examinar alguns exemplos reais desses conceitos em ação.

Discussão sugerida

Por que é importante regular a expressão do gene - por que não expressar todos os genes o tempo todo? Por que tê-los se você não quer expressá-los?

Crie uma lista de hipóteses com seus colegas de classe sobre as razões pelas quais a regulação da expressão gênica é importante para bactérias e arquéias e para eucariotos. Em vez de bactérias versus eucariotos, você também pode querer considerar razões contrastantes que a regulação gênica é importante para organismos unicelulares versus organismos multicelulares ou comunidades de organismos unicelulares (como colônias de bactérias).

Ativação e Repressão da Transcrição

Alguns fundamentos

Vamos considerar um gene codificador de proteína e trabalhar com alguma lógica. Sabemos que, para transcrever esse gene, uma RNA polimerase precisará ser recrutada para o início da região codificadora. É necessário que haja algum mecanismo, baseado na lógica química, para ajudar a recrutar a RNA polimerase para o início do gene que codifica a proteína. Da mesma forma, se este processo deve ser regulado, deve haver algum mecanismo, ou mecanismos, para ditar quando uma RNA polimerase deve ser recrutada para o início de um gene, quando não deveria, e / ou se ela é recrutada para o DNA, se deve ou não começar a transcrição e quantas vezes esse processo deve acontecer. Observe que a frase anterior tem vários subproblemas / questões distintas (por exemplo, quando a polimerase é recrutada ?, se recrutada deve iniciar a transcrição? Com ​​que frequência isso deve acontecer?). Também podemos inferir razoavelmente que será necessário haver alguns mecanismos para "instruir" (mais antropomorfismos) a polimerase a parar a transcrição. Finalmente, como o papel da transcrição é criar cópias de RNA dos segmentos do genoma, devemos também considerar problemas / questões relacionadas a outros fatores que influenciam a abundância de RNA, como mecanismos de degradação. Deve haver algum mecanismo para cada uma dessas etapas, e qualquer uma delas pode estar envolvida na regulamentação desse processo.

Um esquema que mostra um gene codificador de proteína e algumas das perguntas ou problemas que precisamos nos perguntar ou, alternativamente, problemas para os quais precisamos saber as soluções se quisermos entender como a regulação da porção transcricional da expressão do gene é regulada. Atribuição: Marc T. Facciotti (obra própria)

Recrutando RNA polimerase para locais específicos

Para iniciar a transcrição, a RNA polimerase deve ser recrutada para um segmento de DNA próximo ao início de uma região de DNA que codifica um transcrito funcional. A função da RNA polimerase, conforme descrito até agora, no entanto, não é ligar sequências específicas, mas sim mover-se ao longo de qualquer segmento de DNA. Encontrar uma maneira de recrutar a polimerase para um local específico, portanto, parece contraditório ao seu comportamento usual, que não exibe nenhuma preferência particular por uma sequência particular. Explicar essa contradição exige que invoquemos algo novo. Qualquer uma das transcrições pode começar em qualquer lugar e apenas os eventos que levam a uma transcrição produtiva completa fazem qualquer coisa útil ou algo diferente do que a própria RNA polimerase ajuda a recrutar a enzima para o início de um gene. O último, agora assumimos como certo, é de fato o caso, e isso é verdade tanto para procariotos quanto para eucariotos.

O recrutamento da RNA polimerase é mediado por proteínas chamadas fatores gerais de transcrição. Nas bactérias, são chamados fatores sigma.

Em eucariotos, importantes fatores gerais de iniciação da transcrição incluem a proteína de ligação TATA (TBP) e TFIIB, que funcionam em conjunto com vários outros complexos de proteínas (para um total de quase 100 proteínas) para recrutar a RNA polimerase II. Archea carrega uma versão simplificada deste eucariótico complexo de pré-iniciação.

Os fatores de transcrição gerais têm pelo menos duas funções básicas: (1) Eles (em eucariotos, como um complexo multiproteico) são capazes de reconhecer quimicamente uma sequência específica de DNA e (2) eles são capazes de carregar a RNA polimerase naquele local . Juntas, essas duas funções dos fatores gerais de transcrição resolvem o problema de recrutamento de uma enzima que, de outra forma, não é capaz de se ligar a um específico Sítio de DNA. Em alguns textos, os fatores gerais de transcrição (e particularmente as variedades do fator sigma) são considerados parte da RNA polimerase. Embora certamente façam parte do complexo quando ajudam a direcionar a RNA polimerase, eles (geralmente) não continuam com a RNA polimerase após o início da transcrição. Cada RNA polimerase é carregado em um promotor pelo fator sigma. Um genoma bacteriano pode codificar vários fatores sigma, expressando-os diferencialmente em diferentes condições e, como resultado, selecionando uma gama diferente de promotores para ajudar a bactéria a se ajustar a essas condições.

O sítio de DNA para o qual uma RNA polimerase é recrutada é chamado de promotor. Embora as sequências de DNA de diferentes promotores não precisem ser exatamente iguais, diferentes sequências de promotores normalmente têm algumas propriedades químicas especiais em comum. Obviamente, uma propriedade é que eles podem se associar aos fatores gerais de transcrição mencionados acima. Além disso, o promotor geralmente tem uma sequência de DNA que facilita a dissociação do DNA de fita dupla, de modo que a polimerase pode começar a transcrever a região codificadora. (Observação: tecnicamente, poderíamos ter dividido as propriedades do promotor em subproblemas de desafio de design. Neste caso, nós pulamos, mas você ainda deve ser capaz de retroceder e criar as declarações de problemas e / ou questões relevantes assim que descobrir sobre os promotores )

Em quase todos os casos, mas particularmente em sistemas eucarióticos, o complexo de proteínas que se monta com a RNA polimerase nos promotores (normalmente chamado de complexo de pré-iniciação) pode chegar a dezenas de proteínas. Cada uma dessas outras proteínas tem uma função específica, mas isso é muito detalhado para se mergulhar no Bis2A.

Um modelo do complexo de pré-iniciação de E. coli. O fator sigma é colorido em vermelho. O DNA é representado como tubos laranja e bases opostas em azul: verde. O resto do complexo de pré-iniciação é rosa. Observe que o DNA possui regiões de dupla hélice e uma estrutura aberta dentro do PIC. Atribuição: Estrutura derivada das coordenadas PDB (4YLN) Marc T. Facciotti (trabalho próprio)

Estados de um promotor regulamentado

Uma vez que os promotores recrutam uma RNA polimerase, esses locais e a montagem do complexo de pré-iniciação são locais óbvios para regular as primeiras etapas da expressão gênica. No nível de iniciação da transcrição, frequentemente classificamos o promotor em uma de três classes. O primeiro é chamado constitutivo. Os promotores constitutivos geralmente não são regulados com muita força. Seu estado básico é "ligado". Quando a transcrição constitutiva de um promotor é muito alta (em relação à maioria dos outros promotores), chamaremos coloquialmente esse promotor de promotor "constitutivo forte". Em contraste, se a quantidade de transcrição de um promotor constitutivo for baixa (em relação à maioria dos outros promotores), chamaremos esse promotor de promotor "constitutivo fraco".

Uma segunda maneira de classificar os promotores pelo uso do termo ativado ou equivalente, induzido. Esses termos intercambiáveis ​​são usados ​​para descrever promotores que são sensíveis a algum estímulo externo e respondem a esse estímulo aumentando a transcrição. Os promotores ativados têm um estado básico que geralmente exibe pouca ou nenhuma transcrição. A transcrição é então "ativada" em resposta a um estímulo - o estímulo "liga" o promotor.

Finalmente, o terceiro termo usado para classificar promotores é pelo uso do termo reprimido. Esses promotores também respondem a estímulos, mas o fazem diminuindo a transcrição. O estado básico para esses promotores é algum nível basal de transcrição e o estímulo atua para diminuir ou reprimir a transcrição. A transcrição é "reprimida" em resposta a um estímulo - o estímulo "desliga" o promotor.

Os exemplos dados acima assumiram que um único estímulo atua para regular os promotores. Embora este seja o caso mais simples, muitos promotores podem integrar diferentes tipos de informação e podem ser alternadamente ativados por alguns estímulos e reprimidos por outros estímulos.

Fatores de transcrição ajudam a regular o comportamento de um promotor

Como os promotores são sensíveis a estímulos externos? Tanto na ativação quanto na repressão, a regulação gênica requer que as proteínas alterem a produção transcricional do gene que está sendo observado. As proteínas responsáveis ​​por ajudar a regular a expressão são chamadas fatores de transcrição. As sequências específicas de DNA ligadas por fatores de transcrição são freqüentemente chamadas de operadores e, em muitos casos, os operadores estão muito próximos das sequências promotoras.

Sugestão: descreva a diferença entre um "fator de transcrição", conforme descrito imediatamente acima, e os "fatores de transcrição geral" descritos anteriormente.

É aqui que a nomenclatura se torna potencialmente confusa - particularmente quando se compara pesquisas bacterianas e eucarióticas. No

pesquisa bacteriana

, se o fator de transcrição atua ligando-se ao DNA e à RNA polimerase de uma forma que aumenta a transcrição, é normalmente chamado de ativador. Se, por outro lado, o fator de transcrição atua ligando-se ao DNA para reprimir ou diminuir a transcrição do gene, então é chamado de repressor.

Por que as classificações de ativador e repressor são potencialmente problemáticas? Esses termos descrevem funções únicas idealizadas. Embora isso possa ser verdade no caso de alguns fatores de transcrição, na realidade outros fatores de transcrição podem atuar para ativar a expressão gênica em algumas condições, enquanto reprimem em outras condições. Alguns fatores de transcrição simplesmente agem para modular a expressão para cima ou para baixo, dependendo do contexto, em vez de desligar a transcrição ou ativá-la completamente. Para contornar parte dessa possível confusão, alguns de seus instrutores preferem evitar o uso dos termos ativador e repressor e, em vez disso, preferem simplesmente discutir a atividade de transcrição de vários fatores de transcrição como uma influência positiva ou negativa na expressão do gene em casos específicos. Se esses termos forem usados, você poderá ouvir seu instrutor dizer que o fator de transcrição em questão ATUA COMO / COMO um repressor ou que ATUA COMO / COMO um ativador, tomando cuidado para não chamá-lo simplesmente de ativador ou repressor. É mais provável, entretanto, que você os ouça dizer que um fator de transcrição está agindo para influenciar positiva ou negativamente a transcrição.

Discussão sugerida

Que tipo de interação você acha que acontece entre os aminoácidos do fator de transcrição e a dupla hélice do DNA? Como os fatores de transcrição reconhecem seu sítio de ligação no DNA?

Moduladores alostéricos de proteínas reguladoras

A atividade de muitas proteínas, incluindo proteínas regulatórias e vários fatores de transcrição, pode ser modulada alostericamente por vários fatores, incluindo a abundância relativa de pequenas moléculas na célula. Essas pequenas moléculas são frequentemente chamadas de indutores ou co-repressores ou co-ativadores e são frequentemente metabólitos, como lactose ou triptofano, ou pequenas moléculas reguladoras, como cAMP ou GTP. Essas interações permitem que o FT responda às condições ambientais e module sua função de acordo. Isso está ajudando a tomar uma decisão sobre se transcrever um gene ou não, dependendo da abundância do sinal ambiental.

Vamos imaginar um regulador transcricional negativo. No caso mais simples que consideramos até agora, a transcrição do gene com um sítio de ligação para esse fator de transcrição seria baixa quando o FT está presente e alta quando o FT está ausente. Agora podemos adicionar uma pequena molécula a este modelo. Nesse caso, a pequena molécula é capaz de se ligar ao regulador transcricional negativo por meio de conjuntos de ligações complementares de hidrogênio e iônicas. Neste primeiro exemplo, consideraremos o caso em que a ligação da pequena molécula ao FT induz uma mudança conformacional ao FT que reduz severamente sua capacidade de se ligar ao DNA. Se for esse o caso, o regulador negativo - uma vez ligado por sua pequena molécula - seria liberado do DNA. Isso, portanto, aliviaria a influência negativa e levaria ao aumento da transcrição. Essa lógica regulatória pode ser apropriada para ter evoluído no seguinte cenário: uma pequena molécula de alimento está normalmente ausente do ambiente. Portanto, genes que codificam enzimas que degradam / usam aquele alimento devem ser mantidos "desligados" na maior parte do tempo para preservar a energia celular que sua síntese utilizaria. Isso poderia ser realizado pela ação de um regulador transcricional negativo. Quando o alimento aparece no meio ambiente, seria apropriado que as enzimas responsáveis ​​por seu processamento fossem expressas. O alimento poderia então agir ligando-se ao regulador negativo, mudando a conformação do FT, causando sua liberação do DNA e, assim, ativando a transcrição das enzimas de processamento.

Um modelo abstrato de uma unidade transcricional genérica regulada por um regulador negativo cuja atividade é modulada por uma pequena molécula (representada por uma estrela). Nesse caso, a ligação da pequena molécula faz com que o FT seja liberado do DNA. Facciotti (trabalho próprio)

Podemos considerar um segundo modelo de como um FT de ação negativa pode interagir com uma pequena molécula. Nesse caso, o FT sozinho é incapaz de se ligar ao seu sítio regulatório no DNA. No entanto, quando uma pequena molécula se liga ao FT, ocorre uma mudança conformacional que reorienta os aminoácidos de ligação ao DNA na orientação "correta" para a ligação ao DNA. O complexo TF-molécula pequena agora se liga ao DNA e age para influenciar negativamente a transcrição.

Um modelo abstrato de uma unidade transcricional genérica regulada por um regulador negativo cuja atividade é modulada por uma pequena molécula (representada por uma estrela). Nesse caso, a ligação da pequena molécula faz com que o FT se ligue ao DNA. Facciotti (trabalho próprio)

Observe como a atividade do FT pode ser modulada de maneiras distintas por uma pequena molécula.Dependendo da lógica do sistema regulatório, a ligação desse sinal externo pode causar a ligação do complexo TF-molécula pequena ao DNA OU a ligação da molécula pequena pode causar a liberação do complexo TF-molécula pequena do DNA. Os mesmos tipos de exemplos podem ser trabalhados para um regulador positivo (tente inventar um e desenhe os componentes).

Em ambos os casos propostos acima, a ligação de uma pequena molécula a um TF será dependente de quão fortemente o TF interage com a pequena molécula. Isso dependerá dos tipos e da orientação espacial dos grupos funcionais químicos da proteína e dos grupos funcionais complementares na pequena molécula. Não deve ser surpreendente, portanto, saber que a ligação da molécula pequena ao TF será dependente de vários fatores, incluindo, mas não se limitando à concentração da molécula pequena e do TF.

Um fator de transcrição é um regulador positivo ou negativo?

Resolvendo um ponto comum de confusão

Nesse ponto, não é incomum que muitos alunos do Bis2a fiquem um pouco confusos sobre como determinar se um fator de transcrição está agindo como um regulador positivo ou negativo. Essa confusão geralmente surge após uma discussão sobre os possíveis modos pelos quais o estímulo (ou seja, molécula pequena) pode influenciar a atividade de um fator de transcrição. Isso não é muito surpreendente. Nos exemplos acima, a ligação de uma molécula efetora a um fator de transcrição pode ter um de dois efeitos diferentes: (1) a ligação da molécula efetora pode induzir um fator de transcrição ligado ao DNA para

liberar

a partir de seu local de ligação, desreprimindo um promotor, e

ligando

expressão genetica. (2) a ligação da molécula efetora ao fator de transcrição poderia

fazer com que o TF se vincule

ao seu sítio de ligação ao DNA, reprimindo um promotor e, portanto,

desligando

expressão genetica. No primeiro caso, pode parecer que a pequena molécula está agindo para regular positivamente a expressão porque ela inibe a atividade bioquímica do TF (sua capacidade de se ligar a uma sequência específica e, assim, bloquear o carregamento da polimerase), enquanto no segundo exemplo a pequena molécula ativa a atividade bioquímica do TF (novamente, ligação de DNA específica de sequência que bloqueia o carregamento de polimerase).

Em ambos os exemplos acima, o TF está atuando como um regulador negativo. Para determinar isso

olhamos o que acontece quando o TF liga o DNA

(se uma pequena molécula está ligada ao TF ou não). Em ambos os casos, a ligação do FT ao DNA reprime a transcrição. O TF está, portanto, atuando como um regulador negativo. Uma análise semelhante pode ser feita com TFs de ação positiva - isto é, TFs que ajudam a promover o carregamento de polimerase no promotor e / ou iniciação da transcrição.

Observe que, em alguns casos, um TF pode atuar como um regulador positivo em um promotor e um regulador negativo em um promotor diferente, portanto, descrever o comportamento do TF em uma base por caso é frequentemente importante (ler muito do nome que foi atribuído pode ser enganoso às vezes). Outra proteína TF pode atuar alternadamente como reguladores positivos ou negativos do mesmo promotor dependendo das condições. Novamente, é aconselhável descrever o comportamento do TF especificamente para cada caso. Nesta aula, tentamos evitar esses exemplos mais complexos.

Um teste genético para função regulatória positiva ou negativa de um TF

Como determinar se uma proteína reguladora funciona de maneira positiva ou negativa? Um teste genético simples é perguntar "o que acontece com a expressão se a proteína reguladora estiver ausente?" Isso pode ser realizado removendo o gene codificador do fator de transcrição do genoma. Se um fator de transcrição atua positivamente, sua presença é necessária para ativar a transcrição. Na sua ausência, não há proteína reguladora, portanto, não há ativação, e o resultado são níveis mais baixos de transcrição de um gene alvo. O oposto é verdadeiro para um fator de transcrição que age negativamente. Na sua ausência, a expressão deve ser aumentada, porque o gene que mantém a expressão baixa não está mais por perto.

Término da transcrição e degradação do RNA

Degradação de RNA

O tempo de vida de diferentes espécies de RNA na célula pode variar dramaticamente, de segundos a horas. O tempo médio de vida do mRNA também pode variar dramaticamente dependendo do organismo. Por exemplo, o tempo de vida médio para mRNA em E. coli é de aproximadamente 5 minutos. A meia-vida do mRNA em leveduras é de aproximadamente 20 minutos e 600 minutos para células humanas. Parte da degradação é "direcionada". Ou seja, alguns transcritos incluem uma sequência curta que os direciona para enzimas degradantes de RNA, acelerando a taxa de degradação. Não é preciso muita imaginação para inferir que esse processo também pode ser evolutivamente ajustado para diferentes genes. Simplesmente perceber que a degradação - e o ajuste da degradação - também pode ser um fator no controle da expressão de um gene é suficiente para o Bis2a.

Resumo da regulação gênica

No texto anterior, examinamos várias maneiras de começar a resolver alguns dos desafios de design associados à regulação da quantidade de transcrição que é criada para uma única região de codificação do genoma. Vimos em termos abstratos alguns dos processos responsáveis ​​por controlar o início da transcrição, como eles podem se tornar sensíveis a fatores ambientais e, muito brevemente, os processos que encerram a transcrição e lidam com a degradação ativa do RNA. Evitamos mais Cada um desses processos pode ser quantitativamente ajustado pela natureza para ser "mais forte" ou "mais fraco". É importante perceber que os valores reais de "força" (por exemplo, força do promotor, taxas de degradação, etc.) influenciam o comportamento do processo geral de maneiras potencialmente importantes do ponto de vista funcional.

Exemplos de regulação do gene bacteriano

Esta seção descreve dois exemplos de regulação da transcrição em bactérias. Estes são apresentados como exemplos ilustrativos. Use esses exemplos para aprender alguns princípios básicos sobre os mecanismos de regulação da transcrição. Fique atento na aula, na discussão e nos guias de estudo para extensões dessas idéias e use-as para explicar os mecanismos regulatórios usados ​​para regular outros genes.

Exemplos de regulação gênica em E. coli

O DNA de bactérias e arquéias são geralmente organizados em um ou mais cromossomos circulares no citoplasma. O denso agregado de DNA que pode ser visto em micrografias eletrônicas é chamado de nucleóide. Em bactérias e arquéias, os genes, cuja expressão precisa ser fortemente coordenada (por exemplo, genes que codificam proteínas que estão envolvidas na mesma via bioquímica) são frequentemente agrupados intimamente no genoma. Quando a expressão de múltiplos genes é controlada pelo mesmo promotor e um único transcrito é produzido, essas unidades de expressão são chamadas operons. Por exemplo, na bactéria Escherschia coli todos os genes necessários para utilizar a lactose são codificados lado a lado no genoma. Este arranjo é chamado de lactose (ou laca) operon. Em bactérias e arquéias, costuma acontecer que quase 50% de todos os genes são codificados em operons de dois ou mais genes.

O papel do promotor

O primeiro nível de controle da expressão gênica está no próprio promotor. Alguns promotores recrutam a RNA polimerase e transformam esses eventos de ligação da proteína ao DNA em transcritos de forma mais eficiente do que outros promotores. Essa propriedade intrínseca de um promotor, sua capacidade de produzir transcrição a uma taxa específica, é chamada de força do promotor. Quanto mais forte o promotor, mais RNA é produzido em um determinado período de tempo. A força do promotor pode ser "sintonizada" pela Natureza em etapas muito pequenas ou muito grandes, alterando a sequência de nucleotídeos do promotor (por exemplo, mutando o promotor). Isso resulta em famílias de promotores com diferentes intensidades que podem ser usadas para controlar a taxa máxima de expressão gênica de certos genes.

Conexão de Graduação da UC Davis

Um grupo de alunos da UC Davis interessados ​​em biologia sintética usou essa ideia para criar bibliotecas de promotores sintéticos para micróbios de engenharia como parte de seu projeto de design para a competição iGEM 2011.

Exemplo # 1: Operon Trp

Lógica para regular a biossíntese de triptofano

E. coli, como todos os organismos, precisa sintetizar ou consumir aminoácidos para sobreviver. O aminoácido triptofano é um desses aminoácidos. E. colipode importar triptofano do ambiente (comendo o que pode limpar do mundo ao seu redor) ou sintetizar triptofano de novo usando enzimas que são codificadas por cinco genes. Esses cinco genes são codificados lado a lado no E. coli genoma no que é chamado de triptofanotrp) operon (Figura abaixo). Se o triptofano estiver presente no ambiente, então E. coli não precisa sintetizá-lo e o interruptor que controla a ativação dos genes no trp operon está desligado. No entanto, quando a disponibilidade ambiental de triptofano é baixa, o interruptor que controla o operon é ligado, a transcrição é iniciada, os genes são expressos e o triptofano é sintetizado. Veja a figura e os parágrafos abaixo para uma explicação mecanicista.

Organização do trp operon

Cinco regiões genômicas que codificam enzimas de biossíntese de triptofano são organizadas sequencialmente no cromossomo e estão sob o controle de um único promotor. Todas as cinco enzimas são codificadas por uma única transcrição - elas são organizadas em um operon. Pouco antes da região de codificação está o site de início da transcrição. Este é, como o nome indica, o local onde a RNA polimerase inicia uma nova transcrição. A sequência do promotor está ainda a montante do local de início da transcrição.

Uma sequência de DNA chamada de "operador" também é codificada entre o promotor e o primeiro trp gene codificador. Esse operador é a sequência de DNA à qual a proteína do fator de transcrição regulatório se ligará.

Mais alguns detalhes sobre os locais de ligação TF

Deve-se notar que o uso do termo "operador" é limitado a apenas alguns sistemas reguladores e quase sempre se refere ao local de ligação para um fator de transcrição de ação negativa. Conceitualmente, o que você precisa lembrar é que existem locais no DNA que interagem com proteínas regulatórias, permitindo-lhes desempenhar sua função apropriada (por exemplo, reprimir ou ativar a transcrição). Este tema será repetido universalmente em toda a biologia, quer o termo "operador" seja usado ou não.

Além disso, embora os exemplos específicos que você mostrará retratam locais de ligação do FT em seus locais conhecidos, esses locais não são universais para todos os sistemas. Os locais de ligação do fator de transcrição podem variar em localização em relação ao promotor. Existem alguns padrões (por exemplo, reguladores positivos estão frequentemente a montante do promotor e reguladores negativos ligam a jusante), mas essas generalizações não são verdadeiras para todos os casos. Mais uma vez, o principal a ser lembrado é que os fatores de transcrição (de ação positiva e negativa) têm locais de ligação com os quais interagem para ajudar a regular a iniciação da transcrição pela RNA polimerase.

Os cinco genes necessários para sintetizar o triptofano em E. coli estão localizados próximos um do outro no operon trp. Quando o triptofano é abundante, duas moléculas de triptofano se ligam ao fator de transcrição e permitem que o complexo TF-triptofano se ligue na sequência do operador. Isso bloqueia fisicamente a RNA polimerase de transcrever os genes da biossíntese do triptofano. Quando o triptofano está ausente, o fator de transcrição não se liga ao operador e os genes são transcritos. Facciotti (trabalho próprio).

Regulamento do trp operon

Quando o triptofano está presente na célula, ele se liga ao trp proteína repressora. Quando o triptofano se liga a este fator de transcrição, ele causa uma mudança conformacional na proteína que agora permite que o complexo TF-triptofano se ligue ao trp sequência do operador. A ligação do complexo repressor de triptofano no operador impede fisicamente a RNA polimerase de se ligar e transcrever os genes a jusante. Quando o triptofano não está presente na célula, o fator de transcrição não se liga ao operador; portanto, a transcrição prossegue, os genes de utilização do triptofano são transcritos e traduzidos e o triptofano é então sintetizado.

Uma vez que o fator de transcrição se liga ativamente ao operador para manter os genes desligados, o trp O operon é considerado "regulado negativamente". As proteínas que se ligam ao operador para silenciar trp expressão são reguladores negativos.

Discussão sugerida

Você acha que a expressão da proteína repressora do trp é regulada pelo trp ou a proteína é expressa constitutivamente?

Discussão de sugestões

Suponha que a natureza adotou uma abordagem diferente para regular o operon trp. Projete um método para regular a expressão do operon trp com um regulador positivo em vez de um regulador negativo. (motivador: os professores fazem esse tipo de pergunta o tempo todo nos exames)

Link externo

Assista a este vídeo para saber mais sobre o trp operon.

Exemplo # 2: o laca operon

Justificativa para estudar o laca operon

Neste exemplo, examinamos a regulação de genes que codificam proteínas cujo papel fisiológico é importar e assimilar o dissacarídeo lactose, o laca operon. A história da regulamentação de laca operon é um exemplo comum usado em muitas aulas introdutórias de biologia para ilustrar os princípios básicos da regulação de genes induzíveis. Optamos por descrever este exemplo em segundo lugar porque é, em nossa estimativa, mais complicado do que o exemplo anterior envolvendo a atividade de um único fator de transcrição de ação negativa. Em contraste, a regulamentação do laca O operon é, em nossa opinião, um exemplo maravilhoso de como a atividade coordenada de reguladores positivos e negativos em torno do mesmo promotor pode ser usada para integrar várias fontes diferentes de informação celular para regular a expressão de genes.

Conforme você avança neste exemplo, tenha em mente o último ponto. Para a maioria dos instrutores Bis2a, é mais importante que você entenda como a lógica do laca operon do que memorizar a tabela de entrada / saída apresentada a seguir. O benefício de compreender a lógica da regulação gênica é que os conceitos podem ser aplicados a muitos sistemas regulatórios diferentes. Esse objetivo pode se refletir nos exames.

A utilização de lactose

A lactose é um dissacarídeo composto pelas hexoses glicose e galactose. É comumente encontrado em grande abundância no leite e em alguns produtos lácteos. Como se pode imaginar, o dissacarídeo pode ser um alimento importante para os micróbios que são capazes de utilizar suas duas hexoses. coli é capaz de usar vários açúcares diferentes como fontes de energia e carbono, incluindo lactose e o laca operon é uma estrutura que codifica os genes necessários para adquirir e processar a lactose do ambiente local. Lactose, no entanto, não foi freqüentemente encontrada por E. coli durante sua evolução e, portanto, os genes do laca O operon deve ser tipicamente reprimido (ou seja, "desligado") quando a lactose está ausente. Conduzir a transcrição desses genes quando a lactose está ausente desperdiçaria energia celular preciosa. Em contraste, quando a lactose está presente, faria sentido lógico que os genes responsáveis ​​pela utilização do açúcar fossem expressos (ou seja, "ligados"). Até agora, a história é semelhante à do operon do triptofano descrito acima. Exceto ... o celular deve reconhecer a presença de uma pequena molécula (lactose) para que ela possa mudar sobre produção de uma enzima para degradá-la (e outra para transportá-la para a célula). No operon trp, a célula deve reconhecer a presença de uma pequena molécula (trp) para que ela possa mudar desligado produção de enzimas que o produzem.

Pergunta: Em ambos os casos, uma proteína repressora é empregada. Como isso é possível, quando resultados opostos são alcançados?

No entanto, há um porém. Experimentos realizados na década de 1950 por Jacob e Monod demonstraram claramente que E. coli prefere utilizar toda a glicose presente no ambiente antes de começar a utilizar a lactose. Isso significa que o mecanismo utilizado para decidir se deve ou não expressar os genes de utilização da lactose deve ser capaz de integrar dois tipos de informações (1) a concentração de glicose e (2) a concentração de lactose. Embora isso possa teoricamente ser realizado de várias maneiras, examinaremos como o laca operon faz isso usando múltiplos fatores de transcrição.

Os reguladores transcricionais do laca operon

O laca repressor - um sensor direto de lactose

Como observado, o laca O operon normalmente tem produção transcricional muito baixa ou nenhuma na ausência de lactose. Isso se deve a dois fatores: (1) a força do promotor constitutivo para o operon é relativamente baixa e (2) a presença constante da proteína repressora LacI influencia negativamente a transcrição. Esta proteína se liga ao local do operador perto do promotor e bloqueia a RNA polimerase de transcrever o laca genes do operon. Em contraste, se a lactose estiver presente, a lactose se ligará à proteína LacI, induzindo uma mudança conformacional que impede o complexo LacI-lactose de se ligar aos seus locais de ligação. Portanto, quando a lactose está presente, a LacI regulatória negativa não está ligada ao seu local de ligação e a transcrição de genes que utilizam lactose pode prosseguir.

Proteína CAP - um sensor indireto de glicose

No E. coli, quando os níveis de glicose caem, a pequena molécula AMP cíclico (cAMP) começa a se acumular na célula. O cAMP é uma molécula de sinalização comum que está envolvida no metabolismo da glicose e da energia em muitos organismos. Quando os níveis de glicose diminuem na célula, as concentrações crescentes de cAMP permitem que este composto se ligue ao regulador transcricional positivo denominado proteína ativadora catabólica (CAP) - também conhecido como CRP. O complexo cAMP-CAP tem muitos sites localizados em todo o E. coli O genoma e muitos desses locais estão localizados próximos aos promotores de muitos operons que controlam o processamento de vários açúcares.

No laca operon, o local de ligação cAMP-CAP está localizado a montante do promotor. A ligação de cAMP-CAP ao DNA ajuda a recrutar e reter a RNA polimerase para o promotor. O aumento da ocupação da RNA polimerase para seu promotor, por sua vez, resulta em aumento da produção transcricional. Nesse caso, a proteína CAP atua como um regulador positivo.

Observe que o complexo CAP-cAMP pode, em outros operons, também atuar como um regulador negativo, dependendo de onde o sítio de ligação para o complexo CAP-cAMP está localizado em relação ao sítio de ligação da RNA polimerase.

Juntando tudo: Induzindo a expressão do operon lac

Para o laca operon a ser ativado, duas condições devem ser atendidas. Primeiro, o nível de glicose deve ser muito baixo ou inexistente. Em segundo lugar, a lactose deve estar presente. Somente quando a glicose está ausente e a lactose está presente o laca operon ser transcrito.Quando essa condição é alcançada, o complexo LacI-lactose dissocia o regulador negativo de perto do promotor, liberando a RNA polimerase para transcrever os genes do operon. Além disso, altos níveis de cAMP (indiretamente indicativo de baixa glicose) desencadeiam a formação do complexo CAP-cAMP. Este par de indutor de TF agora se liga perto do promotor e age para recrutar positivamente a RNA polimerase. Esta influência positiva adicional aumenta a produção transcricional e a lactose pode ser utilizada de forma eficiente. A produção mecanística de outras combinações de condições binárias de glicose e lactose são descritas na tabela abaixo e na figura a seguir.

Tabela da verdade para o operon lac: sinais que induzem ou reprimem a transcrição do operon lac
CAP ligaLactoseRepressor ligaTranscrição
+--+Não
+-+-Alguns, não muito
-+-+Não
-++-Sim, muitos

A transcrição do operon lac é cuidadosamente regulada para que sua expressão ocorra apenas quando a glicose é limitada e a lactose está presente para servir como uma fonte alternativa de combustível.
Atribuição: Marc T. Facciotti (obra própria)


Regulação da expressão de genes de snRNA transcritos de RNA polimerase II humana

Além dos genes codificadores de proteínas, a RNA polimerase II (pol II) transcreve vários genes para RNAs não codificantes, incluindo os genes de RNA de núcleo pequeno (sn). Os snRNAs são uma classe importante de RNAs não codificantes, vários dos quais estão envolvidos no splicing pré-mRNA. Os mecanismos moleculares subjacentes à expressão de genes de snRNA transcritos de pol II humano são menos bem caracterizados do que para genes que codificam proteínas e há diferenças importantes na expressão desses dois tipos de genes. Aqui, revisamos as características do DNA e as proteínas necessárias para a transcrição eficiente de genes de snRNA e a formação da extremidade 3 'co-transcricional dos transcritos.

1. Introdução

A RNA polimerase II (pol II) é responsável pela transcrição de todos os 25.000 ou mais genes que codificam proteínas no genoma humano. Muitos RNAs não codificantes, incluindo RNA ribossômico (r), RNA de transferência (t), o RNA 7SK que regula o alongamento da transcrição por pol II e os RNAs de pequeno núcleo (sn) spliceosomal U6 e U6atac são transcritos por pol I ou pol III [1-4]. No entanto, os microRNAs não codificantes, pequenos RNAs nucleolares (sno) e os demais snRNAs são transcritos pela pol II [2,5,6]. SnRNAs são RNAs curtos (menos de 350 nts) que se associam com proteínas para formar pequenas partículas de ribonucleoproteína nuclear (snRNPs) [6].

Devido às suas funções no splicing pré-mRNA, os snRNAs U1, U2, U4, U4atac, U5, U11 e U12 transcritos pol II são necessários para a expressão de genes codificadores de proteínas contendo intrões. O spliceossomo principal inclui os snRNPs U1, U2, U4, U5 e U6 e reconhece os sítios de splice GT / AG canônicos que flanqueiam os íntrons para se reunir de maneira gradual com o pré-mRNA. Alguns íntrons são flanqueados por sítios de splice AT / AC, que recrutam o spliceossomo menor contendo U11, U12, U4atac, U5 e U6atac snRNPs [7]. O U7 snRNA é necessário para a formação da extremidade 3 'do mRNA da histona ativada por replicação [8] e o U3 sn (o) RNA é necessário para o processamento do rRNA [9].

2. Elementos de sequência de DNA envolvidos na expressão de genes de snRNA transcritos de pol II

Embora as funções dos snRNAs sejam bem conhecidas, a regulação de sua expressão ainda não está totalmente caracterizada. Os genes snRNA humanos têm uma estrutura de promotor muito mais simples do que a maioria dos genes codificadores de proteínas, que compreende um elemento de sequência distal (DSE) que atua como um intensificador e um elemento de sequência proximal específico do gene snRNA essencial (PSE), que é o promotor central [2 , 10,11] (figura 1). Os transcritos são sem íntron e não poliadenilados, e uma caixa 3 'direciona a formação da extremidade 3' do pré-snRNA, que é posteriormente processado para produzir o snRNA maduro [10].

Figura 1. Expressão de genes de snRNA humanos. O elemento de sequência distal (DSE) e o elemento de sequência proximal (PSE) são os elementos intensificadores e promotores, respectivamente. A caixa 3 'é o elemento de processamento de RNA específico do gene snRNA. Uma seta representa o local de início da transcrição e os números abaixo da linha indicam a posição aproximada dos elementos em relação ao local de início da transcrição. DSE compreende o sítio de ligação Oct1 ATTTGCAT [12], três sítios de ligação Sp1 (G / T) (G / A) GGCG (G / T) (G / A) (G / A) (G / T) [13] e um sítio de ligação de STAF YY (A / T) CCC (A / G) N (A / C) AT (G / C) C (A / C) YYRCR [14]. A sequência consenso da sequência PSE é TCACCNTNA (G / C) NNNAA (A / T) (G / A) N [2]. A sequência de consenso da caixa 3 ′ é GTTYN0-3AARRYAGA [15]. O transcrito do snRNA é representado em verde com a tampa na extremidade 5 '. O pré-snRNA é exportado para o citoplasma para maturação por recorte 3 ', trimetilação e montagem com as proteínas snRNP [6]. As funções dos vários snRNPs após a reimportação para o núcleo são anotadas.

Em vertebrados, os genes para os principais snRNAs (U1, U2, U4 e U5) são bem conservados com sequências DSE, PSE e 3 ′ box reconhecíveis [2], e Drosófila Os genes snRNA também têm sequências semelhantes a PSE [16]. Os genes snRNA de vertebrados estão frequentemente presentes em várias cópias. Por exemplo, existem quatro cópias do gene U1 snRNA / genoma haplóide humano) [17] e 15 cópias do gene U2 snRNA / genoma haplóide humano) [18]. Em contraste, os genes para os snRNAs menores (U11, U12 e U4atac) são geralmente genes de cópia única e estão ausentes em muitos invertebrados, incluindo Cnidaria e Annelida [19].

Uma característica importante dos genes snRNA é o acoplamento obrigatório entre o elemento de processamento de RNA 3 'box e a substituição do promotor do tipo de gene snRNA de um promotor do gene snRNA pelo promotor de um gene codificador de proteína resulta na falha da formação da extremidade 3' do RNA [ 15,20].

Os genes transcritos da pol III para 7SK snRNA e U6 snRNA também têm um DSE e PSE, mas, além disso, têm uma caixa TATA a −25 [2]. Colocar uma caixa TATA a jusante do PSE em um gene snRNA transcrito de pol II converte a transcrição de pol II em pol III [2], enfatizando que o DSE e o PSE podem funcionar como elementos de ação cis para qualquer polimerase.

Aqui, revisamos o que se sabe atualmente sobre a expressão de genes de snRNA humanos transcritos pela pol II e as perspectivas futuras de uma compreensão completa dos mecanismos envolvidos.

3. Fatores de transcrição associados aos genes snRNA

Os fatores de transcrição Oct1, Sp1, NF1 e Staf ligam-se a sequências no DSE, que tem as propriedades de um intensificador da transcrição [2,21]. Oct1 aumenta a expressão do gene snRNA estabilizando a ligação da proteína de ligação a PSE / fator de transcrição de ligação a PSE / complexo de proteína ativadora de snRNA, PTF (também conhecido como PBP e SNAPc) [12,22,23], ao PSE de ambos pol II - Genes snRNA transcritos da pol II por meio de interação direta [12,24,25]. Por sua vez, o PTF ajuda a recrutar a proteína de ligação a TATA (TBP) e os fatores associados a TBP (TAFs) que constituem o complexo snRNA TAF (snTAFc) para os genes snRNA transcritos da pol II [22,26,27]. O snTAFc no gene U2 snRNA, que compreende TAF5, TAF6, TAF8, TAF9, TAF11 e TAF13 [27], é um subconjunto dos TAFs encontrados em TFIID, o complexo contendo TBP / TAF necessário para a transcrição de muitas proteínas codificantes genes [28]. No entanto, os genes U1, U4, U5 e U11 snRNA parecem ter um complexo TAF diferente, que inclui TAF7 [29]. TAF7 pode ajudar a recrutar o grande complexo mediador multissubunidades, que é necessário para a transcrição eficiente de genes snRNA [29]. TAF7 também foi implicado na regulação do escape do promotor (ver abaixo). No entanto, TAF7 parece estar ausente dos genes U2 snRNA [27], sugerindo que esses genes empregam um mecanismo diferente de recrutamento de mediador e escape de promotor. Os fatores gerais de transcrição de genes codificadores de proteínas TFIIA, TFIIB, TFIIE, TFIIF e TFIIH também são necessários para a transcrição de genes de snRNA [30,31]. A Figura 2 indica quais fatores são compartilhados entre genes snRNA e genes codificadores de proteínas e quais são específicos para cada classe de gene. Conforme observado acima, o DSE e o PSE são intercambiáveis ​​entre os genes de snRNA transcritos de pol II e pol III [2]. No entanto, na presença de uma caixa TATA no promotor, um complexo contendo TBP específico para os genes de pol III e snRNA é recrutado [2].

Figura 2. Fatores que regulam a expressão de snRNA e genes codificadores de proteínas. Em azul estão os fatores que desempenham papéis no mesmo evento de transcrição nas duas classes de genes. Em rosa e amarelo estão os fatores exclusivos dos genes codificadores de proteínas e dos genes snRNA, respectivamente. Fatores que regulam ambos os genes, mas em etapas diferentes, são mostrados em roxo [22,24,26–55].

Há evidências de que um nucleossomo entre o DSE e o PSE nos genes U1, U2, 7SK e U6 snRNA aproxima essas duas regiões, facilitando a interação entre Oct1 e PTF [56-59]. Além disso, o PTF desempenha um papel na depleção de histonas da unidade de transcrição do gene U2 [32]. Assim, a estrutura da cromatina desempenha um papel na regulação da expressão de genes de snRNA humanos. A expressão do gene U6 snRNA transcrito de pol III é regulada pela interação de uma proteína envolvida na modificação da cromatina, a proteína de ligação cromodomínio-helicase-DNA 8 (CHD8), com Staf [60]. Como o CHD8 também demonstrou interagir com a forma de alongamento da pol II [60], ele também pode regular a transcrição de genes de snRNA transcritos da pol II.

4. Fosforilação do domínio do terminal carboxila Pol II e expressão do gene snRNA

A maior subunidade da pol II de mamífero tem um domínio carboxil terminal (CTD) compreendendo 52 repetições do heptapeptídeo Y de consenso1S2P3T4S5P6S7. Durante a transcrição, a fosforilação do CTD ajuda a recrutar fatores de transcrição e processamento de RNA no ponto certo do ciclo de transcrição [61].

Ser7 é fosforilado durante a transcrição de todos os genes humanos. No entanto, sua fosforilação parece ser essencial apenas para a expressão de genes snRNA [33]. Ser5 e Ser7 são ambos fosforilados pela subunidade quinase 7 dependente de ciclina (CDK7) de TFIIH logo após o início da transcrição [34] e fosfo-Ser7 (Ser7P) medeia o recrutamento da fosfatase RPAP2 fosfo-Ser5 (Ser5P) [62]. RPAP2 não apenas desfosforila Ser5P logo após o início da transcrição, mas também ajuda a recrutar subunidades Int1, Int4, Int5, Int6 e Int7 do grande complexo integrador multissubunidades [62]. O complexo integrador completo compreende 14 subunidades e é responsável pelo reconhecimento da caixa 3 ′ e clivagem do RNA que produz o pré-snRNA [35]. No entanto, a subunidade catalítica Int11 está ausente quando Integrator está associado a RPAP2 [62], e Int9 também está provavelmente ausente, pois interage fortemente com Int11 [63]. A subunidade da cinase CDK9 do fator de alongamento da transcrição positiva b (P-TEFb), que está envolvida na expressão de genes codificadores de proteínas e de genes snRNA, fosforila Ser2 (Ser2P) da CTD pol II [61] e Ser7 e a fosforilação de Ser2 em conjunto recrutam as subunidades ausentes Int9 / 11 para ativar o reconhecimento da caixa 3 'e o processamento da extremidade 3' do RNA [64]. Consequentemente, os inibidores de CDK9 têm um efeito drástico no processamento da extremidade 3 'dos ​​transcritos do gene snRNA [36]. Essa sequência de eventos é mostrada na figura 3.

Figura 3. Eventos de fosforilação de Pol II CTD na transcrição do gene snRNA. Inicialmente, a subunidade da quinase dependente de ciclina (CDK) 7 de TFIIH fosforila Ser5 e Ser7. RPAP2 interage com Ser7P. RPAP2, por sua vez, recruta as subunidades Integrator Int1, Int4, Int5, Int6 e Int7. O RPAP2 desfosforila Ser5P, e o fator de alongamento da transcrição positiva b (P-TEFb) é recrutado por um mecanismo ainda desconhecido. O CDK9 da subunidade P-TEFb fosforila Ser2. A dupla fosforilação em Ser2 e Ser7 recruta Int9 / 11, o que permite que o processamento de RNA ocorra [62].

Ser2 também pode ser fosforilado por CDK12 [65,66] e o knockdown de CDK12 afeta a expressão do gene snRNA [67]. A fosforilação do fator indutor de sensibilidade a DRB (DSIF) e o fator de alongamento negativo (NELF) por P-TEFb também são necessários para o alongamento produtivo de genes que codificam proteínas [37,38,68]. No entanto, os inibidores de CDK9 têm pouco efeito na transcrição dos genes U1 e U2 [39].

Após o início da transcrição de genes codificadores de proteínas, a maquinaria de capeamento é recrutada para a extremidade 5 'do transcrito nascente e alostericamente ativada por Ser5P [69]. Como os transcritos do gene snRNA também são co-transcricionalmente limitados [70], é provável que o Ser5P também garanta o capeamento de pré-snRNAs.

5. O papel do mediador na expressão de genes snRNA

A associação do grande complexo mediador de 26 subunidades com genes codificadores de proteínas foi bem estudada. Este complexo é recrutado para o complexo de pré-iniciação (PIC) e pode se ligar a vários fatores de transcrição ao mesmo tempo. O mediador tem um papel importante como plataforma de ligação para interação entre os fatores de transcrição ligados a sequências em promotores de genes codificadores de proteínas e pol II [40].

O complexo Mediator é composto por módulos, sendo que o módulo principal compreende as subunidades Med6, Med8, Med11, Med17, Med18, Med20 e Med22 [71]. O módulo principal é responsável pela interação com o pol II CTD através do Med17 [72]. Med17 é uma subunidade no 'nariz' do módulo da cabeça, enquanto Med18 e Med20 estão localizados na 'mandíbula'. Prevê-se que uma mutação na hélice alfa de Med18 fortaleça a interação entre a mandíbula e o resto do módulo. A mandíbula é, portanto, considerada o elemento móvel que regula a ligação ao pol II CTD [71]. Essa flexibilidade também pode ter um papel nas interações entre o Mediador e a pol II e também entre o Mediador e os fatores de transcrição, como TFIIH [73] e TBP [74].

A associação de subunidades mediadoras com genes snRNA só foi descrita pela primeira vez recentemente. Med1, Med23 e Med26 estão associados a um subconjunto de genes snRNA (U1, U4 e U5) e em níveis significativamente mais elevados do que na região promotora de alguns genes codificadores de proteínas [29]. No entanto, os experimentos ChIP não definiram a região dos genes snRNA associados ao Mediador. Med26 é necessário para a expressão dos genes U1, U2, U4, U5 e U11 [29] e é essencial para o recrutamento do complexo de pequeno alongamento (LEC) [29]. Curiosamente, Med26 também interage com TAF7, que reprime a iniciação e bloqueia o recrutamento de LEC. Além disso, o TAF7 tem semelhanças de sequência de proteínas com o EAF, que faz parte do LEC. Consequentemente, foi sugerido que o EAF poderia arrebatar o Med26 do TAF7 para facilitar o alongamento [29]. Med26 pode, portanto, atuar como um interruptor molecular desencadeando o alongamento após o escape do promotor, pelo menos para os genes snRNA onde TAF7 é recrutado.

6. O pequeno complexo de alongamento e alongamento da transcrição

A expressão do gene é regulada não apenas no início da transcrição, mas também durante o alongamento. Pol II faz uma pausa logo após o início da transcrição de genes codificadores de proteínas em um ponto de verificação de alongamento precoce (EEC) devido aos fatores de alongamento negativos, NELF e DSIF. A fosforilação da pol II CTD, NELF e DSIF pela subunidade CDK9 de P-TEFb libera a pol II do EEC para permitir o alongamento produtivo [68]. Um complexo denominado complexo de super alongamento (SEC) compreendendo o fator de alongamento ELL, AFF1, AFF4, AF9, ENL e P-TEFb está envolvido no alongamento produtivo da transcrição de genes codificadores de proteínas [41].

Em vez da SEC, outro complexo contendo ELL regula especificamente o alongamento da transcrição de genes de snRNA transcritos de pol II. Este LEC compreende ELL, ICE1, ECE2, EAF e ZC3H8 [42]. Foi sugerido que ICE1, ICE2, ELL e EAF são recrutados para o promotor pelo complexo Mediador [29]. O ICE1 mostrou ser o andaime para a formação de LEC e é essencial para o recrutamento dos outros componentes. ELL interage com o domínio ICE1 N-terminal, enquanto ICE2 e ZC3H8 interagem com o domínio ICE1 C-terminal. Além disso, o ICE1 é necessário para o recrutamento da Pol II [42]. O knockdown de ELL muda a distribuição de pol II em genes de snRNA em direção à extremidade 5 ', como esperado de um fator que facilita o alongamento da transcrição [75]. Foi sugerido que o ELL é necessário para garantir um alto nível de transcrição de genes de snRNA [75]. A função das subunidades ICE2 e ZC3H8 é atualmente desconhecida.

Foi demonstrado que o LEC se co-localiza com a coilina [42], que é encontrada nos corpos de Cajal, onde ocorre a maturação de pequenas ribonucleoproteínas nucleares (snRNP) [6]. ICE1 recruta outra proteína, USPL1, para os corpos de Cajal. USPL1 também interage com U1 e U2 snRNPs e seu knockdown causa uma redução nos níveis de snRNA [43]. No entanto, o mecanismo molecular subjacente ao efeito do knockdown de USPL1 não é claro.

Mais recentemente, foi demonstrado que o 7SK snRNP, compreendendo 7SK RNA, MePCE e Larp7, desempenha um papel no recrutamento do LEC para os genes snRNA. A destruição dos componentes 7SK RNP perturba a integridade do LEC, afeta o recrutamento da pol II e reduz a expressão dos genes snRNA [76]. Este foi um achado surpreendente, pois o 7SK RNP é um regulador negativo do complexo CTD Ser2 quinase P-TEFb [68].

7. O complexo integrador e os genes snRNA

O complexo do integrador foi descoberto mais recentemente do que o mediador. Está presente apenas em metazoários e é um grande complexo de 14 subunidades e é necessário para o processamento da extremidade 3 'de pré-snRNAs transcritos da pol II em humanos e moscas [33,35,44].

O integrador é capaz de ligar o pol II CTD fosforilado em Ser2 e Ser7 [64]. No entanto, ainda não está claro quais subunidades estão envolvidas no reconhecimento de Ser2P e Ser7P. Int11 é um parálogo do CPSF-73, que é responsável pela clivagem de RNA dirigida por sítios poli (A) e o sinal de processamento de RNA nos pré-mRNAs de histona ativada por replicação [77]. O esgotamento de Int11 causa o acúmulo de snRNAs pré-U1 e pré-U2 [32,35], o que está de acordo com o papel catalítico esperado dessa subunidade.

Até agora, as subunidades do integrador não foram encontradas para interagir diretamente com a cromatina. No entanto, a subunidade Int12 tem um domínio PHD (homeodomínio da planta), que é um motivo comum de ligação à cromatina que reconhece histonas metiladas [78]. As subunidades Int3 e Int6 também fazem parte de outro complexo envolvido na detecção de quebras de fita dupla de DNA, denominado sensor de DNA de fita simples (SOSS) [79-83]. Como os genes snRNA são altamente expressos e pelo menos o gene U2 snRNA está esgotado de histonas canônicas [45], foi sugerido que essas subunidades integradoras poderiam ajudar a prevenir danos ao DNA que são facilitados por um estado de cromatina constitutivamente aberto [84].

Int5 é encontrado associado com a região promotora do gene snRNA e a 3 ′ box, enquanto Int11 está associado principalmente com a 3 ′ box [62]. O integrador pode, portanto, ser um complexo modular que se monta de maneira gradual, com algumas subunidades desempenhando um papel no início da transcrição, enquanto outras são ativas no processamento da extremidade 3 'do RNA.

Foi demonstrado que Int4 interage com NELF-A e Int6 interage com a subunidade Spt5 de DSIF [46]. Na expressão de genes de snRNAs, o DSIF foi proposto para se ligar à pol II antes do alongamento da transcrição [46]. O integrador pode, portanto, ser recrutado por fosforilação pol II CTD e por associação com DSIF.O recrutamento de NELF por meio da interação com o RNA e o integrador pode contribuir para o reconhecimento específico da caixa 3 ′, evitando o recrutamento do fator de poliadenilação do fator estimulador de clivagem (CstF) [46]. Esses eventos permitiriam ao Integrador processar adequadamente a transcrição do snRNA nascente [46].

Até recentemente, o Integrator era considerado um complexo de processamento específico de snRNA, mas agora foi demonstrado que também regula a expressão de genes codificadores de proteínas [47-49]. A expressão dos genes iniciais imediatos (IEGs) ativados pelo fator de crescimento epidérmico (EGF) é regulada pela pausa antes do alongamento e esta pausa é superada pela indução de EGF. A indução do EGF regula o recrutamento do Integrador, que por sua vez recruta a SEC [47]. O integrador também desempenha um papel na liberação da pausa mediada por NELF durante a transcrição de genes humanos e do genoma do HIV [48,49]. Curiosamente, os genes humanos direcionados pelo Integrator possuem sequências semelhantes a 3 'box perto do final dos genes e mostram uma diminuição nos níveis de transcrição após o knockdown de Int11, sugerindo que Int11 também está envolvido na produção de mRNA [48]. O integrador, portanto, parece desempenhar papéis importantes na expressão de genes codificadores de proteínas.

8. A caixa 3 'e a terminação da transcrição de genes snRNA

A caixa 3 'é um sinal para o processamento dos transcritos de snRNA nascentes e a pol II continua a transcrever por algumas centenas de pares de bases além da caixa 3' antes que a transcrição seja encerrada [39]. Como já mencionado, o Integrator liga DSIF, NELF e pol II, reconhece o sinal da caixa 3 ′ no RNA e processa a transcrição nascente. A formação da extremidade pré-snRNA 3 ′ e a terminação da transcrição de pol II nos genes snRNA está intrinsecamente ligada, conforme demonstrado por um estudo recente em que o knockdown das subunidades catalíticas Int9 e Int11 causou defeitos de terminação [32]. A NELF também está envolvida na rescisão. Ele se acumula a jusante da caixa 3 'do gene U2 snRNA e seu knockdown também causa um defeito de terminação [45]. Um sítio de ligação de CTCF está localizado próximo à região de associação NELF e delimita uma região de depleção de nucleossomo que abrange a unidade de transcrição [45]. O CTCF é mais conhecido como um fator de transcrição para genes codificadores de proteínas por meio de sua ação como isolante e organizador da estrutura da cromatina [85]. Foi demonstrado que o CTCF posiciona os nucleossomos e impede o alongamento da pol II [50,86]. Agindo desta forma, o CTCF pode controlar a estrutura da cromatina e provocar a terminação da transcrição. Os genes U2 snRNA podem, portanto, ter um ponto de verificação de alongamento "tardio" em que os nucleossomos posicionados no CTCF diminuem a pol II, permitindo que o NELF termine a transcrição [45].

De acordo com esses achados, um estudo mais recente implica o CTCF no recrutamento de DSIF, NELF e P-TEFb para o gene U2 snRNA [51]. Os resultados sugerem um modelo que liga a terminação da transcrição ao reconhecimento da caixa 3 '. Neste modelo, o NELF é necessário para a terminação da transcrição, uma vez que seu knockdown resulta em defeitos de terminação sem afetar o recrutamento de CTCF ou a formação da extremidade do RNA 3 '. Além disso, o P-TEFb fosforila o pol II CTD em Ser2, levando ao recrutamento de subunidades integradoras 9/11, que podem desencadear o processamento de RNA conduzido pela caixa 3 ′ [51]. Este modelo explicaria como a terminação da transcrição e o processamento de RNA estão intimamente ligados durante a expressão de genes de snRNA (figura 4).

Figura 4. Modelo para terminação da transcrição do gene U2 snRNA. O transcrito do snRNA é representado em verde com a tampa na extremidade 5 'e os nucleossomos são representados por barris. Pol II continua a transcrever após a caixa 3 ′ e o Integrador processa o RNA nascente após o reconhecimento da caixa 3 ′. O CTCF reconhece o local de ligação do CTCF a jusante da caixa 3 'e controla a ocupação do nucleossomo. O fator de alongamento negativo (NELF) é recrutado pelo fator indutor de sensibilidade DRB (DSIF) e CTCF no final da unidade de transcrição e causa a terminação da transcrição [51].

Curiosamente, os fatores de processamento da extremidade 3 'do mRNA Pcf11, Ssu72 e Cstf64 também se associam com os genes dos snRNAs [32]. No entanto, foi demonstrado que Pcf11 e Ssu72 afetam a terminação da transcrição de genes de snRNA em vez do processamento da extremidade 3 '.

9. Acoplamento de iniciação e formação de extremidade de RNA 3 '

A caixa 3 'só é reconhecida se a transcrição for iniciada a partir de um promotor do gene snRNA dependente de pol II [15,20]. Se o PSE for substituído por um promotor de gene codificador de proteína, os transcritos tornam-se mais longos à medida que o sinal da caixa 3 'é ignorado e a pol II transcreve até que um local de poliadenilação funcional seja alcançado [87]. O mecanismo subjacente ao acoplamento da iniciação da transcrição e da formação da extremidade do RNA 3 'ainda não é compreendido, mas pode envolver o fator promotor específico do gene snRNA PTF ou os componentes específicos dos genes snRNA do LEC. Alternativamente, o reconhecimento da caixa 3 ′ só pode ocorrer na ausência de recrutamento da SEC.

10. Pseudogenes de snRNA e genes de snRNA variantes

Com exceção de teleósteos e pássaros, todos os metazoários estudados até agora têm pseudogenes derivados de genes snRNA, com mamíferos possuindo um grande número [19]. Algumas sequências no genoma humano que foram previamente pensadas como pseudogenes U1 snRNA mostraram ser genes verdadeiros que têm sequências DSE, PSE e 3 ′ box reconhecíveis e são ativamente transcritas [17]. Esses genes foram denominados genes variantes (v) U1 [17,88]. As sequências DSE, PSE e 3 'box dos genes vU1 snRNA são, no entanto, suficientemente diferentes das sequências do gene U1 snRNA para sugerir que são reguladas diferencialmente. Curiosamente, os snRNAs de vU1 parecem ser mais altamente expressos em células-tronco embrionárias [17]. U1b é um gene variante de U1 de camundongo expresso apenas em estágios embrionários iniciais, embora os snRNAs U1 e U1b difiram por apenas sete mudanças de base [89,90]. No entanto, o promotor de U1b difere significativamente daquele de U1 [90]. Embora a função do U1b ainda não esteja clara, existem paralelos claros entre o U1b do camundongo e os snRNAs do vU1 humano.

Variantes U5 snRNA em humanos e Drosófila também foram descritos [91,92]. As variantes formam diferentes complexos snRNP funcionais do snRNP U5 canônico e são pensados ​​para desempenhar papéis no splicing [91]. Curiosamente, as variantes U5 são expressas diferencialmente durante o desenvolvimento e podem promover o splicing específico do tecido [92].

11. Conclusão

O papel dos fatores gerais de transcrição, da fosforilação de CTD e do complexo integrador na expressão de genes de snRNA foi bem caracterizado nas últimas duas décadas. A elucidação recente dos papéis de DSIF, CTCF e NELF na expressão de genes de snRNA sugere como o processamento de 3 'final de transcritos de snRNA está ligado à terminação da transcrição. Além disso, foi demonstrado que os fatores de processamento da extremidade 3 'do mRNA, como Pcf11 e Ssu72, estão envolvidos na terminação da transcrição de genes de snRNA. Podemos agora avaliar que existem muitos fatores de transcrição compartilhados por genes codificadores de proteínas e genes de snRNA, embora alguns desempenhem papéis distintos na expressão dos dois tipos de genes (figura 2).

Apesar de todas essas novas informações, ainda existem alguns aspectos importantes da expressão de genes de snRNA transcritos da pol II que ainda precisam ser elucidados. Por exemplo, como a iniciação da transcrição desses genes está tão fortemente acoplada à formação da extremidade 3 'dos ​​transcritos? Por que a expressão do gene U2 snRNA seria regulada por mecanismos diferentes dos genes U1, U4 e U5 snRNA? Por que os genes snRNA requerem um complexo de elongação específico que é recrutado por um RNA não codificador? O complexo mediador nos genes snRNA difere daquele nos genes codificadores de proteínas? E por que a proteína transativadora de herpesevírus VP16 apenas ativa a transcrição de genes codificadores de proteínas e não de genes de snRNA [93] quando a ativação ocorre por meio da interação com TAF9 [94] e TFIIA [95]? No entanto, o VP16 também interage com Med25 [96] e atualmente não está claro se ele é recrutado para genes snRNA.

Esperançosamente, pesquisas futuras fornecerão as respostas necessárias para um entendimento completo da regulação da expressão desta importante classe de genes transcritos da pol II.

Interesses competitivos

Declaramos que não temos interesses conflitantes.

Financiamento

J.G. foi apoiado por uma bolsa Ciência sem Fronteiras do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) (201323 / 2015-0) do Governo Brasileiro. S.M. foi apoiado por um prêmio Wellcome Trust Senior Investigator (WT106134AIA).


Posições de líder de grupo

O Instituto Europeu de Química e Biologia, Institut Européen de Chimie et Biologie (IECB, www.iecb.u-bordeaux.fr) é uma incubadora de equipes de pesquisa sob a tutela conjunta da Universidade de Bordeaux, CNRS e INSERM. Ele se beneficia do ambiente científico eficaz do campus de Bordeaux, no sudoeste da França. O período de incubação da equipe é normalmente de 10 anos, e as equipes são selecionadas por um Conselho Consultivo Científico internacional. O Instituto atualmente hospeda 14 grupos de pesquisa desenvolvendo seus projetos de pesquisa na interface da química e biologia. O IECB está em busca de candidatos sólidos para posições de liderança de grupo, com prioridade para os seguintes perfis:

Um ou dois BIÓLOGOS CELULARES interessado nas bases moleculares de, por exemplo, ciclo celular, morte celular, regulação da proliferação, regulação da expressão gênica, câncer, imunologia, microbiologia ...

Um QUÍMICO ORGÂNICO SINTÉTICO interessado em áreas como, por exemplo, biologia química, design de drogas, materiais bioinspirados e catálise, química supramolecular, miméticos de proteínas, oligonucleotídeos sintéticos ...

Candidatos com outros perfis e projetos criativos na interface entre química e biologia também podem se inscrever. Será dada prioridade à originalidade do projeto e ao interesse em desenvolver colaborações interdisciplinares com outros grupos do Instituto e outros laboratórios do campus de Bordéus. No campo da biologia celular do câncer, os candidatos interessados ​​em sarcoma, câncer de rim ou mama se beneficiariam com o acesso facilitado a amostras clínicas.

Os líderes do grupo terão total autonomia para gerenciar seu grupo de pesquisa. Eles terão acesso às instalações do IECB em biologia estrutural, química estrutural e biofísica (NMR, MS, crio-EM, cristalografia, síntese de peptídeos e produção de proteínas, SPR, ...). Espera-se que os candidatos estejam em um estágio inicial de sua carreira de pesquisa (com 2 a 10 anos de experiência de pós-doutorado), embora aplicações seniores de alta qualidade também sejam consideradas. Os candidatos selecionados serão solicitados a se candidatar a financiamento inicial, como o programa ATIP -Avenir, FRM “amorçage”, apoio ANR ou ERC, e serão apoiados para garantir uma posição permanente de pesquisa na França, caso ainda não ocupem um. . Os candidatos devem ser fluentes em inglês. Conhecimento de francês não é obrigatório.

Os candidatos são convidados a se inscrever antes de 1 ° de julho de 2021:

  • uma carta de apresentação
  • um biosketch estendido que descreve sua experiência e até cinco realizações principais (máx. 5 páginas)
  • uma proposta de pesquisa (máx. 5 páginas)
  • um CV completo
  • Nomes e contatos de 2-4 árbitros


Papel da acetilação de histonas e acetiltransferases na regulação gênica

Christina Y. Lee, Patrick A. Grant, em Toxicoepigenética, 2019

Conclusão e Perspectivas

A acetilação e desacetilação da histona são críticas para vários processos celulares, incluindo a montagem do nucleossomo, dobramento da cromatina, reparo de danos no DNA e transcrição adequada. Além disso, a regulação da acetilação e desacetilação das histonas desempenha um papel central na etiologia da doença e nos efeitos adversos das exposições químicas. Muitas dessas patologias surgem da desregulação da acetilação das histonas por HATs, mas também deve-se observar que as HATs não se limitam apenas aos substratos de histonas. Fatores de transcrição são substratos adicionais para a acetilação de HAT, como Smads, p53 e NF-κB (Tu e Luo, 2007 Gu e Roeder, 1997 Pejanovic et al., 2012). A acetilação desses fatores de transcrição dita a capacidade de ligação ao DNA, a localização nuclear, a estabilidade da proteína e as interações com outros reguladores da transcrição. A importância da acetilação e desacetilação das histonas nessas várias patologias levou a um foco combinado em HATs, HDACs e proteínas “leitoras” contendo bromodomínio como alvos para intervenção terapêutica. Atualmente, os inibidores de HDAC são usados ​​para tratar câncer, inflamação e diversos distúrbios neurológicos (ver revisão, Zwergel et al., 2016 Adcock, 2007 Didonna e Opal, 2015). Proteínas de bromodomínio também surgiram como alvos de drogas que podem ser inibidas com alta especificidade em doenças humanas como HIV-1 e isquemia miocárdica (Zeng et al., 2005 Mujtaba et al., 2006 Gerona-Navarro et al., 2011). O direcionamento de HATs tem sido mais difícil, pois são enzimas bissubstrato e mais desafiadoras para direcionar devido ao tamanho, estabilidade metabólica pobre e a falta de permeabilidade celular de inibidores de bissubstrato (Wapenaar e Dekker, 2016). Os inibidores de pequenas moléculas de HATs também exibiram amplamente uma seletividade de alvo pobre. Ao todo, ainda há muito a aprender sobre como a acetilação / desacetilação das histonas modula a transcrição do gene, a resposta a agentes ambientais e, em última instância, a doença. Uma caracterização cuidadosa das enzimas HAT e HDAC permitirá o desenvolvimento contínuo de moduladores potentes e seletivos de acetilação de histonas que ajudarão a avançar ainda mais em nossa compreensão dos mecanismos subjacentes aos efeitos e suscetibilidade da exposição química e ao desenvolvimento de novas intervenções terapêuticas.


2.10: Regulação da Expressão Gênica - Biologia

Todos os artigos publicados pela MDPI são disponibilizados imediatamente em todo o mundo sob uma licença de acesso aberto. Nenhuma permissão especial é necessária para reutilizar todo ou parte do artigo publicado pela MDPI, incluindo figuras e tabelas. Para artigos publicados sob uma licença Creative Common CC BY de acesso aberto, qualquer parte do artigo pode ser reutilizada sem permissão, desde que o artigo original seja claramente citado.

Os artigos de destaque representam a pesquisa mais avançada com potencial significativo de alto impacto no campo. Artigos de destaque são submetidos a convite individual ou recomendação dos editores científicos e passam por revisão por pares antes da publicação.

O Artigo pode ser um artigo de pesquisa original, um estudo de pesquisa substancial que frequentemente envolve várias técnicas ou abordagens, ou um artigo de revisão abrangente com atualizações concisas e precisas sobre os últimos avanços no campo que revisa sistematicamente os avanços mais interessantes na área científica literatura. Este tipo de papel fornece uma perspectiva sobre as futuras direções de pesquisa ou possíveis aplicações.

Os artigos do Editor’s Choice são baseados nas recomendações dos editores científicos de periódicos MDPI de todo o mundo. Os editores selecionam um pequeno número de artigos publicados recentemente na revista que eles acreditam ser particularmente interessantes para os autores ou importantes neste campo. O objetivo é fornecer um instantâneo de alguns dos trabalhos mais interessantes publicados nas várias áreas de pesquisa da revista.


Discussão

Revisamos sistematicamente a literatura revisada por pares sobre o papel da modificação epigenética na etiologia do humor comum, transtornos de ansiedade e suicídio. Vinte e um artigos foram publicados entre 2001, a publicação do projeto do genoma humano e 2011. A maioria (12) dos estudos que encontramos estavam preocupados com a evidência de mudanças epigenéticas nos cérebros post-mortem de suicidas, com outros estudos considerando fatores epigenéticos na etiologia da depressão, PTSD e transtorno do pânico. Uma pluralidade focada na regulação epigenética de genes envolvidos no metabolismo de amina, glicocorticóide e serotonina na produção de transtornos de ansiedade e humor comuns e estudos de suicídio também consideraram a modificação epigenética de uma gama diversa de outros genes.

Dado o pequeno número de estudos, tirar conclusões substantivas sobre como as modificações epigenéticas em genes específicos podem estar operando na etiologia das doenças em questão não é possível neste estágio. Nossa revisão ocasiona uma síntese das limitações metodológicas da literatura existente e recomendações sobre como os investigadores podem melhor abordar esta área em estudos futuros.

Cinco limitações metodológicas para esta literatura emergem de nossa revisão. A primeira é que os estudos nesta área sofreram com tamanhos de amostra pequenos, as consequências dos quais incluem falta de poder e aumento das taxas de descobertas falsas. Em segundo lugar, os estudos existentes têm se limitado a avaliar a modificação epigenética no cérebro post-mortem ou no sangue periférico após o diagnóstico da doença, e inferir de qualquer tipo de tecido é problemático. Terceiro, os estudos usaram diferentes técnicas para avaliar as modificações epigenéticas que podem produzir resultados heterogêneos. Quarto, poucos estudos avaliaram antecedentes ambientais para modificações epigenéticas em estudos existentes. Quinto, parece haver pouco consenso em relação às abordagens do genoma em relação ao gene candidato.

A primeira limitação metodológica desta literatura é o uso de tamanhos de amostra pequenos na maioria dos estudos, um problema onipresente na epidemiologia molecular [33]. Dos estudos que revisamos, apenas um incluiu mais de cinquenta casos (por exemplo, indivíduos com o resultado). Combinando pequenos tamanhos de amostra em estudos gerais, muitos dos estudos que revisamos limitaram a análise epigenética a um subconjunto da população total do estudo. Os tamanhos de amostra pequenos limitam o poder do estudo, aumentando, portanto, a probabilidade de erro do tipo II (por exemplo, a proporção de resultados falsos negativos) [33]. Mais perigosamente, estudos insuficientes também aumentam a "taxa de descoberta falsa" ou o número de descobertas significativas que se enquadram no erro tipo I (por exemplo, a proporção de descobertas falsas positivas), conforme demonstrado na Equação 1 [34-36].

^ “Anterior” indica a proporção de hipóteses testadas que estão realmente corretas.

Nessa equação, a taxa de descoberta falsa (FDR) é inversamente proporcional à potência (1-beta), de modo que a baixa potência também produz um FDR alto, levando ao erro Tipo I. Portanto, dados os pequenos tamanhos de amostra empregados na maioria dos estudos que revisamos, é provável que os achados sofram de altas proporções de erros do tipo I e do tipo II.

Uma segunda limitação é o uso de cérebro post-mortem ou tecidos de células periféricas para análises epigenéticas. Sete dos 21 estudos que revisamos analisaram a modificação epigenética nas células do sangue periférico e um estudo analisou a modificação epigenética na mucosa bucal. Embora todas as células humanas carreguem a dotação completa de material genético, as células modificam a expressão gênica para realizar com eficiência suas diversas funções à medida que se especializam, silenciando alguns genes enquanto ativam outros de acordo com suas responsabilidades fisiológicas. A modificação epigenética é o processo fisiológico pelo qual os genes são silenciados ou preparados para a expressão [37, 38].A fisiopatologia dos transtornos de ansiedade e humor e do suicídio está localizada no cérebro e, portanto, permanece obscuro como a expressão gênica em tecidos periféricos se correlaciona com a expressão gênica fisiologicamente significativa no cérebro. No entanto, mesmo os estudos epigenéticos usando tecido cerebral post-mortem apresentam desafios. Três dos 21 estudos que revisamos analisaram o tecido cerebral post-mortem. Embora esses estudos avaliem as mudanças epigenéticas no órgão apropriado, a avaliação do tecido cerebral post-mortem traz seus próprios desafios. Isso é problemático no que diz respeito à temporalidade entre a exposição e o resultado, porque os cérebros post-mortem, por definição, só podem ser colhidos após a morte e, portanto, a modificação epigenética só pode ser verificada após a ocorrência do resultado. Além disso, a morte frequentemente envolve acidose, o que pode contribuir para a instabilidade do material genético [39-41], aumentando a probabilidade de classificação incorreta da modificação epigenética e aumentando as chances de achados espúrios. Portanto, muito mais trabalho é necessário para nos ajudar a entender o significado fisiológico dos tecidos periféricos e dos padrões de metilação do cérebro.

Uma terceira limitação da literatura é que os estudos publicados usaram diferentes técnicas de laboratório para medir o grau de modificação epigenética. Com relação à metilação de DNA sozinha, há uma série de ensaios específicos de gene atualmente em uso, incluindo métodos de sequenciamento de DNA baseados em reação de bissulfito, que incluem PCR de sequenciamento genômico de bissulfito [42] e / ou PCR específico de metilação [43] telas de genoma , como CpG island microarrays [44] e técnicas de Restriction Landmark Genomic Scanning for Methylation (RLGS-M) [45] e imunoprecipitação de DNA metilado (MeDIP) [46]. Existem poucos estudos que compararam a sensibilidade e especificidade de cada método, embora um estudo recente comparou dois ensaios baseados em sequência de bissulfito (que são muito semelhantes) frente a frente e encontrou uma diferença de até 18% na identificação de metilação Ilhas CpG em réplicas biológicas de células-tronco embrionárias humanas [47]. Até onde sabemos, não existem ensaios de “padrão ouro” para a maioria dos marcadores epigenéticos. Portanto, o uso diferencial de ensaios pode apresentar uma fonte de viés de classificação incorreta nos estudos, o que acabaria aumentando a taxa de erro do tipo II na literatura existente.

Em quarto lugar, os estudos em nossa revisão falharam amplamente em avaliar as exposições ambientais que se pensava produzir mudanças epigenéticas para começar. Apenas três dos 21 estudos revisados ​​aqui incluíram qualquer avaliação de um estressor ambiental comum com respeito a modificações epigenéticas e sua relação com transtornos comuns de humor e ansiedade e suicídio [14, 19, 20]. Esta é uma limitação importante, pois há amplos dados que demonstram a importância dos estressores ambientais na etiologia desses distúrbios [48]. Sem avaliar os estressores ambientais comuns que antecedem as modificações epigenéticas, nossos estudos falham em testar adequadamente as hipóteses dominantes sobre o papel mediador das mudanças epigenéticas entre ambientes e resultados em transtornos comuns de humor e ansiedade e suicídio.

A quinta limitação é a falta de consenso em relação às abordagens do genoma versus o gene candidato em estudos epigenéticos. Três dos estudos que revisamos usaram abordagens de todo o genoma [12, 30, 32], enquanto os 18 estudos restantes avaliaram as modificações epigenéticas de genes candidatos. Ambas as abordagens têm limitações. Com relação aos estudos de todo o genoma, as análises (e descobertas) são freqüentemente desfocadas. Ao contrário dos estudos de associação do genoma, não há um método acordado para análise e síntese de dados ou para ajuste para comparações múltiplas em estudos epigenéticos do genoma. Em particular, o ajuste apropriado para comparações múltiplas pode ser problemático, aumentando a proporção de resultados falso-positivos [49]. As abordagens do gene candidato se beneficiam por serem orientadas por hipóteses e, portanto, mais receptivas a projetos de estudo bem pensados ​​e baseados em modelos. No entanto, as abordagens de genes candidatos enfrentam suas próprias limitações. Estudos de genes candidatos têm maior probabilidade de produzir resultados negativos gerais, pois esses estudos testam apenas uma hipótese, em comparação com estudos de genoma que testam hipóteses mais globais sobre o papel da modificação epigenética em qualquer lugar no genoma, influenciando o risco para resultados de interesse. Como as abordagens do gene candidato têm maior probabilidade de produzir resultados gerais negativos, há uma alta probabilidade de viés de publicação, pelo que a literatura sobre a modificação epigenética do gene candidato provavelmente será altamente enriquecida em resultados positivos [35].

Limitações da revisão

O leitor deve estar ciente de várias limitações ao considerar os achados de nossa revisão sistemática. Em primeiro lugar, limitamos nossa revisão à literatura revisada por pares publicada. Portanto, é plausível que nossa seleção de estudos possa ter sofrido um viés de publicação, afetando a veracidade de nossas inferências. Em segundo lugar, organizamos os estudos por resultado. Este esquema organizacional também pode ter, em parte, moldado as inferências feitas aqui. No entanto, como limitamos nossas inferências em grande parte às críticas metodológicas da literatura, é improvável que qualquer uma das limitações tenha tido uma influência substancial em nossa interpretação de nossos achados. Terceiro, nossa revisão foi limitada apenas à literatura em inglês publicada em periódicos indexados em duas bases de dados. É plausível que tenhamos perdido a literatura sobre epigenética em relação aos transtornos de humor e ansiedade comuns e suicídio publicada em outras línguas ou em periódicos que não foram indexados no MEDLINE ou PSYCHINFO. No entanto, isso é menos provável, pois uma busca detalhada das citações dos estudos incluídos não rendeu estudos adicionais para inclusão na revisão.


Discussão

Uma palavra de cautela.

o em sílico benchmarks apresentados aqui são baseados em redes com tipos semelhantes de propriedades estruturais e dinâmicas regulatórias que ocorrem em redes de genes biológicos. Em particular, as estruturas de rede correspondem a módulos de redes de genes conhecidas, e o modelo cinético é baseado em uma abordagem termodinâmica (24), que se mostrou fornecer uma boa aproximação para diferentes tipos de regulação da transcrição (30). No entanto, esta representação é um modelo simplificado de mecanismos biológicos reais. Além disso, camadas adicionais de controle, como regulação pós-transcricional e estados de cromatina, não são modeladas. Mesmo que estes em sílico benchmarks de forma alguma substituem a necessidade de caracterização cuidadosa do desempenho in vivo (12), eles permanecem uma ferramenta importante para validar de forma sistemática e eficiente o desempenho de métodos de inferência em muitas redes. Além disso, é provável que os métodos que não se saem bem nesses benchmarks possam se sair ainda pior com redes biológicas reais, conforme discutido em Texto SI.

Uma questão geral de benchmarks, seja em sílico ou in vivo, é que o desempenho medido dos métodos é sempre específico para as redes particulares que estavam sendo usadas e não necessariamente generaliza para outras redes desconhecidas, que podem ter propriedades diferentes. De fato, uma das principais conclusões deste estudo é que o desempenho dos métodos atuais de inferência de rede é fortemente dependente das propriedades da rede que está sendo inferida. Por exemplo, como se descobriu que os métodos têm perfis de erro de motivo de rede muito diferentes, seu desempenho depende de quantas instâncias de cada tipo de motivo estão presentes na rede.

Assim, o desempenho geral (pontuação) dos métodos de inferência deve ser considerado com cautela, pois pode variar em redes com propriedades diferentes. No entanto, espera-se que os erros sistemáticos identificados com a análise do motivo da rede sejam menos variantes em diferentes redes. Por exemplo, um método que falhou em distinguir a regulação direta da indireta (erro em cascata), deveria ter dificuldades semelhantes também em redes de genes biológicos.

A inferência de rede de genes confiável a partir de dados de expressão de genes continua sendo um problema não resolvido.

As duas maiores dificuldades na engenharia reversa da rede de genes são frequentemente consideradas como os dados limitados, que podem deixar o problema de inferência indeterminado (10), e a dificuldade de distinguir a regulação direta da indireta (o erro em cascata) (26). Uma série de abordagens foram desenvolvidas para superar essas dificuldades, por exemplo, correlação parcial (26) e outros métodos (6, 27) foram propostos para encontrar erros em cascata potenciais. No entanto, os resultados do experimento da comunidade relatado aqui chamam a atenção para dificuldades adicionais que devem ser superadas para uma inferência confiável de redes de genes.

Fornecemos mais e melhores dados do que os normalmente disponíveis em experimentos biológicos reais, mas o desempenho geral dos 29 métodos de inferência de rede aplicados não foi satisfatório. O método de melhor desempenho (29) funcionou muito bem, dado que se baseia possivelmente no modelo mais simples de todos os métodos de inferência aplicados (ver Texto SI) No entanto, não foi possível distinguir a regulação direta da indireta. Apesar dessa taxa de erro aumentada no motivo em cascata, ele teve um desempenho geral significativamente melhor do que outros métodos de última geração baseados em modelos mais avançados, probabilísticos ou dinâmicos. Embora alguns fossem mais robustos ao erro em cascata, eles foram fortemente afetados por outros erros sistemáticos, em particular o erro fan-in. Esperamos que esses erros sejam ainda mais pronunciados em aplicações biológicas reais, sugerindo que o desempenho dos métodos de inferência de rede de genes pode ter sido superestimado anteriormente devido à falta de benchmarks rigorosos e cegos.

Conclusão.

Apresentamos uma estrutura para avaliação crítica de desempenho de métodos de inferência de rede de genes. Essa estrutura nos permitiu comparar um grande número de métodos de inferência - aplicados independentemente por equipes diferentes - em várias redes de referência. Além da avaliação da precisão geral, avaliamos o desempenho dos métodos de inferência em motivos de rede individuais. Esta análise revelou que os métodos de inferência atuais são afetados, em vários graus, por três tipos de erros de predição sistemáticos: o erro de fan-out (predição incorreta de interações entre genes co-regulados), o erro de fan-in (predição imprecisa de regulação combinatória), e o erro em cascata (falha em distinguir a regulação direta da indireta). Distinguir entre regulação direta e indireta é uma dificuldade bem conhecida na inferência de rede (6, 26, 27), mas nunca foi avaliada quantitativamente. A análise do motivo da rede permite quantificar o quão bem essa dificuldade é resolvida por diferentes métodos. Além disso, revelou dois outros tipos de erros sistemáticos, o erro de fan-in e o erro de fan-out, que são igualmente importantes para a qualidade geral das previsões.

Uma das dificuldades que os participantes do desafio DREAM tiveram de enfrentar foi que não conheciam os detalhes do modelo cinético que foi usado para gerar os dados de expressão do gene. Essa dificuldade é ainda mais pronunciada em aplicações biológicas, onde os mecanismos e a cinética de regulação gênica subjacentes aos dados de expressão são mais complicados e também desconhecidos com antecedência. Conseqüentemente, os métodos de inferência são obrigados a fazer suposições simplificadoras. No entanto, foi demonstrado que suposições imprecisas induzem erros de previsão sistemáticos, que afetaram profundamente o desempenho dos métodos de inferência de rede aplicados (ver também Texto SI) Existe, portanto, a necessidade de desenvolver métodos de inferência que tenham um desempenho mais robusto, apesar da incerteza sobre o tipo de mecanismo (o “modelo”) subjacente aos dados. Mostramos que uma abordagem possível para atingir esse objetivo é combinar as previsões de métodos de inferência complementares para formar “previsões da comunidade” mais robustas e precisas. Estamos convencidos de que uma melhor compreensão das capacidades e limitações dos métodos de inferência existentes permitirá o desenvolvimento de abordagens exclusivas que, em última análise, tornarão realidade o SONHO de inferência precisa e de alto rendimento de redes de genes.


Regulação da expressão gênica do filamento intermediário

As proteínas de filamento intermediário (FI) estão presentes em praticamente todas as células e todos os tecidos de organismos superiores e sua expressão é altamente regulada durante diferentes estágios de crescimento, desenvolvimento e diferenciação celular. Este capítulo descreve um histórico geral e estudos sobre a regulação dos genes K5 e K14. Também apresenta procedimentos para a identificação dos cis elementos, testando a atividade de regulamentação cis elementos, e a identificação e análise dos fatores de transcrição que se ligam ao cis elementos A família de genes IF fornece um sistema modelo interessante para estudar os diversos processos de desenvolvimento e diferenciação em diferentes tipos de células. Em muitas dessas células, as proteínas IF fornecem não apenas uma estrutura mecânica, mas também estão envolvidas em muitos processos celulares dinâmicos. Embora muitas das regiões regulatórias para genes IF tenham sido identificadas, a maioria delas permanece inexplorada, portanto, estudos contínuos sobre a regulação da expressão do gene IF são importantes e devem levar a um melhor entendimento da regulação de propriedades importantes de uma célula. ou tecido, como destino, forma, desenvolvimento e diferenciação celular.


RESULTADOS

Mudanças na expressão gênica em macrófagos RAW 264.7 em resposta ao CpG-DNA

Nossos estudos anteriores indicam que CpG-DNA pode sinergizar com LPS para induzir a produção de TNF-α e NO de macrófagos RAW 264.6 [16, 17], sugerindo que CpG-DNA e LPS usam diferentes vias de sinalização para ativar a expressão gênica. Para analisar ainda mais as consequências globais da sinalização de CpG-DNA e LPS, realizamos estudos para determinar perfis de expressão gênica em macrófagos RAW 264,7 em resposta a CpG-DNA ou LPS usando tecnologia de microarray de oligonucleotídeo. Para monitorar alterações induzidas por CpG-DNA nos perfis de expressão gênica em macrófagos RAW 264.7, sondas de cRNA biotinilado foram preparadas usando RNA total isolado de macrófagos RAW 264.7 tratados por 6 h com meio de cultura sozinho, meio contendo 30 μg / ml ODN T3 contendo CpG , ou ODN C3 não contendo CpG. As sondas de cRNA foram então hibridizadas com os microarrays Mu11K do genoma murino que contêm mais de 11.000 genes completos e sequências EST em dois chips individuais. Após a hibridização, lavagem e varredura das matrizes, os dados fluorescentes foram coletados e convertidos em frequências gênicas (níveis de expressão), conforme descrito em Materiais e Métodos. As transcrições detectadas, chamadas “presentes”, foram exibidas em gráficos de dispersão bidimensionais com comparações típicas de dois arquivos de amostras de tratamento e controle. Como mostrado em Figura 1A, a expressão controle, não CpG-ODN C3 regulada positivamente (quadrados azuis) ou regulada negativamente (quadrados vermelhos) de apenas um número muito pequeno [26] de genes e a maioria das espécies de mRNA "presentes" (5184 genes em amostras triplicadas) permanece inalterado (quadrados verdes). Após a análise estatística, nenhum gene preencheu os critérios de seleção dupla de mais de duas vezes, e P & lt 0,05 (Tabela 1). Em contraste, o ODN T3 contendo CpG (Fig. 1B) modificou significativamente a expressão de um número relativamente maior de genes. De uma média de 5112 genes "presentes" em amostras triplicadas, 107 genes foram identificados como sendo induzidos mais do que o dobro e, após a edição, um total de 106 genes preencheram os critérios de seleção dupla de mais do que o dobro, e P & lt 0,05 (Tabela 1). Entre estes, 79 genes foram regulados positivamente. Estes incluíram 69 genes conhecidos (Tabela 2, destacados em rosa) que codificam citocinas, quimiocinas, receptores de superfície celular, fatores de transcrição, proteínas de sinalização intracelular, proteínas relacionadas à proliferação / diferenciação celular, enzimas e outros, bem como 10 ESTs cujos as sequências de comprimento total não puderam ser identificadas pela análise BLAST (dados não mostrados). Além dos genes regulados positivamente pelo CpG-DNA, três genes (Tabela 3, destacados em rosa) e um EST (não mostrado) foram identificados como sendo regulados negativamente pelo CpG-DNA em mais de duas vezes. Esses dados fornecem uma visão geral das mudanças nos padrões de expressão gênica a jusante da via de sinalização CpG-DNA (TLR9). Nossos dados também identificam pela primeira vez uma série de novos genes que são significativamente reprimidos em macrófagos após estimulação com CpG-DNA.

Expressão de genes em macrófagos não tratados com CpG-DNA, CpG-DNA e LPS. As frequências de genes (níveis de expressão de genes, ppm) em macrófagos RAW 264,7 tratados com não CpG-DNA (A), CpG-DNA (B) e LPS (C) foram plotadas contra as frequências de genes em macrófagos tratados com cultura meio sozinho. Cada quadrado representa um gene distinto. A proporção do y- valor do eixo para o x-o valor do eixo de cada quadrado é igual à indução de dobra de um determinado gene. Os quadrados (verdes) que caem nas diagonais são genes que não foram regulados para cima ou para baixo. Os quadrados azuis representam genes regulados positivamente, os quadrados vermelhos representam genes regulados negativamente e os quadrados amarelos representam genes apenas marginalmente reprimidos de acordo com o padrão duplo, mais do que duas vezes, e P & lt 0,05. Portanto, esses genes não foram incluídos para análise de dados neste relatório.

Não CpG 1 CpG-DNA 1 LPS 1
Duplo 26 279 749
P & lt 0,05 2 72 377 1277
Duas vezes + P & lt 0,05 0 107 511
Editado 3 0 83 263
  • 1 Expressão relativa aos controles de mídia.
  • 2 Teste t de Student, bicaudal com covariância desigual.
  • 3 Após a remoção de genes identificados como “ausentes” ou nomeados várias vezes nas matrizes.

Mudanças na expressão gênica em macrófagos RAW 264.7 em resposta ao LPS

O LPS de bactérias Gram-negativas é considerado por muitos investigadores como o protótipo do agente ativador de macrófagos. Em contraste com o CpG-DNA, que usa TLR9 para sinalização, o LPS enterobacteriano mostrou ser completamente dependente de TLR4. Era, portanto, de interesse relacionar a expressão de genes de macrófagos em resposta a CpG-DNA àqueles induzidos por LPS. Para monitorar as mudanças nos perfis de expressão gênica em macrófagos RAW 264.7 em resposta ao LPS, os macrófagos foram tratados com meio sozinho ou uma dose estimulante ideal de 100 ng / ml LPS por 6 h. O RNA total foi então isolado para análises de microarranjos essencialmente conforme descrito para a análise de genes induzidos por CpG-DNA. Como indicado na Figura 1C, LPS regulou para cima (quadrados azuis) e regulou para baixo (quadrados vermelhos) um número maior de genes do que CpG-DNA. De uma média de 4.947 genes detectados como "presentes" em amostras triplicadas, a expressão de 511 genes foi alterada em mais de duas vezes com P & lt 0,05. Após a edição, 263 genes foram identificados como sendo alterados mais do que duas vezes em resposta ao LPS (Tabela 1). Destes, 192 genes (Tabela 2) foram significativamente regulados positivamente e 71 genes (Tabela 3) foram regulados negativamente de forma significativa.Esses genes cuja expressão foi aumentada incluem 168 genes conhecidos e, como esperado, eles codificam um número significativo de citocinas, quimiocinas, receptores de superfície celular, fatores de transcrição, proteínas de sinalização intracelular, proteínas relacionadas à proliferação / diferenciação celular, enzimas e proteínas relacionadas (Tabela 2). Além disso, 24 genes foram regulados para cima, mas ainda não foram capazes de ser identificados pela análise BLAST (dados não mostrados). Dos 71 genes reprimidos por LPS, 52 são genes conhecidos, que codificam principalmente proteínas e enzimas relacionadas à proliferação / diferenciação celular (Tabela 3), e os 19 genes restantes são atualmente sequências EST não caracterizadas (não mostradas). Esses dados não apenas fornecem uma visão abrangente dos perfis de expressão gênica induzidos por LPS em macrófagos RAW 264.7, mas também identificam um número significativo de genes que são regulados negativamente por LPS.

Comparação de perfis de expressão gênica em macrófagos tratados com CpG-DNA e LPS

Como foi relatado que CpG-DNA e LPS usam receptores de superfície celular do sistema imune inato (TLR9 ​​e TLR4, respectivamente) que compartilham um alto grau de homologia [24], comparamos a seguir os perfis de expressão gênica em CpG-DNA - e macrófagos RAW 264.7 tratados com LPS com a expectativa de delinear a extensão em que CpG-DNA e LPS podem usar vias de sinalização semelhantes ou distintas que levam a alterações na expressão gênica. Todos os genes que foram modulados mais do que duas vezes em macrófagos tratados com CpG-DNA e LPS estão listados e alinhados nas Tabelas 2 e 3. Como mostrado na Tabela 2, todos os genes induzidos em macrófagos RAW 264,7 por CpG-DNA também foram induzido em grau semelhante ou maior por LPS (destacado em rosa). Além disso, todos os genes reprimidos pelo tratamento com CpG-DNA também foram regulados negativamente em um grau semelhante pelo tratamento com LPS (Tabela 3, destacada em rosa). Para ilustrar ainda mais essas descobertas, selecionamos aleatoriamente os genes dentro dos grupos funcionais "Quimiocina e citocina" e "Resposta imune" (Tabela 2) e traçamos os níveis médios de expressão desses genes no meio, não CpG-DNA, CpG -DNA- e macrófagos tratados com LPS em Figura 2Ae 2B. Todos os genes induzidos por CpG-DNA também foram induzidos em uma extensão semelhante ou maior por LPS (ver os genes nas porções esquerdas da Fig. 2A e 2B). Esses dados indicam que, em comparação com o LPS, o CpG-DNA não induz nenhum conjunto único de genes. Os genes induzíveis por CpG-DNA compreendem apenas um subconjunto de genes estimulados por LPS, sugerindo que a sinalização de CpG-DNA envolve apenas um subconjunto de vias de sinalização induzidas por LPS.

Comparação dos níveis de expressão de genes em macrófagos tratados com CpG-DNA e LPS. Os níveis de expressão dos genes dos grupos funcionais "Quimiocina e citocina" (A) e "Resposta imune" (B) (Tabela 2) em macrófagos tratados com CpG-DNA foram plotados juntamente com os níveis de expressão desses mesmos genes no meio- , não-CpG-DNA e macrófagos tratados com LPS. Os dados representam os níveis de expressão médios de amostras em triplicado ± desvios padrão de uma das duas análises separadas. CSF, fator estimulador de colônias.

Alterações de expressão gênica específica de LPS em macrófagos RAW 264.7

Para confirmar ainda que o LPS usa vias de sinalização distintas em comparação com o CpG-DNA, identificamos os genes que foram induzidos ou reprimidos por LPS, mas não mudaram significativamente pelo tratamento com CpG-DNA. Esses genes foram listados nas Tabelas 2 e 3 e destacados em verde claro. Entre os 193 genes induzidos por LPS, 109 genes não foram significativamente suprimidos por CpG-DNA (Tabela 2, destacada em verde claro) dos 71 genes reprimidos por LPS, 67 genes não foram significativamente reprimidos por CpG-DNA tratamento (Tabela 3, destacada em verde claro). Portanto, um número significativo de genes demonstrou regulação específica de LPS. Para ilustrar ainda mais essas descobertas, escolhemos aleatoriamente genes dentro dos grupos funcionais "Quimiocina e citocina" e "Resposta imune" (Tabela 2) e traçamos os níveis de expressão desses genes no meio, não CpG-DNA-, CpG-DNA -, e macrófagos tratados com LPS na Figura 2, A e B. Embora CpG-DNA e LPS induziram a expressão de alguns genes comuns (ver as porções à esquerda da Fig. 2A e 2B), vários genes mostram indução específica de LPS [por exemplo , regulado na ativação, T normal expresso e secretado (RANTES), interleucina (IL) -1A, proteína 10 induzível por IFN (IP-10), PBEF e IL-18 na Fig. 2A induzida por IFN com tetratricopeptídeo (IFIT) 1, IFIT2, IFIT3 e induzido por IFN-gama (MG) 11 de camundongo na Fig. 2B]. Esses resultados reforçam ainda mais a hipótese de que o LPS ativa a (s) via (s) de sinalização adicional (is) não ativadas pela sinalização de CpG-DNA (mediada por TLR9).

Verificação dos resultados do microarray com RT-PCR

Embora nossos estudos anteriores tenham mostrado que a análise de microarray de oligonucleotídeo de alta densidade é uma técnica poderosa, sensível e precisa para determinar a expressão de genes regulados por moléculas de sinalização [33], realizamos experimentos adicionais para confirmar a expressão de alguns dos detectados genes usando RT-PCR semiquantitativo. Todos os resultados de RT-PCR (dados não mostrados) foram considerados consistentes com os resultados do microarray. Dados em Figura 3 mostram alguns desses resultados representativos de RT-PCR. Os genes identificados como sendo regulados para cima ou para baixo por CpG-DNA e LPS em estudos de microarray também foram regulados de forma semelhante em análises de RT-PCR (cf. genes na Fig. 3 para os mesmos genes nas Tabelas 2 e 3).

Indução de vários genes por CpG-DNA, não CpG-DNA e LPS. Os macrófagos foram estimulados com meio de cultura sozinho, meio contendo 30 μg / ml CpG- ou não-CpG-DNA, ou 100 ng / ml LPS por 6 h antes do isolamento de RNA para análise de RT-PCR dos níveis de mRNA para diferentes genes, conforme descrito em Materiais e métodos. Os dados mostram 4 dos 14 genes amplificados por RT-PCR. O mRNA do gene da β-actina foi amplificado e usado como controle interno.


Página de pesquisa do corpo docente

Meu laboratório estuda como as sequências genômicas que controlam a expressão do gene funcionam e evoluem. Somos movidos pelo desejo de compreender a base molecular da diversidade do organismo e pela crença de que muitas diferenças na fisiologia, morfologia e comportamento surgem de mudanças na regulação gênica. Nosso objetivo final é ser capaz de interpretar as informações regulatórias codificadas no DNA genômico, de modo que possamos identificar rotineiramente sequências regulatórias, discernir sua função, prever as consequências de sua perturbação e reconstruir como elas evoluíram.

Somos um laboratório híbrido computacional e experimental que une análise computacional e experimental em escala de genoma da regulação gênica em Drosophila melanogaster e Saccharomyces cerevisiae com extensa análise de dados de sequência comparativa e análise experimental de espécies intimamente relacionadas a esses sistemas de modelo. Nós nos concentramos em escalas de tempo evolutivas curtas, onde é possível acoplar mudanças específicas nas sequências do genoma com alterações na regulação e expressão gênica.

Projetos atuais

Caracterização experimental da regulação gênica em D. melanogaster embriões

Para fornecer uma base experimental sólida para nossos estudos evolutivos, estamos trabalhando com vários outros laboratórios em Berkeley para dissecar sistematicamente a expressão e a regulação gênica no início D. melanogaster embrião. Para cada um dos aproximadamente 40 fatores de transcrição críticos na formação dos padrões ântero-posterior e dorsal-ventral, nossos objetivos são: 1) medir a afinidade do fator in vitro para cada uma de suas potenciais sequências alvo, 2) identificar as regiões genômicas ligadas por cada fator em embriões vivos, 3) determinar o padrão de expressão do fator e seus alvos em três dimensões na resolução celular. Eu e os membros do meu laboratório estamos ativamente envolvidos nas partes experimentais do projeto e realizando as análises desses dados.

Modelando as restrições evolutivas em sequências regulatórias eucarióticas

Agora temos dados de sequências comparativas extensas para moscas de fruta (12 genomas de Drosophila) e leveduras (muitos genomas de fungos), e estamos usando esses dados para caracterizar como os blocos de construção individuais de sequências regulatórias (locais de ligação de fator de transcrição) e estruturas de ordem superior (por exemplo, desenvolvimento potenciadores) evoluem. Estamos particularmente interessados ​​em entender como a seleção para manter os locais de ligação do fator de transcrição afeta a evolução das sequências alvo e como a extensa plasticidade observada na organização dos estimuladores de desenvolvimento está relacionada à sua função.

Caracterização e modelagem da variação da rede transcricional dentro e entre as espécies de Drosophila

Meu laboratório está aplicando os métodos de imagem fluorescente de alta resolução desenvolvidos para D. melanogaster para analisar sistematicamente a expressão gênica e dissecar redes regulatórias em outras Drosófila espécies e em várias linhas consanguíneas de D. melanogaster. Os dados experimentais detalhados que estamos gerando para D. melanogaster, e as sequências do genoma de 12 espécies de Drosophila são um recurso tremendo para estudar a evolução da regulação gênica. No entanto, é difícil estudar as mudanças na sequência sem entender o contexto em que essas sequências existem e como essas mudanças afetam o funcionamento. Embora seja impraticável repetir todos os experimentos feitos em D. melanogaster em todas as outras cepas e espécies, estamos estendendo várias classes de experimentos para cepas e espécies selecionadas para que possamos entender melhor a variação regulatória em cada um de seus vários níveis: como a variação da sequência afeta a ligação, como a variação da ligação afeta a expressão e como a variação da expressão afeta o fenótipo.

Usando a evolução da sequência regulatória para elucidar os mecanismos de regulação gênica

Para tirar proveito da diversidade de sequências fora do gênero Drosophila, estamos sequenciando loci importantes para o desenvolvimento de várias famílias de moscas não drosofilídeos para fornecer informações sobre os princípios básicos da regulação gênica. Estamos particularmente interessados ​​em sequências regulatórias que sofreram extensos rearranjos em seus repertórios de sítios de ligação sem alterar sua função. Embora grandes rearranjos sejam observados entre as sequências regulatórias de Drosophla, deve haver limites para essa plasticidade. Com o tempo, as sequências regulatórias acumularão apenas as mudanças em seus repertórios de locais de ligação que são compatíveis com os eventos bioquímicos complexos necessários para produzir sua saída regulatória específica. Portanto, acreditamos que coletar e caracterizar sequências regulatórias com funções semelhantes, mas sequências diversas, acabará por levar a uma melhor compreensão dos princípios bioquímicos que relacionam a composição e organização das sequências regulatórias com sua função. Para realizar essa análise, estamos atualmente sequenciando 20 loci-alvo de 6 espécies cada uma das famílias Sepsidae (moscas de bandeira), Tephritidae (moscas verdadeiras) e Diopsidae (moscas com olhos-de-caule). Escolhemos esses taxa, que divergiram da Drosophila entre 100 e 150 milhões de anos atrás, para fornecer o equilíbrio ideal entre a divergência de sequência e a divergência funcional. Estamos complementando a análise de sequência com a análise experimental do desenvolvimento em espécies selecionadas de cada taxa, exame da atividade de intensificadores dessas espécies em D. melanogaster embriões e testes extensivos de hipóteses sobre a função e evolução da sequência regulatória.

Publicações selecionadas

[cópias de todos os artigos estão disponíveis em rana.lbl.gov]

Pollard DA, Moses AM, Iyer VN e Eisen MB (2006). Discordância generalizada de árvores gênicas com árvores de espécies em Drosófila: evidências para classificação de linhagem incompleta. PLoS Genetics 2(10): e173.

Moses AM, Pollard DA, Nix DA, Iyer VN, Li XY, Biggin MD, Eisen MB (2006). Turnover em grande escala de sítios de ligação de fator de transcrição funcional em Drosófila. PLoS Computational Biology 2(10): e130.

Pollard DA, Moses AM, Iyer VN e Eisen MB. Detectar os limites de conservação de elemento regulatório e estimativa de divergência usando múltiplos alinhamentos em pares e múltiplos. BMC Bioinformática 7(1):376.

Chiang DY, Nix DA, Shultzaberger RK, Gasch AP, Eisen MB (2006). Requisitos de arquitetura de promotor flexível para recrutamento de coativador. BMC Molecular Biology 7(1):16.

Gasch AP, Moses AM, Chiang DY, Fraser HB, Berardini M e Eisen MB (2004). Conservação e evolução de cis-sistemas reguladores em fungos Ascomycete. PLoS Biology 2(12): e398.

Moses AM, Chiang DY, Pollard DA, Iyer VN e Eisen MB (2004). MACACO: identificação de sítios de ligação de fator de transcrição conservados em alinhamentos múltiplos usando um modelo evolutivo específico de sítio de ligação. Biologia Genômica 5(12): R98.

Berman BP, Pfeiffer BD, Laverty TR, Salzberg SL, Rubin GM, Eisen MB e Celniker SE (2004). Identificação computacional de potencializadores de desenvolvimento: conservação e função de grupos de sítios de ligação de fator de transcrição em Drosophila melanogaster e Drosophila pseudoobscura. Biologia Genômica 5(9): R61.

Moses AM, Chiang DY, Kellis M, Lander ES e Eisen MB (2003). Variação específica da posição na taxa de evolução nos locais de ligação do fator de transcrição BMC Evolutionary Biology 3(19).

Berman BP, Nubu Y, Pfeiffer BD, Tomancak P, Celniker SE, Levine M, Rubin GM e Eisen MB (2002). Explorando o agrupamento do local de ligação do fator de transcrição para identificar cis- módulos regulatórios envolvidos na formação de padrões no Drosófila genoma. Proc Natl Acad Sci USA 99, 757-62.


Assista o vídeo: Regulação da expressão gênica (Junho 2022).


Comentários:

  1. Mardon

    Na minha opinião você cometeu um erro. Vamos discutir.

  2. Sevrin

    Esta frase magnífica é necessária apenas a propósito

  3. Taum

    Que boa resposta

  4. Anluan

    Bem, por que este é o único caminho? Eu acho que por que não expandir sobre este tópico.

  5. Alburt

    Peço desculpas, mas na minha opinião você está errado. Entre vamos discutir. Escreva para mim em PM, nós lidaremos com isso.

  6. Chace

    Além disso, faríamos sem a sua excelente ideia

  7. Kegore

    Desculpe interferir, mas sugiro ir para o outro lado.



Escreve uma mensagem