Em formação

Quais são os fatores limitantes para o comprimento do gene e o número de exons?

Quais são os fatores limitantes para o comprimento do gene e o número de exons?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Recentemente baixei anotações de genes para Homo sapiens da Ensembl para algumas análises de bioinformática. A grande maioria das anotações de genes tem 20 exons ou menos, embora haja alguns que tenham até 250. Eu sei o suficiente sobre anotações de genes para considerar essas previsões com um grão de sal, mas isso me fez pensar ... o que são biologicamente fatores relevantes que podem limitar o comprimento, número de exon, etc. de um gene? Existe alguma possibilidade real de um gene ter 50 exons? 100 exões? 250 exões? Do ponto de vista biológico, onde é traçada a linha e por quê?


Esta questão cai firmemente no colo da evolução molecular e das restrições que são colocadas sobre os genes pelas forças de mutação, seleção, deriva e recombinação.

Existem inúmeras situações, particularmente a duplicação de genes, que podem resultar em um gene que está livre das restrições seletivas de seu pai, muitos dos quais irão acumular tantas mutações deletérias como resultado de processos estocásticos que se tornarão não funcionais, por ex. psuedogenes. Alguns podem ser alterados e reorganizados, acumulando éxons e íntrons, e se inferirem um benefício de aptidão para o organismo, podem ser movidos para fixação dentro de uma população.

A evolução é um processo de genética populacional, e existem muitas variáveis ​​que podem afetar o resultado, não menos importante a diferença no tamanho das populações. Os genomas de populações maiores (como os de bactérias) parecem ter genomas muito menores e, claro, nenhum (pelo menos não spliceosomal) íntrons, talvez como resultado do aumento da aptidão devido ao menor tempo de geração de um organismo com mais genoma delgado. Seria uma boa ideia ler The Origins of Genome Architecture de Michael Lynch, pois acho que ele responde às suas perguntas melhor do que eu.

Muitos dos genes que você recupera do EnsEMBL, é claro, terão evidências experimentais para apoiá-los. Os genes que estão previstos no pipeline podem ser vistos com menos confiança, mas é claro que você pode olhar para os alinhamentos com espécies estreitamente relacionadas para ver se você acha que os íntrons / exons são de fato viáveis. Um exemplo de um gene com 79 exons é o gene da distrofina (DMD), o gene anotado mais longo com 2.217.347 pb (ver Roberts et al, 1993 e Nishio et al, 1994).


Duvido que haja realmente alguma limitação direta; o melhor teste seria verificar se o tamanho corresponde, ou seja, aquele gene de 1 kbp com 100 exões prefere ter intrões muito curtos.

Uma pesquisa rápida sobre os genes do NCBI mostra até mesmo um gene de exon 317, embora todos esses casos extremos pareçam ser alguns irmãos pouco claros da titina, que é enorme por si só.


Concordo com o mbq - titan é o gene mais longo que conheço e tem bem mais de 100 exons. A titina e a distrofina são bem caracterizadas geneticamente e não previsões. titin é o exoner campeão com 363 exons.

Seus únicos exemplos como este podem permitir que os preditores de genes funcionem enquanto eles o fizerem, eu acho que as previsões são aparadas heuristicamente para se assemelhar às estruturas / comprimentos / junções gênicas conhecidas, etc.


Quais são os fatores limitantes para o comprimento do gene e o número de exons? - Biologia

Bases moleculares de GSD tipo 1a: (G6PC) Deficiência

O gene G6PC, que codifica a subunidade catalítica hepática da glicose-6-fosfatase, está localizado no cromossomo 17 na banda q21. Tem cinco exões e 12,5 kb de comprimento. Ele codifica uma proteína de 35,5 kDa que consiste em 357 aminoácidos sem variantes de splice conhecidas. Até o momento, mais de 75 mutações diferentes em G6PC foram encontradas em pacientes com GSD1a e são responsáveis ​​por 80% dos casos. Mutações foram encontradas em todos os cinco exões e nas fronteiras intrão-exão. Foram identificados polimorfismos promotores que afetam o grau de expressão de G6PC e podem ser responsáveis ​​por alguns dos casos restantes. As mutações no centro catalítico da enzima eliminam toda a atividade, enquanto as mutações nos domínios transmembrana desestabilizam a proteína e a tornam suscetível à degradação rápida. Algumas mutações produzem enzimas com atividade residual. O distúrbio é autossômico recessivo, de forma que mutações devem estar presentes em ambas as cópias do gene para que uma pessoa sofra de GSD1a.

Dois outros genes altamente relacionados, G6PC2 e G6PC3, foram identificados recentemente. Os três genes G6PC têm diferentes padrões de expressão específicos de tecido. Apenas G6PC é expresso em níveis significativos no fígado adulto. O G6PC2 é expresso predominantemente no pâncreas e mutações neste gene levam à sinalização aberrante de glicose e secreção de insulina. G6PC3 é expresso em todos os tipos de tecido examinados até agora. Os níveis mais altos estão no cérebro, músculos, placenta e tecidos fetais, com níveis muito baixos no fígado. Mutações G6PC3 foram recentemente descritas e podem explicar muitos dos sintomas de GSD1b descritos posteriormente que não são encontrados em GSD1a, incluindo neutropenia acentuada e suscetibilidade à infecção.


Regulação do gene epigenético eucariótico

O genoma humano codifica mais de 20.000 genes, cada um dos 23 pares de cromossomos humanos codifica milhares de genes. O DNA no núcleo é precisamente enrolado, dobrado e compactado em cromossomos para que se encaixe no núcleo. Ele também é organizado de forma que segmentos específicos possam ser acessados ​​conforme necessário por um tipo específico de célula.

O primeiro nível de organização, ou empacotamento, é o enrolamento das fitas de DNA em torno das proteínas histonas. As histonas empacotam e ordenam o DNA em unidades estruturais chamadas de complexos de nucleossomos, que podem controlar o acesso das proteínas às regiões do DNA (Figura 1a). Sob o microscópio eletrônico, esse enrolamento de DNA em torno de proteínas histonas para formar nucleossomos se parece com pequenas contas em um fio (Figura 1b). Essas contas (proteínas histonas) podem se mover ao longo do fio (DNA) e alterar a estrutura da molécula.

Figura 1. O DNA é dobrado em torno das proteínas histonas para criar (a) complexos de nucleossomos. Esses nucleossomos controlam o acesso das proteínas ao DNA subjacente. Quando vistos através de um microscópio eletrônico (b), os nucleossomos parecem contas em um fio. (crédito “micrografia”: modificação do trabalho de Chris Woodcock)

Se o DNA que codifica um gene específico deve ser transcrito em RNA, os nucleossomos que circundam essa região do DNA podem deslizar para baixo no DNA para abrir essa região cromossômica específica e permitir que a maquinaria de transcrição (RNA polimerase) inicie a transcrição (Figura 2). Os nucleossomos podem se mover para abrir a estrutura do cromossomo e expor um segmento de DNA, mas o fazem de uma maneira muito controlada.

Pergunta Prática

Figura 2. Os nucleossomos podem deslizar ao longo do DNA. Quando os nucleossomos estão bem espaçados (topo), os fatores de transcrição não podem se ligar e a expressão do gene é desligada. Quando os nucleossomos estão bem espaçados (parte inferior), o DNA fica exposto. Fatores de transcrição podem se ligar, permitindo que a expressão gênica ocorra. As modificações nas histonas e no DNA afetam o espaçamento dos nucleossomos.

Nas mulheres, um dos dois cromossomos X é inativado durante o desenvolvimento embrionário devido a alterações epigenéticas na cromatina. Que impacto você acha que essas mudanças teriam no empacotamento de nucleossomos?

O modo como as proteínas histonas se movem depende dos sinais encontrados nas proteínas histonas e no DNA. Esses sinais são marcações adicionadas às proteínas histonas e DNA que dizem às histonas se uma região cromossômica deve ser aberta ou fechada (a Figura 3 mostra modificações nas proteínas histonas e no DNA). Essas marcas não são permanentes, mas podem ser adicionadas ou removidas conforme necessário. Eles são modificações químicas (grupos fosfato, metila ou acetila) que são anexados a aminoácidos específicos na proteína ou aos nucleotídeos do DNA. As marcas não alteram a sequência de bases do DNA, mas alteram o quão firmemente enrolado o DNA é em torno das proteínas histonas. O DNA é uma molécula carregada negativamente, portanto, mudanças na carga da histona mudarão o quão fortemente enrolada a molécula de DNA ficará. Quando não modificadas, as proteínas histonas têm uma grande carga positiva, adicionando modificações químicas como grupos acetil, a carga se torna menos positiva.

A própria molécula de DNA também pode ser modificada. Isso ocorre em regiões muito específicas chamadas ilhas CpG. São trechos com alta frequência de pares de DNA de citosina e dinucleotídeo guanina (CG) encontrados nas regiões promotoras dos genes. Quando esta configuração existe, o membro citosina do par pode ser metilado (um grupo metil é adicionado). Essa modificação muda a forma como o DNA interage com as proteínas, incluindo as proteínas histonas que controlam o acesso à região. Regiões de DNA altamente metiladas (hipermetiladas) com histonas desacetiladas são fortemente enroladas e transcricionalmente inativas.

Figura 3. Proteínas histonas e nucleotídeos de DNA podem ser modificados quimicamente. As modificações afetam o espaçamento dos nucleossomos e a expressão gênica. (crédito: modificação do trabalho por NIH)

Esse tipo de regulação gênica é chamada de regulação epigenética. Epigenética significa "em torno da genética". As mudanças que ocorrem nas proteínas histonas e no DNA não alteram a sequência de nucleotídeos e não são permanentes. Em vez disso, essas mudanças são temporárias (embora frequentemente persistam por meio de várias rodadas de divisão celular) e alteram a estrutura cromossômica (aberta ou fechada) conforme necessário. Um gene pode ser ativado ou desativado dependendo da localização e modificações nas proteínas histonas e no DNA. Se um gene deve ser transcrito, as proteínas histonas e o DNA são modificados em torno da região cromossômica que codifica esse gene. Isso abre a região cromossômica para permitir o acesso da RNA polimerase e outras proteínas, chamadas fatores de transcrição, para se ligarem à região promotora, localizada logo acima do gene, e iniciar a transcrição. Se um gene deve permanecer desligado ou silenciado, as proteínas histonas e o DNA têm modificações diferentes que sinalizam uma configuração cromossômica fechada. Nessa configuração fechada, a RNA polimerase e os fatores de transcrição não têm acesso ao DNA e a transcrição não pode ocorrer (Figura 2).

Assista a este vídeo que descreve como a regulação epigenética controla a expressão gênica.

Como as células procarióticas, a transcrição de genes em eucariotos requer as ações de uma RNA polimerase para se ligar a uma sequência a montante de um gene para iniciar a transcrição. No entanto, ao contrário das células procarióticas, a RNA polimerase eucariótica requer outras proteínas, ou fatores de transcrição, para facilitar o início da transcrição. Fatores de transcrição são proteínas que se ligam à sequência promotora e outras sequências regulatórias para controlar a transcrição do gene alvo. A RNA polimerase por si só não pode iniciar a transcrição em células eucarióticas. Os fatores de transcrição devem se ligar primeiro à região do promotor e recrutar a RNA polimerase para o local para que a transcrição seja estabelecida.

Visualize o processo de transcrição - a fabricação de RNA a partir de um modelo de DNA:

O promotor e a máquina de transcrição

Os genes são organizados para facilitar o controle da expressão gênica. A região do promotor está imediatamente a montante da sequência de codificação. Esta região pode ser curta (apenas alguns nucleotídeos de comprimento) ou bastante longa (centenas de nucleotídeos de comprimento). Quanto mais longo for o promotor, mais espaço disponível para as proteínas se ligarem. Isso também adiciona mais controle ao processo de transcrição. O comprimento do promotor é específico do gene e pode diferir dramaticamente entre os genes. Consequentemente, o nível de controle da expressão gênica também pode diferir bastante dramaticamente entre os genes. O objetivo do promotor é ligar fatores de transcrição que controlam o início da transcrição.

Figura 1. Um potenciador é uma sequência de DNA que promove a transcrição. Cada potenciador é composto de pequenas sequências de DNA chamadas elementos de controle distal. Ativadores ligados aos elementos de controle distal interagem com proteínas mediadoras e fatores de transcrição. Dois genes diferentes podem ter o mesmo promotor, mas diferentes elementos de controle distal, permitindo a expressão diferencial do gene.

Dentro da região do promotor, logo a montante do local de início da transcrição, reside a caixa TATÁ. Esta caixa é simplesmente uma repetição dos dinucleotídeos de timina e adenina (literalmente, repetições TATÁ). A RNA polimerase liga-se ao complexo de iniciação da transcrição, permitindo que a transcrição ocorra. Para iniciar a transcrição, um fator de transcrição (TFIID) é o primeiro a se ligar à caixa TATÁ. A ligação de TFIID recruta outros fatores de transcrição, incluindo TFIIB, TFIIE, TFIIF e TFIIH para a caixa TATA. Uma vez que este complexo é montado, a RNA polimerase pode se ligar à sua sequência a montante. Quando ligada junto com os fatores de transcrição, a RNA polimerase é fosforilada. Isso libera parte da proteína do DNA para ativar o complexo de iniciação da transcrição e coloca a RNA polimerase na orientação correta para iniciar a transcrição. proteínas mediadoras (Figura 1).

Além dos fatores de transcrição gerais, outros fatores de transcrição podem se ligar ao promotor para regular a transcrição do gene. Esses fatores de transcrição se ligam aos promotores de um conjunto específico de genes. Eles não são fatores de transcrição gerais que se ligam a todos os complexos promotores, mas são recrutados para uma sequência específica no promotor de um gene específico. Existem centenas de fatores de transcrição em uma célula e cada um se liga especificamente a um motivo de sequência de DNA específico. Quando os fatores de transcrição se ligam ao promotor logo a montante do gene codificado, é referido como um cis-elemento atuante, porque está no mesmo cromossomo próximo ao gene. A região à qual um determinado fator de transcrição se liga é chamada de sítio de ligação do fator de transcrição. Os fatores de transcrição respondem a estímulos ambientais que fazem com que as proteínas encontrem seus locais de ligação e iniciem a transcrição do gene necessário.

Intensificadores e transcrição

Em alguns genes eucarióticos, existem regiões que ajudam a aumentar ou aumentar a transcrição. Essas regiões, chamadas de intensificadores, não estão necessariamente próximas aos genes que potencializam. Eles podem estar localizados a montante de um gene, dentro da região codificadora do gene, a jusante de um gene ou podem estar a milhares de nucleotídeos de distância.

As regiões potenciadoras são sequências de ligação, ou locais, para fatores de transcrição. Quando uma proteína de dobra de DNA se liga, a forma do DNA muda (Figura 1). Esta mudança de forma permite a interação dos ativadores ligados aos potenciadores com os fatores de transcrição ligados à região promotora e à RNA polimerase. Enquanto o DNA é geralmente representado como uma linha reta em duas dimensões, na verdade é um objeto tridimensional. Portanto, uma sequência de nucleotídeos a milhares de nucleotídeos pode se dobrar e interagir com um promotor específico.

Desligando Genes: Repressores Transcricionais

Assim como as células procarióticas, as células eucarióticas também possuem mecanismos para prevenir a transcrição. Os repressores transcricionais podem ligar-se a regiões promotoras ou potenciadoras e bloquear a transcrição. Como os ativadores transcricionais, os repressores respondem a estímulos externos para evitar a ligação de fatores de transcrição ativadores.

Questões Práticas

A ligação de ________ é necessária para que a transcrição comece.

O que resultará da ligação de um fator de transcrição a uma região potenciadora?

  1. diminuição da transcrição de um gene adjacente
  2. aumento da transcrição de um gene distante
  3. alteração da tradução de um gene adjacente
  4. iniciação do recrutamento de RNA polimerase

Uma mutação na região do promotor pode alterar a transcrição de um gene. Descreva como isso pode acontecer.

O que poderia acontecer se uma célula tivesse muito de um fator de transcrição de ativação presente?


Resultados

Dois a quatro por cento dos genes RefSeq são candidatos à decadência mediados por nonsense e não são explicados como alelos raros ou artefatos de sequenciamento

Candidatos a NMD foram identificados em humanos e camundongos a partir dos bancos de dados de mRNA RefSeq [45, 46]. O banco de dados RefSeq contém muitas sequências de mRNA parcialmente curadas manualmente, especialmente para aquelas prefixadas com 'NM_', que geralmente têm suporte experimental. Com base nestes mRNAs prefixados 'NM _' e seguindo a regra NMD 55-nt [16], identificamos 701 e 498 genes candidatos a NMD em humanos e camundongos, respectivamente (Tabela 1). Estes representam 3,9% e 2,8% dos genes examinados em humanos e camundongos, respectivamente. As proporções estão no limite inferior de relatórios anteriores [4, 9–12]. Isso pode refletir em parte a exclusão de muitas isoformas de splicing, devido à falta de suporte experimental adequado, no banco de dados RefSeq [47]. Por outro lado, proporções previamente relatadas de genes regulados foram principalmente baseadas na modulação dos perfis de expressão e devem refletir os efeitos diretos e indiretos do NMD [31, 39, 48]. A priori espera-se que tais métodos superestimem o número de alvos NMD genuínos [37].

Por referência aos dados de cDNAs de comprimento total da coleção de genes de mamíferos [49, 50] e dbSNP [51] (Tabela S1 no arquivo adicional 1), descobrimos que os candidatos NMD têm o mesmo suporte de qualidade que outros genes, indicando que esses candidatos são não o resultado de artefatos de sequência ou alelos raros. Também descobrimos que os candidatos a NMD humanos aqui são enriquecidos para alvos potenciais de NMD, previamente determinados no estudo de Mendell et al [10] (Tabela S2 no arquivo adicional 1). Conforme mostrado na Tabela 1, os candidatos a NMD geralmente codificam proteínas mais curtas e íntrons e UTRs mais longos em comparação com genes não NMD.

Poucos genes são candidatos à decadência mediada por nonsense em camundongos e humanos

O modelo de ruído de splicing prevê que um gene NMD em uma espécie não precisa ser o alvo do NMD em outra. O modelo de regulação não necessariamente prevê isso. Com base nos pares de ortólogos identificados com o programa Inparanoid [52], contamos o número de pares de ortólogos que eram candidatos NMD em ambas as espécies (Tabela 2). Apenas 24 pares de ortólogos (6,70% e 8,22% de candidatos a NMD humanos e camundongos, respectivamente) eram candidatos a NMD em ambas as espécies (consulte o arquivo adicional 2 para obter a lista completa de candidatos a NMD conservados).

Como é provável que algumas transcrições de NMD tenham sido perdidas da análise devido à seleção estrita de dados, repetimos a análise usando todos os mRNAs RefSeq, incluindo mRNAs previstos (com o prefixo 'XM_'). O número de candidatos a NMD em ambos os genomas aumentou conforme o esperado neste segundo turno. No entanto, a interseção entre ortólogos NMD ainda era pequena (consulte a Tabela S3 no arquivo adicional 1). O resultado é consistente com uma comparação anterior de humanos, mosca-das-frutas D. melanogaster e S. cerevisiae Candidatos NMD [4, 9-12]. Também podemos mostrar que as baixas taxas de conservação de NMD não são consistentes com as taxas normais de rotação do códon de parada (consulte a Tabela S4 no arquivo adicional 1). A nossa descoberta mostra que, mesmo quando o mecanismo de regulação do PTC não é uma variável, a regulação determinística pelo NMD geralmente não é seletivamente favorecida a longo prazo ou não é a explicação correta para a maioria dos PTCs.

Os exons de decaimento mediados por nonsense tendem a não ser múltiplos de três longos

Se um exon for incluído por splicing ruidoso, a pressão a não ser traduzida deve ser maior se o exon não for um múltiplo de três longos do que se for um múltiplo de três longos. A inclusão de tais exons induzirá um deslocamento de quadro se traduzido, o que mudará os aminoácidos codificados a jusante dos exons incluídos. Se for assim, isso resultará em proteínas que, na melhor das hipóteses, são caras de se fazer e não funcionais e, na pior, são tóxicas para as células. Em contraste, a inclusão de um exon que é um múltiplo de três normalmente resultará em uma pequena inserção de peptídeo, mas não precisa interromper a função geral dessa proteína. Os custos de splicing ruidoso podem ser reduzidos até certo ponto pela degradação dessas transcrições ruidosas empregando sistemas de decaimento de mRNA, como por NMD. Como os exons que não são múltiplos de três impõem um custo mais alto, esperamos uma seleção mais forte para PTCs em exons que não são múltiplos de três em comparação com aqueles que não induzem frameshifts, assumindo uma taxa igual de splicing incorreto. O modelo de regulação não faz previsão de viés.

Classificamos os exons em candidatos a NMD como exons específicos de NMD (os exons observados apenas em transcritos de NMD) e exons não específicos de NMD (os exons esquerdos em genes candidatos a NMD) (Tabela 3). Começamos com genes tendo pelo menos dois mRNAs RefSeq e obtivemos 36.643 exons codificadores internos de 3.362 genes (incluindo 252 candidatos NMD e 3.110 genes não NMD) (Tabela 3). Entre estes, identificamos 278 exões específicos para NMD e 2.353 exões não específicos para NMD. Uma vez que os exons específicos de NMD podem tender a pertencer a apenas um transcrito, para melhor comparação, classificamos os exons em candidatos não NMD como não-NMD-único (exons observados apenas em um mRNA RefSeq) e exons múltiplos não-NMD (o exões restantes em genes candidatos não NMD) (Tabela 3). Nós nos concentramos nos exons específicos de NMD do tipo cassete, porque esses exons não se sobrepunham com regiões em transcritos não NMD e eram mais adequados para nosso propósito.

Como mostrado na quarta coluna da Tabela 3, os comprimentos dos exons de cassete NMD específicos não são divisíveis por três em mais casos (60,3%) do que os exons de cassete não NMD (52,7% e 49,1% para não NMD-único e não -NMD-múltiplo, respectivamente, teste do qui-quadrado, P valores: 0,09616 e 0,01388). Isso suporta o modelo de emenda com ruído. Observe também que os exons de NMD conservados de camundongo humano mostram menos tendência de não serem múltiplos de três (14 de 23 = 60,8%) do que os exons de NMD criados após a divisão de camundongo-humano (7 de 9 = 78%), embora os tamanhos de amostra são muito pequenos para tirar conclusões definitivas (ver Tabela 4 para exons conservados).

Exons específicos de decaimento mediados por absurdos tendem a estar na categoria de baixa inclusão e recém-criados

De acordo com o modelo de splice ruidoso, a transcrição NMD é uma transcrição indesejada emendada alternativamente. O modelo de regulação não exige que os transcritos NMD sejam transcritos emendados alternativamente, nem, se forem, precisam ser a forma minoritária (a isoforma de transcrição que constitui uma pequena fração (menos de um terço) dos transcritos do mesmo gene). Então, os genes NMD são mais prováveis ​​de serem alternativamente spliced ​​do que os genes aleatórios e as isoformas de transcrição NMD são raras? Para investigar isso, mapeamos nossas listas de genes para genes Ensembl com BioMart [53] e extraímos as informações da isoforma de splicing do banco de dados ASD [54, 55].

Descobrimos que 419 de 458 e 271 de 347 (para humanos e camundongos, respectivamente) genes candidatos a NMD têm pelo menos duas isoformas de splicing conhecidas em ASD [54, 55] (Tabela 5). Geralmente, um gene candidato de NMD pode ter variantes de transcrição NMD e não NMD. Em comparação com genes selecionados aleatoriamente, descobrimos que os candidatos a NMD são mais comumente sujeitos a splicing alternativo em humanos (P = 0,0007832). No entanto, não há diferença no mouse (P = 0,8705). Isso é provavelmente causado por: 1) classificação incorreta de alguns alvos NMD verdadeiros em conjunto não-NMD em camundongos devido ao menor número de mRNAs RefSeq prefixados 'NM_' (19.083 e 23.839 mRNAs RefSeq em nosso conjunto de dados para camundongos e humanos, respectivamente) e 2) menor taxa de detecção de splicing alternativo para camundongos (79%) do que humanos (86%) no banco de dados ASD [54, 55]. Observe também que Xing e Lee descobriram que em roedores os candidatos a NMD estão sujeitos a splicing alternativo mais comumente do que o esperado [44].

Como esperado do modelo de splicing ruidoso, descobrimos que uma proporção maior de exons NMD-específicos (48%) foram spliced ​​na forma menor (incluída em menos de um terço dos transcritos transcritos deste gene) em comparação com exons únicos não-NMD ( 26,1%) (Figura 2) (Teste de Kolmogorov-Smirnov unilateral, P = 0,02443). Isso é consistente com relatórios anteriores de que a maioria dos transcritos de NMD putativos são expressos em baixa abundância nos tecidos examinados [41] e com a descoberta de que tanto em humanos quanto em camundongos o transcrito menor tem um PTC mais comumente do que a forma principal (11,1% contra 3.7%) [44].

Níveis de inclusão de exões em diferentes classes de exões de cassete. Os exons específicos do decaimento de mRNA mediado por nonsense são enriquecidos na categoria de inclusão de forma secundária (nível de inclusão & lt 33%) e esgotados na categoria de forma principal (nível de inclusão & gt 67%).

Os exões NMD são antigos ou novos? Para explorar esta questão, examinamos os eventos de criação e perda de exon para cada exon de cassete específico do NMD. Para obter essa informação, começamos mapeando nossos exons para aqueles dos bancos de dados ASAP2 e VEEDB [56, 57]. O banco de dados VEEDB fornece informações de conservação de exon para cada exon determinado com base na conservação do local de splice, sendo extraído de um alinhamento multigenoma UCSC de 17 vertebrados [57]. Usando esses dados de conservação de exon, podemos determinar se um determinado exon humano é conservado ou ausente em camundongos e cães (grupo externo). Infelizmente, apenas uma pequena parte dos exons são mapeados para o banco de dados VEEDB [57]. Como mostrado na Tabela 4, 9 de 35 exons específicos de NMD foram criados após a divisão humano-camundongo. Esta proporção (25,7%) é significativamente maior do que a de exões de classe única não NMD (11,9%) (teste exato de Fisher, P = 0,0315) (consulte o arquivo adicional 2 para exons específicos de NMD humanos conservados em camundongos). Quando comparamos humanos com macacos Rhesus (Macaca mulatta) com camundongos como grupo externo, a diferença é mais significativa (Arquivo adicional 1, Tabela S5, NMD-específico 21,2%, não-NMD-único 4,5%, P = 0,001139). Essas descobertas são consistentes com o fato de que os exons indutores de NMD geralmente não são conservados entre as espécies [41]. As taxas de perda de exon são muito menores e não houve diferença entre os exons NMD e não NMD.

Uma associação entre exons novos e com splicing alternativo provavelmente também pode ser responsável pela rápida renovação de genes sujeitos a NMD. Dois tipos de eventos de splicing alternativos específicos da espécie podem ser definidos [58, 59]. Um tipo, referido como 'splicing alternativo específico da espécie de exons conservados', é representado por um exon conservado que é alternativamente splicing em uma espécie, mas constitutivamente splicing em outras espécies. O outro tipo, referido como 'splicing alternativo específico do genoma', é representado por um exon alternativo em uma espécie que não é detectável no ortólogo das outras espécies (ver Figura Três em [41] para diagramas). Mais de 41% dos eventos de splicing alternativo específico da espécie de exons conservados e 61% dos eventos de splicing alternativo específico do genoma tinham o potencial de desencadear NMD, enquanto a taxa de indução de NMD de eventos de splicing alternativo conservado entre humanos e camundongos era muito mais baixa (& lt 31%) [41]. Não importa qual seja a forma, ambos os tipos fazem com que o NMD ocorra com mais frequência em apenas uma das duas espécies do que em ambas as espécies, e podem, portanto, explicar em uma extensão considerável a divergência de status de NMD.

Onde um exon ortólogo pode ser encontrado, o exon específico do decaimento mediado por nonsense está ou estava sob seleção de purificação

Ambos os modelos (regulação de ruído e expressão) prevêem que os exões NMD podem estar sob restrição seletiva inferior do que os exões não NMD. No entanto, o modelo ruidoso prevê a evolução neutra para os exons específicos do NMD (devido a eles não serem traduzidos), enquanto o modelo de regulação prevê que haverá seleção purificadora ainda em operação. Para examinar a evolução de exons específicos de NMD, concatenamos os alinhamentos dos exons de cassete específicos de NMD com base em alinhamentos de CDS humano-camundongo-cão e calculamos K uma/K s razões (ω) de taxa de substituição não sinônima (K uma) para taxa de substituição sinônima (K s) para cada linhagem usando o pacote PAML [60] sob o modelo de ramificação de razão livre [61], que assume que cada linhagem evoluiu independentemente. Como esperado (Tabela 6), o K uma/K s a razão em exões de cassete específico de NMD humano é maior do que em outras regiões de candidatos a NMD (0,3432 versus 0,2627). Isso é consistente com a pressão de seleção negativa mais fraca nos exões NMD. Também é maior do que as razões para o exon ortólogo em outras linhagens (0,1082 e 0,0884 para camundongo e cão, respectivamente).

Comparar exons de cassete alternativos com outras partes do mesmo gene pode ser um teste sujeito a erros, pois os exons de cassete geralmente podem ter pressões evolutivas mais fracas devido às suas exclusões em algumas isoformas de splicing. Na verdade, observamos uma maior K uma/K s razão em não-NMD-classe única de exões do que em outras regiões (Tabela 6). Para excluir o efeito disso, comparamos o NMD específico K uma/K s razão contra exões únicos não NMD. Um superior K uma/K s a proporção para a classe específica de NMD ainda foi observada (Tabela 6, 0,3423 versus 0,2554).

Embora esses resultados sejam consistentes com o modelo de expressão regulada, uma interpretação mais completa dos resultados não é trivial. Em primeiro lugar, a capacidade de detectar exões ortólogos predispõe a encontrar exões que funcionam em regulação. Em segundo lugar, mesmo se o modelo de transcrição espúrio estiver correto para a linhagem com o stop, o nulo para K uma/K s não é 1. Crucial é quando o exon foi sujeito a NMD e que forma de seleção operou antes disso. Se o exon foi submetido ao NMD muito recentemente, então a maior parte da história evolutiva do exon na linhagem humana não estava evoluindo em resposta à presença do stop. Somente se o exon fosse sempre espúrio, improvável, dado que este exon é encontrado em vários táxons distantes, seria K uma/K s = 1 é esperado para a linhagem em questão. Em suma, em virtude do fato de que podemos encontrar exons ortólogos distantes, quase certamente estamos enviesando o conjunto de dados para exons que foram e possivelmente ainda são funcionais. Dado que K uma/K s & lt 1 podemos ter certeza de que por algum tempo o exon não foi espúrio.

Candidatos à decadência mediada por absurdos estão evoluindo rapidamente, mas não são pontos quentes para evolução adaptativa

Evolução mais rápida para exões específicos de NMD e superiores K uma/K s razões para candidatos NMD (mesmo quando controlando os perfis de expressão) (Figura S1 e Tabela S6 no arquivo adicional 1) nos fez questionar se o modo evolutivo desses genes é seleção purificadora, evolução neutra ou evolução adaptativa. Uma vez que a maioria dos candidatos NMD mostraram K uma/K s & lt 1 (Figura S2 no arquivo adicional 1), esses genes estavam sob seleção de purificação como um todo. Consistente com isso, descobrimos que os exons do cassete específico do NMD rejeitaram o modelo de evolução neutra (K uma/K s = 1) usando um teste de razão de verossimilhança [61] (Tabela 7, P = 1,77 × 10 -8), embora eles estivessem evoluindo rapidamente em comparação com outras regiões em candidatos NMD (Tabela 6).

Dado que os candidatos a NMD evoluem mais rápido em sua própria linhagem do que os ortólogos (teste de taxa relativa, Tabela S7 no arquivo adicional 1), possivelmente devido a restrições seletivas reduzidas, é tentador supor que os genes e exons NMD têm potencialmente muito mais liberdade para vagar espaço de seqüência do que exões de, por exemplo, genes de manutenção. Isso pode predispor os genes NMD a serem pontos quentes para a evolução adaptativa?

Verificamos se havia algum caso de seleção relaxada ou seleção positiva para candidatos a NMD com base nos dados de um estudo anterior [62], que usou um método sensível (modelo de local de filial em PAML [63, 64]) para detectar locais de seleção positiva em genes humanos e de chimpanzés. Conforme mostrado na Tabela 8, de 8.824 genes 104 genes foram considerados sob seleção positiva na linhagem humana. Quatro dos 254 candidatos a NMD foram detectados como candidatos para seleção positiva. Esta proporção (1,6%) é ligeiramente maior do que (1,2%) de genes não NMD, mas não estatisticamente significativa (P valor = 0,5453). Não encontramos nenhuma evidência de que os candidatos NMD estão sob seleção relaxada (Tabela S8 no arquivo adicional 1) para os 254 candidatos NMD examinados, indicando que, como a maioria dos outros genes, eles estão sob seleção purificadora.

A sub-representação de algumas classes funcionais de genes no conjunto de decaimento mediado por nonsense é consistente com splicing ruidoso

Os resultados acima sugerem que para exons modernos o modelo de splicing ruidoso é apropriado. Um resultado neste contexto é curioso. Embora seja improvável que um gene candidato a NMD seja candidato a NMD em outras espécies, vemos que algumas classes funcionais de genes estão consistentemente sub-representadas como candidatos a NMD (Tabela 9 e arquivo adicional 3) e a proporção de candidatos a NMD dentro de qualquer classe de ontologia de gene (GO) é amplamente inalterada entre camundongos e humanos (consulte o arquivo adicional 4). À primeira vista, essa conservação da função e a distorção na representação parecem evidências de splicing regulado, que prevê que a regulação NMD pode ser particular para certos tipos de genes (por exemplo, fome ou genes específicos de hipóxia). No entanto, observamos que essa inclinação também é potencialmente consistente com o modelo de splicing ruidoso, se houver uma covariância entre as classes de genes e as taxas de splicing alternativo.

To examine the skew we employed tools of PANTHER database [65, 66]. The biological processes with Bonferroni-corrected P values < 0.1 in either species are listed in Table 9. About half of the NMD candidates were classified as Biological process unclassified. This was the only set showing over-representation with the NMD class. The only other classes showing significant deviation from expected showed under-representation, these being Developmental processes, Cell-surface receptor-mediated signal transduction, Sensory perception, Signal transduction, Chemosensory perception, e Olfaction. The functional distributions of NMD candidates in humans and mice were quite similar. Of the top six most significant GO terms from either species, five (Biological process unclassified, Developmental processes, Sensory perception, Signal transduction, Chemosensory perception) also appeared in the list of the most significant in the other species (Table 9).

To further determine whether the divergence of orthology in NMD candidates also led to functional divergence, we compared the functional distributions of human and mouse NMD candidates using the FatiGO web tool [67], which is able to detect particular GO terms for which the two lists of genes have different proportions of genes. For feasibility, the GO terms for mouse genes were deduced from the corresponding human orthologs. No significant GO terms were detected at any level (GO levels 3 to 9 see Additional file 4). To exclude the effect of orthologs that are NMD candidates in both species, we repeated the analysis after removing these orthologs from either or both species. As before there was no GO term showing a significant difference between mice and humans in the regularity of NMD (data not shown). This indicates that there is no functional class in which there are significantly more or fewer human NMD candidates compared against mouse NMD candidates.

These results suggest that NMD targets different genes in the two species, but ones largely in the same functional categories (Table 9 and Additional file 4). While superficially this looks like evidence for regulated splicing, if alternatively spliced genes are more prone to incorrect splicing, we expect, under the noisy splicing model, that the NMD-under-represented functional classes will have fewer alternatively spliced genes than other classes.

To test this, we extracted the genes associated with each functional class in Table 9 (excluding the Biological process unclassified class) for humans from the PANTHER database [65, 66]. Then, we compared the proportion of alternatively spliced genes in each class against the rest. As shown in Table 10, in total 12,466 out of 14,492 (86%) genes are alternatively spliced based on the ASD database [54, 55], while the proportions for classes Developmental processes, Cell-surface receptor-mediated signal transduction, Sensory perception, Signal transduction e Chemosensory perception are significantly smaller. Repeating the same analysis after removing all the NMD genes we find the same result (Table 10). These results suggest that covariation of functional class with NMD is consistent with the noisy splice model and different regularities of alternative splicing.


3 The Number of Human Protein-Coding Genes Went Up and Down in the Pre-Genome Era

Estimating the number of human genes dates back to the 1940s when the genetic code and even the structure of DNA were unknown. In 1948, James N. Spuhler estimated the number of genes a) to 42 000 by assuming human genes occupying the same mean chromosomal length than fruit fly genes and b) to 19 890–30 420 by extrapolating the number of loci in the nonhomologous segment of the sex chromosome derived from X-linked lethal mutations (Figura 1 and Box 2) 25 At about the same time, Hermann J. Muller estimated the frequency of mutations in humans resulting in 5000 to 20 000 human genes, 26 which is, on the upper limit, very close to the numbers discussed today. Later, Friedrich Vogel for the first time used physical entities estimating the number of genes based on the weight of genes of average length extrapolated to the weight of one human haploid chromosome set. 27 He calculated two numbers: one number he based on the length of haemoglobin genes resulting in 6.7 Mio genes, which he already dismissed as disturbingly high. Unfortunately, this number was nevertheless presented by Pertea and Salzberg as Vogel's number of genes, 28 which likely caused others to later cite this wrong number as well. 11, 29 The number Friedrich Vogel considered more reliable, 60 000 human genes, he derived by dividing the length of the human genome by the gene-length of 50 000 nucleotides inferred from the length of genes in Dipteran giant chromosomes. 27 In 1966, Muller revised his earlier estimate to “not much more than 30 000” genes. 30 These early estimates of 20 000–40 000 human genes based on genetic load arguments became the reference in textbooks and publications for the next 25 years, although the respective primary publications did not receive the citations they would have deserved.


Gene mutations

Mutations occur when the number or order of bases in a gene is disrupted. Nucleotides can be deleted, doubled, rearranged, or replaced, each alteration having a particular effect. Mutation generally has little or no effect, but, when it does alter an organism, the change may be lethal or cause disease. A beneficial mutation will rise in frequency within a population until it becomes the norm.

For more information on the influence of genetic mutations in humans and other organisms, Vejo human genetic disease and evolution.

The Editors of Encyclopaedia Britannica This article was most recently revised and updated by Adam Augustyn, Managing Editor, Reference Content.


Gene structure, introns and exons, splice sites

Predict genes by comparing genomic sequences from evolutionary related organisms to each other.

Find information about the roles that alternative splicing variants play in protein structure and function.

Access and mine enormous alternative splicing information.

Search for alternative splice events and the resultant isoform splice patterns of genes from human, and other model species.

Search for alternatively spliced genes.

Generate graphs for gene alternative slicing.

Search for comprehensive information on splicing by exon skipping in human genome.

Detect exon-intron structure of a gene by comparing the genomic sequence to the related ESTs.

Find information about alternative splicing gene variants.

Carry out simulated RT-PCR to detect transcript variants.

Find gene models including alternative splicing events from genomic alignment of mRNA, EST and protein sequences.

Analyze alternative splicing events in custom gene datasets.

Predict gene in eukaryotic genomic sequences based on a generalized hidden Markov model.

Derive Transcript Patterns from AltSplice Splice Patterns and search for information on polyA sites.

Search for information about the spliceosomal introns of the yeast Saccharomyces cerevisiae.

Search for comprehensive information about alternatively spliced genes of mammals.

Find information related to alternative splicing (AS) events.

Find information about aberrant splice sites.

Use a collection of methods to analyze and graphically represent various DNA parameters.

Search for alternative splice forms (ASforms) from nine eukaryotic organisms calculate of the tissue-NAEs, tissue-NCEs and tissue-NSS in human genome.

Search for annotated information about gene structure, function and expression, and alternative splicing events.

Search for EST-derived alternative splicing in human genome.

Rapidly analyze exon sequences to identify putative human exonic splicing enhancers (ESEs).

Search for information on the exon/intron structure of eukaryotic genes.

An algorithm designed to retrieve, compare and search for the exon-intron structure of existing gene annotations.

Identify exonic splicing silencers and predict if a coding SNP abolishes exonic splicing silencer motifs.

Asoftware tool for identifying and removing the vector from raw DNA sequence data without prior knowledge of the vector sequence.

Predict gene structures of plant genomes.

Find genes whose promoter regions have G-quadruplex motifs.

Search for annotated information on alternatively spliced human transcripts.

Search for annotated information on alternative gene splicing.

Search for Homo Sapiens Exon, Intron and Splice regions.

Search for putative alternative splicing information from human and mouse UniGene clusters.

A unified resource for analyzing effects of alternative splicing events in the context of protein structures.

Predict splicing phenotypes by identifying sequence changes that disrupt or alter predicted ESEs.

Search for known mammalian splice site sequences and other related information.

Search for occurrences of the four major alternative-splicing modes in human genome.

A web-based tool for splice-site analysis.

Search for information on alternative splice events at GYNGYN donors and NAGNAG acceptors.

Search and compare alternative splicing events in 15 animal species.

Explore the molecular biology and genomics of C. elegans with a special emphasis on alternative splicing.

Search for information on genome architecture and design in unicellular genomes.

Search for information on orthologous U12-introns from completely sequenced eukaryotic genomes.

Search for information on experimentally validated human noncoding fragments with gene enhancer activity as assessed in transgenic mice.

Search for information about all introns encoded in the nuclear and mitochondrial genomes of the yeast Saccharomyces cerevisiae.

Search for data from the Yeast Deletion, Mitochondrial Proteomics, and Yeast Expression Projects.

Deformation energy and nucleosome-positioning score calculator.

Search for computationally predicted human gene structure and splice variants derived from human mRNAs and ETS.

The Health Sciences Library System supports the Health Sciences at the University of Pittsburgh.

© 1996 - 2014 Health Sciences Library System, University of Pittsburgh. Todos os direitos reservados.
Contact the Webmaster


Findings

Humano Papillomavirus (HPV) infection is a particularly difficult problem for human immunodeficiency virus (HIV)-infected women because they are more vulnerable to infection and less likely to clear the virus, which increases their risk of developing cervical lesions and cancer[1]. Specifically, there are differences in the prevalence, incidence, progression and regression of HPV-related cervical diseases in HIV-infected women compared to HIV-uninfected women. Moreover, in HIV-infected women, cervical cancer (CC) responds poorly to recommended therapies, behaves more aggressively, and in cases of recurrence, has a poorer prognosis[1, 2]. The severe impact of HIV in relation to CC was demonstrated in a study that showed that HIV-positive women had an almost five fold greater chance of developing precancerous lesions than did HIV-uninfected women[3].

In cervical carcinogenesis, the integration of high-risk HPV (HR-HPV) into host-cell chromosomes is followed by the binding of HPV E6 and E7 oncoproteins with tumor suppressor proteins p53 e pRb, respectively. This process results in impaired tumor suppressor gene function, involving DNA repair, decreased apoptosis, deregulation of key controls in cell proliferation, and eventual cell immortalization[4].

o p53 tumor suppressor gene specifically inhibits cell cycle progression and promotes DNA repair and/or apoptosis its inactivation is correlated with a critical step in the development of many human cancers. Inactivation may result from a number of events, including mutation of the p53 gene (with or without associated allelic deletions) and binding of the p53 gene to cellular or viral proteins, such as the HPV E6 oncoprotein[5]. p53 mutations are mostly missense in nature and are located predominantly within the DNA-binding domain, where a single mutation is sufficient to cause loss of normal p53 function[6]. Studies on the association between CC and the loss of p53 function have yielded conflicting results[5, 7, 8].

Mutations in the p53 gene occur most frequently within exons 5–8, which is the highly conserved DNA binding domain region[9]. Studies on p53 that included all exons have suggested that mutations outside exons 5–8 are rare in tumors[10]. However, most studies on the involvement of the p53 gene in cervical carcinogenesis are related to its protein expression by immunohisto/cytochemical or polymorphism in condon-72[5, 7]. To our knowledge, no previous studies have analyzed the mutations in exons 5–8 of the p53 gene in HIV- and HPV-infected women. In our study, we verified these mutations in women with and without cervical abnormalities.

The study included cervical samples of 160 women who were divided into three groups: (1) 83 HPV- and HIV-infected (HIV group) (2) 37 HPV-infected/HIV-uninfected (control group) and (3) 40 cervical samples from women with normal cytology/DNA-HPV negative/HIV-uninfected that were only used as a negative control for the mutation of the p53 gene exons (negative control p 53 reactions). The women included in the study were enrolled in the Specialized Assistance Service (SAE) for sexually transmitted diseases (STD)/AIDS in Maringá, Brazil, between April 1, 2011, and October 30, 2011. In these samples, HPV-DNA was previously detected (data not shown) in the Clinical Cytology Laboratory at the State University of Maringá (UEM), Brazil, and stored at -80°C. Stored samples from HIV-infected and HIV-uninfected women, both with and without cervical lesions, were included in the study. The samples for 1 and 2 groups were also HPV-DNA positive.

Cervical and endocervical samples were collected using a cytobrush and an Ayre’s spatula, transferred to 1.5 ml tubes with 1.0 ml of sterile 0.9% NaCl solution, and stored at -80°C. Genomic DNA was extracted using the AxyPrep™ Body Fluid Viral DNA/RNA Miniprep Kit (AP-MN-Bf-VNA-50, Axygen, CA, USA) according to the manufacturer’s instructions. The quality and quantity of purified DNA were measured by spectrophotometry. HPV polymerase chain reaction (PCR) amplification for HPV was conducted using primers MY09 (5′CGTCCMAARGGAWACTGATC-3′) and MY11 (5′-GCMCAGGGWCATAAYAATGG-3′) co-amplification of the human β-globin gene was performed as an internal control using primers GH20 (5′-GAAGAGCCAAGGACAGGTAC-3′) and PC04 (5′-CAACTTCATCCACGTTCACC-3′) under the same conditions as for the HPV-PCR[11]. The cytological smears were prepared with a portion of the collected material and were reported according to the Bethesda System[12]: normal, without altered cells atypical squamous cells of undetermined significance, cannot exclude high-grade squamous intraepithelial lesion (ASC-H) low-grade squamous intraepithelial lesion (LSIL) or high-grade squamous intraepithelial lesion (HSIL). Cases with a cytological diagnosis of HSIL were confirmed by histopathology.

For HPV genotyping of selected samples, a new HPV-PCR amplification was performed, which was followed by PCR-Restriction Fragment Length Polymorphism (PCR-RFLP) analysis using Hpy CH4V[13]. The mutations of the p53 g ene was verified by PCR-Single Strand Conformational Polymorphism (PCR-SSCP), which detects molecular changes in single-stranded DNA that cause changes in electrophoretic mobility[8]. The following primers were used: exon 5 (5′-TGTTCACTTGTGCCCTGACT-3′) / (5′-AGC AAT CAG TGA GGA ATC AG-3′), 310 bp exon 6 (5′-TGGTTGCCCAGGGTCCCCAG-3′) / (5′-TGGAGGGCCACTGACAACCA--3′), 223 bp exon 7 (5′-CTTGCCACAGGTCTCCCCAA-3′) / (5′-AGGGGTCAGCGGCAAGCAGA-3′), 248 bp and exon 8 (5′-TTGGGAGTAGATGGAGCCT-3′) / (5′-AGAGGCAAGGAAAGGTGATA-3′), 213 bp. This is a simple technique which allows the identification of samples with type missense mutation, as well as correlation with the expression of mutated p53[14]. The women signed a consent form, and this study was approved by the Committee for Ethics in Research Involving Humans at the State University of Maringá (UEM)/Paraná, Brazil (No. 085/2011).

The statistical analysis was performed using STATISTICA 8.0 software, and all of the variables were expressed as absolute and relative frequencies. The rates of p 53 exon mutations in the groups of women were compared using a non-parametric Z test. A p value < 0.05 was considered statistically significant.

On average, the HIV group was older than the control group (40.9 ± 11.23 vs 35.7 ± 10.57 years old p = 0.0254). The majority of the HIV group showed excellent control of the HIV infection, as determined by the correct use of highly active antiretroviral therapy (HAART) (79.2%), current CD4+ T lymphocyte count > 350 cells/mm 3 (73.6%) and current viral load < minimum limit (58.4%) or between the minimum limit and 100 copies/mL (38.8%).

The most common HR-HPV in the HIV group were HPV-51 and HPV-16 (n = 11/83, 13.5% each). Of these samples, a p53 mutation occurred in only 1 sample of HPV-16 (9.1%) and in 6 samples of HPV-51 (54.5%). For the control group, HPV-16 (n = 6/37, 16.2%) and HPV-66 (n = 5/37, 13.5%) were the most common, but the p53 mutation was observed in only 1 sample each (16.7% and 20.0%, respectively). HPV-58 was detected in 2 samples, and the mutation occurred in these 2 samples (100%). In regards to the cytological findings, the HIV group showed the following: 70 normal, 2 ASC-H, 10 LSIL and 1 HSIL. The findings in the control group were as follows: 21 normal, 6 ASC-H, 9 LSIL and 1 HSIL (Table 1).

Figure 1(a) shows a mutation in exon 6 as an example of abnormal bands of the p53 gene. In total, 19.3% of the HIV group and 18.9% of the control group (p = 0.4896) showed mutations in the p53 gene and all had HR-HPV. As previously described, no mutations occurred in any of the negative control p 53 reactions[15] which is baseline condition this population. A mutation in exon 7 alone or together with a mutation in exon 6 was the highest in the HIV group (43.8%), and a mutation in exon 6 was highest in the control group (57.2%) (p = 0.0793) (Figure 1b). However, because the p value was close to being statistically significant, these data may suggest a tendency toward mutations in exon 7 in the HIV group.

Mutation in exon 6 of the p53 gene in the HIV group compared with the control group. Panel uma: Electrophoretic analysis of cervical p53 gene mutations using PCR-Single Strand Conformational Polymorphism (PCR-SSCP) in an 8% polyacrylamide gel stained with ethidium bromide. Samples A1-A3, negative for p53 gene mutations A4, positive for p53 gene mutation (arrow) C, negative control p 53 reactions M, 25 bp molecular weight marker. Panel b: The frequency of mutations in p53 exons 5 to 8 in both groups. Exon 7 and exon 6 were the most mutated exons examined in the HIV group and in the control group, respectively.

In the HIV group, a mutation in exon 7 occurred at the highest frequency in normal cytology (31.3%) followed by LSIL and HSIL (6.3% for both). For the control group, a mutation in exon 6 was most common in both normal cytology and LSIL (28.6% each) (Table 1). There was no difference in mutation rates in normal cytology or lesions in both groups (p = 0.4956 and 0.3303, respectively Table 1).

These findings suggested that the HPV infection appears to lead to a mutation in the p53 gene in different exons in HIV-infected and HIV-uninfected women, i.e., mainly in exons 7 and 6, respectively. A point mutation at the splice donor site at the 3′ end of exon 7 of the human p53 gene results in the retention of the intron 7 sequence in the mRNA, thereby inactivating the p53 protein[16].

We also showed that the total mutation in p53 gene exons 5–8 was not significantly associated with the HIV and control groups, and in women of both groups with normal cytology or different grades of cervical abnormalities, similar to those described for p53 gene condon 72 polymorphism[7] and p53 gene immunoexpression[5] in HIV-uninfected women. Interestingly, the samples from the HIV group with HPV-51 showed the highest rates of mutations in the p53 gene which deserves further studies. Overall, higher rates of cervical HPV infection and CC can be partly related to a more specific mutated exon in HIV-infected patients.

Through its effect on CD4 cells and regulation of immune responses to a variety of antigens, HIV infection may attenuate the systemic immune response to HPV. It is speculated that if there is a low number of circulating HPV-specific memory cells, then HPV-specific immunity may be particularly vulnerable to the effects of HIV. Possible due to this HIV-infected women are more vulnerable to infection and less likely to clear the virus, which increases their risk of developing cervical lesions and cancer[1]. According to this hypothesis, HPV-specific immunity may not recover fully after immune response is restored, which may explain the relatively limited beneficial effect of HAART on HPV cervical infection and CC[17].


2. Gene expression

Prokaryotic cells and eukaryotic cells also differ in the way genes are expressed. Prokaryotic cells have compact genomes that lack introns or large non-coding regions. The genes of these organisms are expressed in groups, called operons, that are transcribed on the same piece of RNA and then made into separate proteins. Since prokaryotes lack a nucleus, DNA transcription into RNA and RNA translation into proteins can occur simultaneously. The DNA of eukaryotic cells however, is enclosed in the nucleus so transcription must be completed and the mRNA sent out of the nucleus before translation can occur. In eukaryotic cells, mRNA transcripts are modified before they are translated because they contain introns that need to be removed. Thus the mature mRNA that leaves the nucleus will only contain exon sequences that will be translated to protein by ribosomes in the cytoplasm.


SINEs (Short interspersed elements)

There are over one million copies in the human genome (representing some 10% of our total DNA).

The most abundant SINEs are the Alu elements. Alu elements consist of a sequence averaging 260 base pairs that contains a site that is recognized by the restriction enzyme AluI. They appear to be reverse transcripts of 7S RNA, part of the signal recognition particle.

Most SINEs do not encode any functional molecules and depend on the machinery of active L1 elements to be transposed that is, copied and pasted in new locations.

The RNA genome of HIV-1 contains a gene for

  • reverse transcriptase and one for
  • integrase. The integrase serves the same function as the transposases of DNA transposons. The DNA copies can be inserted anywhere in the genome.

Gene regulation

Gene regulation is a label for the cellular processes that control the rate and manner of gene expression. A complex set of interactions between genes, RNA molecules, proteins (including transcription factors) and other components of the expression system determine when and where specific genes are activated and the amount of protein or RNA product produced.

Some genes are expressed continuously, as they produce proteins involved in basic metabolic functions some genes are expressed as part of the process of cell differentiation and some genes are expressed as a result of cell differentiation.

Mechanisms of gene regulation include:

  • Regulating the rate of transcription. This is the most economical method of regulation.
  • Regulating the processing of RNA molecules, including alternative splicing to produce more than one protein product from a single gene.
  • Regulating the stability of mRNA molecules.
  • Regulating the rate of translation.

Transcription factors are proteins that play a role in regulating the transcription of genes by binding to specific regulatory nucleotide sequences.


Assista o vídeo: Introns vs Exons (Agosto 2022).