Em formação

Como os primeiros genes foram isolados de bibliotecas genômicas ou de cDNA sem já conhecer uma sonda de hibridização?

Como os primeiros genes foram isolados de bibliotecas genômicas ou de cDNA sem já conhecer uma sonda de hibridização?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Vamos voltar no tempo, por volta de 1975. É meu entendimento que naquele ponto (ou pelo menos no final da década), as bibliotecas genômicas e de cDNA foram criadas para alguns organismos, por ex. coelhos. Estou interessado na lógica das técnicas que primeiro usaram essas bibliotecas para isolar genes que codificam para proteínas específicas. Nota: não estou interessado em como isolaríamos um gene hoje; Eu quero entender a história.

Primeiro, considere o seguinte experimento mental. Digamos que seja por volta de 1975. A única tarefa para minha aula de biologia da Cal Tech é uma doozy: é o seguinte. O instrutor (Tom Maniastis?) Me entrega uma proteína junto com as células das quais a proteína foi isolada, bem como bibliotecas genômicas e de cDNA do organismo que produz a proteína; o desafio é isolar o gene que codifica para a proteína. Não sei nada sobre a proteína, exceto que o produto que recebi é puro.

Obviamente, a ideia básica é simples: isolar o gene examinando as bibliotecas com uma sonda de ácido nucléico radioativo e usando um ensaio de hibridização. Mas, infelizmente, não tenho uma sonda complementar: só tenho a proteína! O que eu faço?

Aqui está uma solução que posso imaginar. (Não sei se foi possível por volta de 1975, muito menos se realmente aconteceu.) Eu poderia tentar isolar o mRNA que codifica minha proteína (mas como fazer naquela?), em seguida, radiomarque-o e use o mRNA radiomarcado como uma sonda em um ensaio de hibridização na biblioteca de cDNA (não na biblioteca genômica, uma vez que o DNA não processado pode ter regiões não codificantes).

  1. Isso teria funcionado?
  2. Alguém realmente fez isso?
  3. Se sim para (1) ou (2), como alguém poderia descobrir qual mRNA codifica para a proteína?

A questão, em essência, é como chegar ao DNA, dado apenas uma proteína, por volta de 1975.


O seguinte é baseado em um capítulo sobre Clonagem de DNA na 10ª edição de A Bioquímica dos Ácidos Nucleicos (RLP Adams et al.) publicado pela Chapman & Hall em 1986. (Provavelmente mais pertinente do que a 11ª e última edição, que foi publicada em 1992 e teve um tratamento mais contemporâneo.) Peço desculpas pelo fato de que será difícil de encontrar. Deve estar disponível em algumas bibliotecas universitárias e por meio de sistemas de empréstimo entre bibliotecas em alguns países. A seção A.7.3 dá uma ideia da metodologia usada naquela época.

Propriedades da proteína que podem ser usadas como base para uma estratégia de clonagem

Na tentativa de clonar o DNA de uma proteína específica para a qual não havia clones pré-existentes para usar como sondas de hibridização, era preciso considerar as propriedades da proteína que alguém é capaz de explorar. Isso pode incluir:

  • Sequência de aminoácidos
  • Anticorpos para a proteína
  • Atividade biológica
  • Propriedades físicas particulares, como tamanho

(Claramente, se alguém não tivesse esse "controle" para a proteína, não estaria em posição de tentar clonar seu cDNA ou gene.)

Três abordagens gerais

Parecia haver três abordagens gerais:

  • Nenhuma expressão
  • Expressão indireta
  • Expressão direta

A abordagem que se poderia adotar também era governada pelo fato de a proteína ser particularmente abundante em um tecido específico, quando se poderia esperar abordagens menos sofisticadas e mais trabalhosas para ter uma chance de sucesso.

Outro ponto a enfatizar é que, pelo menos com eucariotos, a pessoa procuraria primeiro um clone de cDNA, e só tentaria um clone genômico após tê-lo para empregar como sonda de hibridização.

1. Abordagens de 'nenhuma expressão'

Nas abordagens sem expressão, baseava-se na sequência de aminoácidos para identificar o DNA clonado. Uma dessas abordagens era usar sondas de hibridização contra trechos de aminoácidos, cujos códons tinham redundância limitada (Met e Trp têm um único códon e alguns outros aminoácidos apenas dois) usando condições de hibridização de baixo rigor. Isso exigia sorte. Alternativamente, pode-se sequenciar clones aleatórios e esperar encontrar um que se correlacione com a sequência de aminoácidos. Naquela época, o sequenciamento do DNA era lento e trabalhoso, de modo que só se aplicava a proteínas relativamente abundantes no tecido a partir do qual a biblioteca foi preparada.

2. Abordagens de expressão direta

A expressão direta geralmente envolve o uso de um vetor de expressão bacteriana que produz uma fusão de uma proteína bacteriana com uma parte da proteína eucariótica. (Estatisticamente, apenas um em seis dos clones teria o quadro de leitura correto em uma proteína de fusão.). Essa abordagem era favorecida se alguém tivesse um anticorpo, que não exigisse uma proteína completa.

3. Abordagens de expressão indireta

Por expressão indireta entende-se o uso de cDNA clonado imobilizado para selecionar mRNAs correspondentes ('seleção de híbrido') que podem ser expressos em um sistema livre de células. Isso era apropriado se a característica distintiva exigisse uma proteína de comprimento total, como no caso de atividade biológica ou tamanho.


Específico para o gene da insulina, o seguinte artigo é, até onde eu sei, o primeiro a isolá-lo:

Ullrich A, Shine J, Chirgwin J, Pictet R, Tischer E, Rutter WJ, Goodman HM. 1977. Genes de insulina de rato: construção de plasmídeos contendo as sequências de codificação. Science 196: 1313-1319.

Eles aproveitaram o fato de que a insulina é produzida pelas células β do pâncreas e, portanto, são enriquecidas em mRNA da insulina. Depois que o RNA poli (A) foi isolado e transcrito reversamente, esperava-se que a banda principal observada na eletroforese do cDNA resultante pertencesse ao gene da insulina:

Parecia provável que os fragmentos [principais] fossem derivados do cDNA da insulina devido à sua proeminência na preparação do cDNA total. Portanto, estes fragmentos, bem como as preparações de cDNA completas, foram usados ​​nas experiências de clonagem.

Assim, eles clonaram este cDNA, sequenciaram-no e descobriram que continha toda a sequência de codificação da pró-insulina:

Uma vez que o mRNA contém uma sequência terminal poli (A), a cadeia de DNA [clonada] contendo 3 'terminal poli (dA) tem o mesmo sentido. Esta cadeia determina uma sequência de aminoácidos que corresponde exatamente a toda a região de codificação para a pró-insulina I de rato e 13 dos 23 aminoácidos da sequência de pré-péptido.

Com esta sequência determinada e devido ao seu alto grau de conservação, o gene homólogo humano poderia ser isolado por hibridização com cDNA de insulina de rato:

Bell GI, Swain WF, Pictet R, Cordell B, Goodman HM, Rutter WJ. 1979. Sequência de nucleotídeos de um clone de cDNA que codifica a preproinsulina humana. Nature 282: 525-527.


Os cientistas sabem que uma mutação - ou alteração - no DNA de um determinado gene pode contribuir para uma determinada doença. No entanto, pode ser muito difícil desenvolver um teste para detectar essas mutações, porque a maioria dos genes grandes tem muitas regiões onde as mutações podem ocorrer. Por exemplo, os pesquisadores acreditam que as mutações nos genes BRCA1 e BRCA2 causar até 60 por cento de todos os casos de câncer de mama hereditário e câncer de ovário. Mas não há uma mutação específica responsável por todos esses casos. Os pesquisadores já descobriram mais de 800 mutações diferentes em BRCA1 sozinho. O microarray de DNA é uma ferramenta usada para determinar se o DNA de um determinado indivíduo contém uma mutação em genes como BRCA1 e BRCA2. O chip consiste em uma pequena placa de vidro envolta em plástico. Algumas empresas fabricam microarrays usando métodos semelhantes aos usados ​​para fazer microchips de computador. Na superfície, cada chip contém milhares de sequências de DNA curtas, sintéticas e de fita simples, que juntas se somam ao gene normal em questão e às variantes (mutações) desse gene que foram encontradas na população humana.

Os cientistas sabem que uma mutação - ou alteração - no DNA de um determinado gene pode contribuir para uma determinada doença. No entanto, pode ser muito difícil desenvolver um teste para detectar essas mutações, porque a maioria dos genes grandes tem muitas regiões onde as mutações podem ocorrer. Por exemplo, os pesquisadores acreditam que as mutações nos genes BRCA1 e BRCA2 causar até 60 por cento de todos os casos de câncer hereditário de mama e ovário. Mas não existe uma mutação específica responsável por todos esses casos. Os pesquisadores já descobriram mais de 800 mutações diferentes em BRCA1 sozinho. O microarray de DNA é uma ferramenta usada para determinar se o DNA de um determinado indivíduo contém uma mutação em genes como BRCA1 e BRCA2. O chip consiste em uma pequena placa de vidro envolta em plástico. Algumas empresas fabricam microarrays usando métodos semelhantes aos usados ​​para fazer microchips de computador. Na superfície, cada chip contém milhares de sequências de DNA curtas, sintéticas e de fita simples, que juntas se somam ao gene normal em questão e às variantes (mutações) desse gene que foram encontradas na população humana.


Clonagem de genes: métodos e vantagens | Bioquímica

Neste artigo iremos discutir sobre: ​​1. Métodos de clonagem, 2. Clonagem de um gene específico, 3. Clonagem de um gene específico, 4. Expressão de genes clonados, 5. Clonagem de genes em células eucarióticas e 6. Precauções para ser tomadas durante os experimentos de recombinação genética.

Métodos de clonagem:

Nos últimos anos, um número crescente de laboratórios empreendeu experimentos de recombinação genética in vitro. Esses experimentos consistem em incorporar DNA heterólogo de maneira estável em uma célula bacteriana (geralmente a cepa de E.coli K12), através de um vetor que pode ser um plasmídeo ou um fago, como o fago, isto é, material genético capaz de existir independentemente do cromossomo bacteriano e de se replicar de forma autônoma.

Por exemplo, se um plasmídeo for usado (ou seja, uma molécula de DNA de fita dupla circular fechada covalentemente presente na célula bacteriana independentemente do cromossomo), o princípio dos experimentos consistirá em isolar o plasmídeo da célula bacteriana, dividindo esta molécula de DNA por meio de uma enzima muito específica (uma endonuclease de restrição), unindo o DNA plasmídeo clivado ao DNA heterólogo a ser clonado e finalmente reintroduzindo - graças ao processo de transformação - na célula bacteriana o plasmídeo portador do DNA heterólogo.

Dentre os plasmídeos mais utilizados, podemos citar os feitos in vitro pelas técnicas de recombinação de DNA, e que muitas vezes pertencem à série Col, por conterem genes que codificam para a produção de uma colicina (uma proteína extracelular, com propriedades antibióticas, produzida por E.coli).

Os plasmídeos usados ​​para a clonagem de genes geralmente têm as seguintes propriedades: seu tamanho é comparativamente pequeno, eles possuem pelo menos um único sítio sensível a uma endoculease de restrição, eles contêm um (ou vários) gene (s) que permitem a seleção das células transformadas pelo plasmídeo estão presentes na concentração de cerca de 20 moléculas por célula, mas na presença de cloromfenicol sua replicação leva ao acúmulo de 1 000 a 2 000 moléculas circulares de DNA de plasmídeo por célula, podem ser facilmente isoladas de células bacterianas e também podem ser facilmente reintroduzido neles.

O diagrama da fig. 6-51 mostra as principais etapas que permitem a clonagem de genes heterólogos em uma célula bacteriana. Devido ao seu grande tamanho, o DNA bacteriano é muito sensível às forças de cisalhamento, de modo que é cortado em fragmentos durante a extração dos DNAs, enquanto o DNA plasmídico muito menor em tamanho, apresenta-se na forma de circular (fechado covalentemente) as moléculas superenroladas de fita dupla permanecem intactas e podem ser facilmente separadas do DNA bacteriano por centrifugação em gradiente de densidade, na presença de uma molécula que intercala entre as bases do DNA, o brometo de etídio.

As restrições físicas existentes em uma molécula de DNA circular fechada covalentemente são tais que a quantidade de brometo de etídio ligado será limitada. Essas restrições não existem em uma molécula linear e a quantidade de brometo de etídio ligado por unidade de comprimento de DNA será muito maior.

Em comparação com a densidade dos complexos circulares, a densidade dos complexos lineares será, portanto, suficientemente reduzida para permitir sua separação durante uma sedimentação isópica (a diminuição na densidade do DNA é proporcional à quantidade de brometo de etídio ligado por unidade de comprimento).

Para clivar o DNA de plasmídeo e o DNA heterólogo, pode-se usar uma endonuclease de restrição produzindo extremidades coesivas que, por um lado, irão subsequentemente facilitar a união do fragmento de DNA heterólogo com o plasmídeo por meio de polinucleotídeo ligase e, por outro lado, permitirá - com a ajuda da mesma enzima de restrição - a excisão do DNA inserido do plasmídeo (se, por exemplo, se quiser estudar a estrutura do fragmento de DNA inserido).

Mas também se pode usar outras enzimas de restrição (que não produzem extremidades coesivas, por exemplo, Hae III), e atingir a ciclização após adição de poli dA nas extremidades 3 & # 8242 dos fragmentos de DNA heterólogo e de poli dT na extremidade 3 & # 8242 do DNA de plasmídeo clivado, que permite o emparelhamento de segmentos poli dA e poli dT e, em seguida, a união covalente do fragmento e do plasmídeo com a ajuda de polinucleotídeo ligase, este método oferece a vantagem de evitar a ciclização do plasmídeo sem a inserção de DNA estranho , com o resultado de que praticamente todas as células bacterianas transformadas, selecionadas pelo marcador genético do plasmídeo, conterão um plasmídeo híbrido (isto é, com DNA heterólogo inserido).

Em geral, em condições ideais, uma célula de E. coli de 10 5 ou 10 6 será transformada pelo plasmídeo. Deve-se notar que não há tamanho mínimo para o DNA heterólogo inserido em um plasmídeo, e que esse tamanho pode atingir pelo menos 40 x 10 6 daltons, ou seja, cerca de 60.000 pares de bases (= 60 kb).

Além disso, a inserção de DNA estranho em plasmídeos da série Col não afeta o número de moléculas de plasmídeo que podem estar presentes na célula, de modo que o DNA heterólogo inserido estará presente também na concentração de várias cópias na célula bacteriana transformada. . Por último, sob o efeito de cloram e shifenicol, pode-se ter uma amplificação de modo que o DNA circular do plasmídeo híbrido represente 40 a 50% da totalidade do DNA da célula.

O DNA do bacteriófago (47.000 pares de bases = 47 kb) é freqüentemente usado como vetor de clonagem porque oferece algumas vantagens sobre os plasmídeos bacterianos. Cerca de 15 kb da parte central do genoma desse fago não são essenciais para sua sobrevivência e podem ser substituídos por DNA heterólogo para serem clonados.

Pode-se realizar in vitro a encapsidação do DNA recombinante obtido e assim aumentar consideravelmente a eficiência de infecção deste DNA. O mecanismo de encapsidação do fago é tal que apenas moléculas de DNA com um tamanho final de cerca de 47 kb serão encapsidadas, o que provoca uma seleção espontânea de moléculas de DNA, tendo inserido um fragmento heterólogo de cerca de 15 kb.

Os cosmídeos são pequenos plasmídeos que contêm um sinal de encapsidação (o local & # 8220cos & # 8221 do fago), uma origem de replicação e um gene de resistência a um antibiótico.

Eles, portanto, combinam as vantagens do bacteriófago (eficácia de infecção da forma encapsidada) e as dos plasmídeos bacterianos (replicação autônoma e facilidade de seleção). Além disso, podem-se inserir nos cosmídeos fragmentos de DNA heterólogo de maior tamanho (até 40 kb).

Esses dois vetores de clonagem (fago e cosmídeos) são frequentemente usados ​​para construir & # 8220banks & # 8221 ou & # 8220libraries & # 8221 genômicos que são coleções de fagos ou plasmídeos recom & shybinant que juntos compreendem a totalidade das sequências de um determinado genoma. É claro que quanto maior o tamanho dos fragmentos de DNA genômico inseridos, menor o número de clones necessários para cobrir a totalidade do genoma: esta é a vantagem especial dos cosmídeos.

Clonagem de um gene específico:

O problema é selecionar, de uma vasta população de células transformadas, uma célula que contém um plasmídeo híbrido que carrega um determinado gene heterólogo. Este é um problema sério, especialmente se o DNA heterólogo inicial for complexo e se os fragmentos gerados pela enzima de restrição forem numerosos. É claro que ou deve haver uma propriedade fenotípica associada ao gene clonado, ou deve-se ter uma sonda apropriada.

Se alguém clonar um gene que codifica para uma enzima, por exemplo, pode-se transformar um mutante bacteriano sem essa enzima e, assim, selecionar as células trans e tímidas apropriadas com base na restauração da atividade enzimática correspondente.

Assim, foi possível clonar os genes do operon triptofano, ou gene da ligase de E. coli, a partir de fragmentos de DNA resultantes da hidrólise de todo o cromossomo de E. coli. Mas se alguém deseja clonar um gene eucariótico, muitas vezes é preferível clonar primeiro a cópia do DNA (cDNA) do mRNA correspondente ao gene procurado.

O tamanho desses cDNAs é geralmente muito menor do que o de sua contraparte genômica devido à ausência de íntrons. Portanto, constrói-se uma biblioteca de cDNA & # 8220 & # 8221 inserindo, em um plasmídeo ou em um vetor derivado de bacteriófago (por exemplo, gt 10), cópias de cDNA de toda a população de mRNAs citoplasmáticos extraídos das células que expressam o gene em questão.

Estas cópias são feitas com a ajuda da transcriptase reversa que sintetiza as cadeias de cDNA complementares aos mRNAs a partir de iniciadores oligo dT previamente hibridizados com as caudas poli A dos mRNAs.

Após a hidrólise alcalina dos RNAs, as moléculas de cDNA de fita dupla são então obtidas pela ação da DNA polimerase I de E. coli que torna as fitas complementares àquelas sintetizadas durante a primeira etapa. A síntese é auto-iniciada & # 8220 & # 8221 na extremidade 3 & # 8242 do cDNA de fita simples que se dobra sobre si mesmo (ver fig. 6-31a).

Uma digestão por nuclease S1 (específica de ácidos nucléicos de fita simples) finalmente elimina as alças nesta extremidade e dá cDNAs de fita dupla perfeitamente. Uma biblioteca de cDNA é considerada completa se contiver pelo menos um clone bacteriano para cada mRNA inicial.

Existem vários métodos para identificar os clones procurados. Se os cDNAs foram inseridos a jusante de um promotor bacteriano (como no caso de gt 11), pode-se analisar (ou & # 8220 screen & # 8221) a & # 8220library & # 8221 pela expressão dos cDNAs. Isto é feito por identificação imunológica dos clones produtores, os anticorpos específicos da proteína correspondente irão reagir seletivamente com os clones relevantes que serão assim marcados.

O sucesso desta técnica de & # 8220 rastreio & # 8221 depende, entretanto, de vários fatores: o cDNA deve ser inserido na orientação correta em relação ao promotor bacteriano do vetor, a fim de permitir a transcrição de sua fita codificadora a tradução do mensageiro assim produzido deve ocorrer no quadro de leitura correto por último, a estrutura terciária adotada pelo polipeptídeo sintetizado deve reconstituir os determinantes an & shitigênicos (epítopos) reconhecidos pelos anticorpos.

Uma segunda abordagem, independente desses pré-requisitos, é baseada em desenvolvimentos recentes nas técnicas de micro-sequenciação de proteínas e na produção de oligodesoxinucleotídeos sintéticos. Com o conhecimento da sequência parcial de aminoácidos da proteína pode-se, com base no código genético, deduzir (levando em consideração o fato de que o código é degenerado) a sequência de nucleotídeos correspondente e realizar sua síntese química.

Esses oligonucleotídeos, marcados com 32 P, são então usados ​​como sondas radioativas para identificar, por hibridização com as sequências complementares, os clones bacterianos contendo o cDNA procurado.

Os cDNAs assim isolados podem, por sua vez, servir como sondas para procurar os genes correspondentes em um genômico & # 8220bank & # 8221.

Expressão de genes clonados:

Esses plasmídeos híbridos representam não apenas uma fonte abundante de DNA heterólogo inserido, mas também permitem a produção & # 8211 pela célula bacteriana & # 8211 de grandes quantidades de produtos especificados pelos genes inseridos, particularmente quando os genes clonados são da mesma bactéria ou outro procarioto: por exemplo, a clonagem do operon triptofano de E. coli em um plasmídeo da série Col permitiu a síntese induzida de quantidades tão grandes das cinco enzimas desse operon que representaram 40% das proteínas totais de a célula.

Mas quando genes de eucariotos são clonados em plasmídeos de E. coli, observa-se que a síntese - pela bactéria - dos produtos correspondentes a esses genes é muito pequena, ou mesmo nula, muito provavelmente por causa das diferenças entre os sistemas que controlam a transcrição e tradução em procariotos e eucariotos (por exemplo, no início e término da transcrição e tradução) ou devido à ausência de sistemas de splicing de íntrons em procariotos.

Alguns desses problemas podem ser resolvidos pela inserção de um cDNA (DNA complementar ao mRNA maduro) diretamente a jusante de um promotor procariótico funcional no plasmídeo. Desse modo, obtivemos nas bactérias a síntese de proteínas de diferentes origens: animal (hormônio do crescimento, somatostatina, insulina, interferon), vegetal (grande subunidade da ribulose 1, 5 bisfosfato carboxilase) ou viral (antígeno da hepatite Vírus B, ou do vírus da febre aftosa).

Deve-se enfatizar, entretanto, que a atividade biológica e tímida de algumas dessas proteínas pode depender de modificações subsequentes (clivagens proteolíticas específicas no caso de precursores ou glicosilação) que o hospedeiro procariótico não pode realizar.

Clonagem de genes em células eucarióticas:

No início, a clonagem de genes era feita principalmente por E.coli, mas os princípios em que se baseia esse processo também se aplicam a células animais e vegetais. Vírus ou plasmídeos capazes de introduzir genes nos cromossomos de células eucarióticas eram necessários, portanto, foi considerado o uso de vírus derivados do vírus Simian 40 (SV 40).

No que diz respeito ao reino vegetal, foi demonstrado que um fragmento de DNA (T-DNA) de um plasmídeo (plasmídeo Ti) da bactéria Agrobacterium tumefaciens (responsável pela formação de um tumor denominado Crown-Gall) poderia ser transferido para cromossomos de células vegetais.

Além disso, pode-se inserir, neste T-DNA, genes de origem bacteriana (por exemplo, gene de resistência a um antibiótico) ou de origem vegetal (por exemplo, gene da pequena subunidade da ribulose 1,5 bisfosfato carboxilase) e assim obter a sua transferência para um protoplasto de tabaco visto que em várias espécies (incluindo tabaco) pode-se regenerar uma planta inteira a partir de um protoplasto, podia-se observar, a partir de protoplastos transformados, a presença do gene inserido em diversos tecidos da planta transformada, observar sua expressão e observe que essa expressão é controlada por fatores (como a luz) que exercem seus efeitos regulatórios no nível transcricional nas plantas.

Algumas técnicas recentes permitem a introdução direta de DNA em células vegetais ou animais sem a ajuda de nenhum plasmídeo ou vetor viral (transferência direta de genes).

Vantagens da clonagem de genes:

A clonagem de genes proporcionou, pela primeira vez, grandes quantidades de fragmentos específicos de DNA, ou seja, genes, especialmente de organismos superiores. Estes fragmentos de DNA podem ser utilizados como sonda e permitem, por hibridação, a detecção e dosagem dos respectivos mRNAs em células que se encontram em diferentes estágios de desenvolvimento ou colocadas em diversas condições fisiológicas.

Por outro lado, pode-se, graças à clonagem de genes, empreender o estudo da estrutura dos genes e cromossomos dos eucariotos e o estudo dos mecanismos de controle da expressão gênica em organismos superiores.

Mas, além dos grandes avanços que podem ser esperados no domínio do conhecimento fundamental em biologia molecular, a clonagem de genes pode levar a aplicações extremamente importantes.

No campo da agronomia, pode-se considerar a transferência para as plantas:

1. Um gene responsável pela resistência a um herbicida (isolado, por exemplo, de um microorganismo), permitindo assim a proteção da planta cultivada quando as ervas daninhas são eliminadas pelo herbicida

2. Um gene responsável pela resistência a um patógeno (por exemplo, fungo, vírus, inseto). Foi possível obter plantas protegidas da infecção por um vírus (por exemplo, vírus do mosaico do tabaco), introduzindo nessas plantas o gene que codifica para a proteína da capa deste vírus, ou plantas protegidas do ataque de insetos pela introdução do gene nessas plantas de uma toxina bacteriana com propriedades inseticidas

3. Genes que melhoram o crescimento das plantas, por exemplo, possibilitando uma fotossíntese mais eficiente, ou permitindo a fixação de nitrogênio atmosférico (embora, nos microrganismos estudados, esse processo implique a expressão coordenada de 17 genes)

4. Genes que melhoram o valor nutricional das plantas, por exemplo, fornecendo proteínas de armazenamento de sementes mais ricas em alguns aminoácidos essenciais, como a lisina.

Isso pressupõe que o gene não é apenas introduzido na planta, mas também expresso no tecido certo (por exemplo, a semente) e no momento certo.

Na medicina, a produção de substâncias terapeuticamente importantes, por células (bacterianas, animais, humanas) em cultura após a introdução do gene correspondente e tímido, é uma das principais aplicações da engenharia genética. Entre as substâncias que já estão sendo produzidas ou em estudo, podem-se citar: a insulina (usada no tratamento do diabetes), o hormônio do crescimento (usado contra algumas formas de nanismo), os interferons (ação antiviral), o ativador do plasminogênio (ativo contra tromboses, porque a plasmina é uma enzima que degrada a fibrina dos coágulos), α-antitripsina (ativa contra o enfisema, porque inibe a elastase que digere a elastina do tecido conjuntivo pulmonar), os fatores sanguíneos VIII e IX (contra a hemofilia A e B, respectivamente), vários antígenos virais, como os da hepatite B ou febre aftosa (para a preparação de vacinas), etc.

Ressalta-se que a vantagem reside não só na produção de grandes quantidades de proteínas humanas, que não causarão alergias (ao contrário, por exemplo, da insulina suína utilizada até agora), mas também no fato dos produtos serem isentos de contaminantes, especialmente de origem viral, presente principalmente em substâncias preparadas a partir de sangue humano, principalmente quando se torna necessário reunir o sangue de muitos doadores para preparar quantidades apreciáveis ​​desses produtos (por exemplo, no caso de fatores anti-hemofílicos), o que aumenta os riscos (vários hemofílicos pacientes foram contaminados pelo vírus da hepatite ou da Aids).

As técnicas de engenharia genética também levaram a grandes avanços no diagnóstico de doenças hereditárias. Após a ação de uma enzima de restrição no DNA de um paciente, visualiza-se os fragmentos de DNA produzidos no locus genético da doença por hibridização com uma sonda radioativa apropriada (segmento de DNA ou oligonucleotídeo sintético correspondente a este locus ou a uma parte dele) .

A comparação do tamanho dos fragmentos de DNA assim revelados, com aqueles produzidos da mesma maneira em um sujeito saudável, permite a detecção de anomalias, se houver: deleções ou mesmo, se as condições de hibridização forem suficientemente seletivas (ou & # 8220stringente & # 8221), mutações pontuais.

Quando o gene responsável pela doença em questão não é conhecido, pode-se utilizar a existência no genoma de zonas cuja seqüência pode variar de uma em & shydividual a outra (zonas polimórficas ou pontos quentes de mutação). Estas zonas, caracterizadas pelo aparecimento ou desaparecimento de sítios de clivagem para uma determinada enzima de restrição, apresentam, portanto, um polimor e tifismo de comprimento de fragmento de restrição (RFLP).

Assim, se alguém possui uma sonda que pode revelar tal polimorfismo próximo ao suposto locus da doença, pode-se associar o aparecimento da doença em um indivíduo a um perfil de restrição característico do DNA desse indivíduo. É então possível, por meio da análise do RFLP do DNA dos pais e descendentes desse indivíduo, acompanhar a segregação do gene responsável pela doença, com o auxílio desta sonda.

Também foi considerado introduzir o gene intacto, em células animais ou humanas privadas de uma atividade enzimática particular devido a uma mutação no gene correspondente, e assim restaurar a atividade ausente nessas células.

Aplicações importantes de engenharia genética também são possíveis:

eu. No campo do meio ambiente, por exemplo, para a biodegradação de produtos tóxicos ou para a extração microbiológica de vários metais de minério de baixo teor.

ii. No campo da energia, por exemplo, para a produção de metano e metanol, ou para a recuperação de petróleo bruto não facilmente acessível pelos métodos convencionais de extração.

Precauções a serem tomadas durante os experimentos de recombinação genética:

Diz-se que as espécies vivas podem preservar sua identidade por várias gerações, graças à presença de barreiras naturais, e que a clonagem de genes, ao violar essas barreiras, pode criar novas formas de vida, perigosas para o homem e seu meio ambiente.

Experimentos de recombinação genética in vitro e clonagem de genes, bem como os possíveis riscos que podem colocar em risco a humanidade, têm sido objeto de muitas polêmicas. Cientistas que realizam tais experimentos nos Estados Unidos e também na Europa decidiram estabelecer uma série de medidas de precaução.

Embora não as discutamos aqui, apenas mencionaremos que tais medidas dizem respeito, por um lado, aos laboratórios onde os experimentos são realizados e, por outro lado, aos plasmídeos e às bactérias utilizadas. No que diz respeito aos laboratórios, deve-se naturalmente trabalhar em condições que excluam riscos de disseminação, como no caso de experimentos com bactérias e vírus patogênicos.

No que diz respeito aos plasmídeos, deve-se utilizar preferencialmente plasmídeos sem genes que permitam a conjugação bacteriana, o que reduzirá o risco de disseminação de moléculas de plasmídeo híbrido em nosso meio.


O que são DNA genômico e complementar?

O DNA que reside nos cromossomos dentro do núcleo, com todas as informações biológicas a serem transferidas para a próxima geração, é denominado DNA genômico (gDNA). As palavras “genoma” e “genômico” vêm da palavra “gene”. Um gene é um conjunto de códons que especificam uma cadeia de proteína específica, junto com os códons de início e parada associados. A palavra genoma é uma extensão deste conceito e significa a coleção de todos os genes e outras informações contidas dentro dos núcleos das células de um organismo. Freqüentemente, quando a palavra "DNA" é usada sem maiores esclarecimentos, ela se refere a gDNA.

Na natureza, o processo de transmissão das informações do DNA pode ocorrer por meio da replicação ou da expressão gênica. Existem alguns fatores importantes a serem observados:

  • DNA can copy itself in a process known as replication, using DNA polymerase.
  • Information from DNA is passed through messenger RNA (mRNA), which contains sets of four nucleotides (uracil, adenine, guanine, and cytosine).
  • mRNA is produced when enzymes, such as RNA polymerase, bind to specific genes and copy their information into RNA using a ribose sugar (not deoxyribose as in DNA). This process is called transcription.
  • Ribosomes assemble around mRNA, creating an amino acid chain to create specific proteins. This is called translation.
  • Due to the ribose sugar chains, mRNA is short lived. It is designed to convey information from the chromosomes in the nucleus to the machinery that makes proteins.
  • mRNA degrades rapidly after it has completed it’s purpose.

Initially, it was observed that gDNA was always read and transcribed into mRNA, which guided protein formation and then was disposed. The notion that information might always flow from DNA to RNA to protein was somewhat jokingly referred to as the Central Dogma of molecular biology. Calling it that challenged scientists to find exceptions to this rule.

Virologists eventually did find one such exception. Retroviruses were discovered to have mechanisms for “reverse transcription.” This means that they can take RNA chains and produce DNA chains from them. In this way, during reverse transcription, information flowed backwards from RNA back to DNA. DNA that arises from this process is called complementary DNA (cDNA). cDNA is either produced by some viruses or synthesized in laboratories. The various processes involved in creating DNA and RNA are demonstrated in Figure 2.

Figure 2: the “Central Dogma” of biology fails to take reverse transcription into account ( Research Gate ).


Making a DNA Library

We have learned that the most important goal of recombinant DNA technology is to clone a particular gene or other genomic fragment of interest to the researcher. The approach used to clone a specific gene depends to a large degree on the gene in question and on what is known about it. Generally, the procedures start with a sample of DNA such as eukaryotic genomic DNA. The next step is to obtain a large collection of clones made from this original DNA sample. The collection of clones is called a DNA library. This step is sometimes referred to as “shotgun” cloning because the experimenter clones a large sample of fragments and hopes that one of the clones will contain a “hit”—the desired gene. The task then is to find that particular clone.

There are different types of libraries, categorized, first, according to which vector is used and, second, according to the source of DNA. Different cloning vectors carry different amounts of DNA, so the choice of vector for library construction depends on the size of the genome (or other DNA sample) being made into the library. Plasmid and phage vectors carry small amounts of DNA, so these vectors are suitable for cloning genes from organisms with small genomes. Cosmids carry larger amounts of DNA, and other vectors such as YACs and BACs (see Chapter 12) carry the largest amounts of all. Ease of manipulation is another important factor in choosing a vector. A phage library is a suspension of phages. A plasmid or a cosmid library is a suspension of bacteria or a set of defined bacterial cultures stored in culture tubes or microtiter dishes.

The second important decision is whether to make a genomic library or a Biblioteca de cDNA. cDNA, or complementary DNA, is synthetic DNA made from mRNA with the use of a special enzyme called reverse transcriptase originally isolated from retroviruses. With the use of an mRNA as a template, reverse transcriptase synthesizes a single-stranded DNA molecule that can then be used as a template for double-stranded DNA synthesis (Figure 10-9). Because it is made from mRNA, cDNA is devoid of both upstream and downstream regulatory sequences and of introns. This means that cDNA from eukaryotes can be translated into functional protein in bacteria𠅊n important feature when expressing eukaryotic genes in bacterial hosts.

Figure 10-9

The synthesis of double-stranded cDNA from mRNA. A short oligo(dT) chain is hybridized to the poly(A) tail of an mRNA strand. The oligo(dT) segment serves as a primer for the action of reverse transcriptase, which uses the mRNA as a template for the synthesis of (more. )

The choice between genomic DNA and cDNA depends on the situation. If a specific gene that is active in a specific type of tissue in a plant or animal is being sought, then it makes sense to use that tissue to prepare mRNA to be converted into cDNA and then make a cDNA library from that sample. This library should be enriched for the gene in question. A cDNA library is based on the regions of the genome transcribed, so it will inevitably be smaller than a complete genomic library, which should contain all of the genome. Although genomic libraries are bigger, they do have the benefit of containing genes in their native form, including introns and regulatory sequences. If the purpose of constructing the library is a prelude to cloning an entire genome, then a genomic library is necessary at some stage.

In some cases, it is possible to narrow down the genomic fraction used in library construction, to more easily detect the desired gene. This approach is possible if the experimenter already knows which chromosome contains the gene. One technique used in mammalian molecular genetics is to sort the chromosomes with an instrument called a flow cytometer. A suspension of chromosomes is passed through the apparatus, which sorts the chromosomes according to size (this procedure is discussed in more detail in Chapter 12). The appropriate chromosomal fraction is then used to make the library.

Another technique possible in organisms with small chromosomes is to fractionate whole chromosomes by using pulsed field gel electrophoresis (PFGE). Electrophoresis is a general technique that fractionates nucleic acids or proteins according to size on gels under the influence of a strong electric field. This type of procedure separates shorter DNA fragments. PFGE is a specialized type of electrophoresis useful for very long DNA molecules. It uses several oscillating electric fields oriented in several different directions. This enables large DNA molecules such as whole chromosomes to snake through the gel to different positions according to their size. The appropriate chromosome can be identified on the gel by probing with a chromosome-specific probe (see the next subsection). Then the desired chromosome can be cut out, eluted from the gel, and used to make a chromosome-specific library.

How can an experimenter determine whether a library is large enough to contain any one unique sequence of interest with a reasonable degree of certainty? There are formulas for calculating the minimum number of clones needed, but a rough idea of the general order of magnitude of the library can be obtained simply by taking the total genome size and dividing by the average size of the inserts carried by the vector being used. Generally, this number will be at least doubled, but it does provide a rough estimate of the magnitude of the job of library construction.

MESSAGE

The task of isolating a clone of a specific gene begins with making a library of genomic DNA or cDNA—if possible, enriched for sequences containing the gene in question.


Plasmid vectors

Plasmids estão autonomously replicating circular DNA molecules found in bacteria. They have their own origin of replication, and they replicate independently of the origins on the "host" chromosome. Replication is usually dependent on host functions, such as DNA polymerases, but regulation of plasmid replication is distinct from that of the host chromosome. Plamsids, such as the sex-factor F, can be very large (94 kb), but others can be small (2𔂮 kb). Plasmids do not encode an essential function to the bacterium, which distinguishes them from chromosomes.

Plasmids can be present in a single copy, such as F, or in multiple copies, like those used as most cloning vectors, such as pBR322, pUC, and pBluescript.

In nature, plasmids provide carry some useful function, such as transfer (F), or antibiotic resistance. This is what keeps the plasmids in a population. In the absence of selection, plasmids are lost from bacteria.

The antibiotic resistance genes on plasmids are often carried within, or are derived from, transposons, a types of transposable element. These are DNA segments that are capable of "jumping" or moving to new locations (see Chapter 9).

A plasmid that was widely used in many recombinant DNA projects is pBR322 (Fig. 3.7). It replicates from an origin derived from a colicin-resistance plasmid (ColE1). This origin allows a fairly high copy number, about 100 copies of the plasmid per cell. Plasmid pBR322 carries two antibiotic resistance genes, each derived from different transposons. These transposons were initially found in R-factors, which are larger plasmids that confer antibiotic resistance.

Figure 3.7. Features of plasmid pBR322. The gene conferring resistance to ampicillin (Ap R ) can be interrupted by insertion of a DNA fragment into the PST I site, and the gene conferring resistance to tetracycline (Tc R ) can be interrupted by insertion of a DNA fragment into the Bam HI site. Replication is controlled by the ColE1 origin.

Use of the Tc R and Ap R genes allows for easy screening for recombinants carrying inserts of foreign DNA. For instance, insertion of a restriction fragment in the Bam HI site of the Tc R gene inactivates that gene. One can still select for Ap R colonies, and then screen to see which ones have lost Tc R .

Question 3.1. What effects on drug resistance are seen when you use the Eco RI or PST I sites in pBR322 for inserting foreign DNA?

A generation of vectors developed after pBR322 are designed for even more efficient screening for recombinant plasmids , i.e. those that have foreign DNA inserted. o pUC plasmids (named for plasmid vocêniversal cloning) and plasmids derived from them use a rapid screen for inactivation of the b -galactosidase gene to identify recombinants (Fig. 3.8).

One can screen for production of functional b ‑galactosidase in a cell by using the chromogenic substrate X‑gal (a halogenated indoyl b ‑galactoside). When cleaved by b ‑galactosidase, the halogenated indoyl compound is liberated and forms a blue precipitate. The pUC vector has the b ‑galactosidase gene . When introduced into E. coli , the colonies are blue on plates containing X‑gal.

o multiple cloning sites (unique restriction sites) are in the b ‑galactosidase gene (lacZ). When a restriction fragment is introduced into one or more of these sites, the b ‑galactosidase activity is lost by this insertional mutation. Thus cells containing recombinant plasmids form Branco (not blue) colonies on plates containing X‑gal.

The replication origin is a modified ColE1 origin of replication that has been mutated to eliminate a negative control region. Hence the copy number is very high (several hundred or more plasmid molecules per cell), and one obtains an very high yield of plasmid DNA from cultures of transformed bacteria. The plasmid has Ap R as a selectable marker.


Figure 3.8. pUC-type vectors


Notas de rodapé

↵ 1 This had to be a very special reagent to detect em vitro-translated HLA chains not associated with β2 microglobulin. Availability of this serum in the Strominger lab was one of the key elements of success.

↵ 2 By the time of my arrival, the directorship had rotated to Michel Fougereau.

↵ 3 This may have been an instance of Oedipal “father-killing” syndrome.

↵ 4 Both Malissens have gone on to very distinguished careers in molecular immunology.

↵ 5 With a publication whose title, on the proofs, read “HLA cosmid clones show complete, wisely spaced human class I genes” instead of “widely”—a mistake caught just in time!

↵ 6 NCBI reference sequence NR_001434.1. HLA-H should not be confused with the HLA-like gene involved in hereditary hematochromatosis, initially called HLA-H and then renamed HFE, which lies ∼2 Mb telomeric to HLA-H (Figure 2).

↵ 7 In the years before my move to CIML, my small group had published a number of respectable articles in the Journal of Molecular Biology (highly regarded at the time), but the topic (the structure and processing of small ribosomal RNAs) was not considered to be fashionable and, to be honest, was indeed rather dull.


Genome-wide analysis of differentially expressed genes from Penicillium chrysogenum grown with a repressing or a non-repressing carbon source

Penicillium chrysogenum is an economically important ascomycete used as industrial producer of penicillin. However, with the exception of penicillin biosynthesis genes, little attention has been paid to the genetics of other aspects of the metabolism of this fungus. In this article we describe the first attempt of systematic analysis of expressed genes in P. chrysogenum, using a suppression subtractive hybridization approach to clone and identify sequences of genes differentially expressed in media with glucose or lactose as carbon source (penicillin-repressing or non-repressing conditions). A total of 167 clones were analysed, 95 from the glucose condition and 72 from the lactose condition. Genes differentially expressed in the glucose condition encode mainly proteins involved in the mitochondrial electron transport chain and primary metabolism. Genes expressed differentially in lactose-containing medium include genes for secondary metabolism (pcbC, isopenicillin N synthase), different hydrolases and a gene encoding a putative hexose transporter or sensor. The results provided information on how the metabolism of this fungus adapts to different carbon sources. The expression patterns of some of the genes support the hypothesis that glucose induces higher rates of respiration in P. chrysogenum while repressing secondary metabolism.

Esta é uma prévia do conteúdo da assinatura, acesso através de sua instituição.


1. Genome Analysis

Large-scale DNA Sequencing

Last year's report outlined two projects -- the complementary DNA (cDNA) sequencing projects -- which were designed to systematically sequence expressed genes of Arabidopsis. The cDNA projects are producing partial sequences called expressed sequence tags (ESTs). These ESTs are sequences unique to each cDNA, and serve as markers. During the past year, cDNA sequencing efforts have continued to produce useful information and EST markers, both of which are widely used by the Arabidopsis research community. In addition, a new effort -- the European Scientists Sequencing Arabidopsis (ESSA) Project -- is underway to start a systematic sequencing of the entire Arabidopsis genoma.

European Scientists Sequencing Arabidopsis Projeto: Systematic sequencing of the Arabidopsis genome began last year, when a European Union network, funded by the European Community, was set up to sequence -- on a pilot scale -- 2 megabases (Mb) of chromosome IV and 0.5 Mb of other regions of genomic DNA. The ESSA effort also encompasses partial sequencing of 3,000 novel cDNAs, development of a sequence informatics node, and preparation of sequence-ready libraries. The project started up in September 1993, and most labs began work by early 1994.

The largest contiguous region sequenced so far has been 16 kilobases (kb) surrounding the GAP-A gene on chromosome III. In addition to the GAP-A gene, four novel open reading frames and a retrotransposon have been identified, as well as a peculiar AT-rich tract. The density of genes in this area, together with the availability of a means to identify open reading frames, is promising. A density of one gene every 4 to 5 kb is expected this is close to what was previously predicted. Based on a genome size of 100 Mb, this suggests a total of 20,000 to 25,000 genes. Data are still arriving on the large regions of chromosome IV, as the participating labs have had to learn new methods of large-scale sequencing. Regions of overlap show a high degree of accuracy in the independently sequenced areas. By early 1995, the first year's quota of 350 kb of chromosome IV should be done. An analysis of this region will provide new information on gene density, clustering of gene families, the composition of intergenic DNA, and the sequences of novel plant genes.

The major limiting step in systematic genome sequencing is the provision of sequence-ready libraries: Present cosmid (i.e., small DNA fragments cloned from the genome) coverage accounts for only 80 percent of the regions to be sequenced in the next 2 years. The increased effort being put into yeast artificial chromosome (YAC -- i.e., cloned DNA corresponding to a large fragment of the genome) coverage means that YACs must be the main source of sequence substrates. Consequently, new methods for deriving random libraries from YACs are under study.

For more information, contact Michael Bevan, John Innes Centre, Colney Lane, Norwich, NR4 7UJ, UK phone: 44-16-03-52571, ext. 2518/2520 fax: 44-16-03-505725 e-mail: [email protected]

Large-scale cDNA Sequencing -- The French Program: This is the third year of the French cDNA sequencing program. Seven libraries have been used, representing tissue from etiolated seedlings, cell suspensions, green shoots and leaves, flower buds, immature siliques, dry seeds, and wounded leaves.

The project's major change in 1994 was that its initial support from CNRS (Centre National de la Recherche Scientifique) would no longer be available for EST work. Funding has subsequently been taken over by the ESSA program, although GREG (Groupement de Recherches et d'Etudes sur les Genomes) supports sequencing of full length cDNAs. ESSA only provides for sequencing of new clones. Because of the redundancy within and between libraries and efforts by the American consortium, new genes are found less frequently. As a result, different groups have set up screening procedures to increase chances of finding new genes.

With the availability of the new YAC library, more efforts will focus on mapping cDNAs on the Arabidopsis cromossomos. About 70 cDNAs have already been mapped by the Institut National de Recherche Agronomique (INRA) group in Versailles. All together, the French teams have now released about 4,100 ESTs -- to the European Molecular Biology Laboratory database and the Database of Expressed Sequence Tags (dbEST) -- out of the 6,000 that have been sequenced. Also, most of these clones have been sent to the Ohio State University Arabidopsis Biological Resource Center (ABRC) for distribution. This represents a deposit of 2,500 ESTs for 1994, of which 1,700 correspond to 650 new genes with 5' and 3' tags. So far, ABRC has distributed 460 clones to 170 people, in addition to those directly distributed by French groups. Finally, four teams are participating in the ESSA genomic sequencing effort: They have determined 74 kb around four different loci.

For more information, contact Michel Delseny, URA 565 CNRS, University of Perpignan, Perpignan 66860, France phone: 33-68-662119 fax: 33-68-668499 e-mail: [email protected]

Large-scale cDNA Sequencing -- The Michigan State University (MSU) Program: The goal of the MSU Arabidopsis cDNA sequencing project is to produce 36,000 ESTs in order to identify more than 80 percent of the genes expressed by this organism. The cDNA library being used, PRL2, is composed of cDNAs generated from equal quantities of four pools of messenger RNA (mRNA). These four mRNA sources were 7-day-old etiolated seedlings roots grown in tissue culture rosettes from plants (staged weekly), half with a 24-hour light cycle and half on a 16-hour light/8-hour dark cycle and aerial tissue (stems, flowers, and siliques) from the staged plants. The Ziplox vector was used for directional insertion of the oligo-dT primed mRNA. Until normalization of this library is achieved, it is screened to eliminate the most redundant clones.

The project was initiated in 1992 with funding from the U.S. Department of Energy and the State of Michigan in late 1993, the National Science Foundation (NSF) granted project funding for 3 years. Since February 1994, technical personnel, working with two ABI 373A automated fluorescent sequencers and an ABI catalyst 800 molecular biology workstation, have produced 7,400 quality sequences, or an average of 925 sequences per month. The average edited sequence is more than 350 b in length.

The project's biocomputing group, based in Minneapolis, Minnesota, edits and analyzes the sequences. The group has programs that analyze the quality of the sequence and trim off vector and 3 low-quality regions. The edited sequence is then formatted and deposited in the dbEST at the National Center for Biotechnology Information (NCBI). Data from the project, including fully tabulated BLASTX and BLASTN analyses on the clones, are available through the World Wide Web (WWW see below for contact information).

Comparing several ESTs to previously sequenced clones indicates that over half the cDNA clones are essentially full length, i.e., they encode the translational start site. More than one-third of the ESTs have significant homology to known genes. About 10 percent of the ESTs that show similarity to genes have not yet been identified in any plant species.

The biological materials from this project include cDNA clones and the PRL2 library. More than 1,500 cDNA clones and 125 aliquots of the PRL2 library have been sent to laboratories worldwide.

For information about the MSU project, contact Thomas Newman, MSU-DOE Plant Research Laboratory, Michigan State University, East Lansing, MI 48824-1312, USA phone: 517-353-0854 fax: 517-353-9168 e-mail: [email protected] Project data are available at http://www.ncbi.nlm.nih.gov and http://lenti.med.umn.edu boolean keyword searches can be performed on the data using XMOSAIC. The biological materials from this project can be obtained from ABRC.

Maps provide valuable reference points for research in molecular genetics. Recently, great efforts have been made to expand two types of maps for genetic information in Arabidopsis a genetic map, which plots the estimated arrangement of genes on each chromosome and a physical map, which determines the actual distances between markers on a chromosome in terms of kilobases. Completion of the high-density physical map and integration of the genetic and physical maps are two goals of the Multinational Coordinated Arabidopsis thaliana Genome Research Project.

Mapping Mutants: Significant advances were made in 1994 in mapping the chromosomal locations of mutant genes. The most recent map of genes identified by mutation, which was compiled by Maarten Koornneef (Wageningen, The Netherlands) and David Meinke (Stillwater, OK), includes more than 280 visible markers distributed over five chromosomes. This represents more than twice the number of mutant genes included on the genetic map just 2 years ago. Embryo-defective mutants, isolated and characterized by David Meinke and colleagues, represent the largest collection of new visible markers added to the genetic map. With recent advances in mapping procedures - particularly the wide distribution of cleaved amplified polymorphism sequence markers introduced by Frederick Ausubel (Boston, MA) and simple sequence length polymorphism markers developed by Joseph Ecker (Philadelphia, PA), it is likely that another 50 to 75 mutant genes of widely different types will be added to the genetic map this year.

Physical Maps: The number of DNA-based markers mapped continued to increase throughout 1994 the total is currently about 379. (See app. B for the latest map.) As new markers became available, they were hybridized to the YAC libraries to increase YAC coverage of each chromosome.

The biggest advances in the linking of YAC contigs were achieved once the YAC library -- prepared in a collaborative effort based in France by the Center for the Study of Human Polymorphisms (CEPH), INRA, and CNRS (a collaboration known as CIC) -- was distributed in May 1994. This library consists of 1,152 clones with an average insert size of 450 kb it contains very few chimeric YAC clones.

The library is being used by the Joseph Ecker (Philadelphia, PA) and Howard Goodman (Boston, MA) labs to add to the physical maps of chromosomes I, II, and III and by the Caroline Dean lab (Norwich, UK), for chromosomes IV and V. The combination of the CIC library, increased marker coverage, and a few successful walking experiments has resulted in chromosome IV being covered by just 10 contigs (R. Schmidt, J. West, and C. Dean, all of Norwich). Chromosome V is currently covered by 35 to 40 contigs (R. Schmidt, K. Love, Z. Lenehan, and C. Dean, all of Norwich), after having used over 100 markers on four YAC libraries. Chromosome II (H. Goodman lab) is covered by about 40 contigs, for a total distance of about 17 Mb. The largest contig on chromosome II -- constructed in part using YAC end probes -- is about 3.2 Mb, covering about 5.7 centimorgans (cM). A similar level of coverage has been achieved for chromosome I (J. Ecker lab).

Cosmid contigs from the Howard Goodman laboratory and EST clones are also being integrated into the chromosome II, IV, and V YAC contigs. Efforts are continuing toward generating a 1.5 Mb cosmid contig (I. Bancroft, K. Love, and C. Dean, all of Norwich C. Cobbett, Melbourne and H. Goodman), covering the region of chromosome IV which is being sequenced as part of the European Community's ESSA program. Currently, nine cosmid contigs, covering 730 kb, have been restriction mapped and distributed to participating laboratories. Joining these contigs will require new strategies, since sequences within the gaps are repetitive or underrepresented in the cosmid libraries being screened.

Gene Identification

Significant advances have been made in the cloning and molecular characterization of genes originally identified by mutation, and the isolation of new mutants with informative phenotypes. Two conclusions can be drawn from this work:

  • Mutagenesis in Arabidopsis has not yet reached saturation. Despite the large size and impressive diversity of existing mutant collections, many genes with important functions remain to be identified.
  • With continued advances in chromosome walking and insertional mutagenesis programs, many additional mutant genes should be cloned over the next several years. It should then be possible to determine what metabolic and regulatory functions are disrupted in the many mutants characterized by the Arabidopsis community.

Some of the mutant genes are related in sequence to important regulatory genes known from different organisms. Others represent novel sequences which may provide new insights into eukaryotic cell function. Included in this collection are several genes cloned by chromosome walking, one gene cloned by transposon tagging, and a large number of genes cloned by transferred DNA (T-DNA) insertional mutagenesis. Continued availability of a large collection of T-DNA tagged lines, and ongoing advances with transposon tagging and chromosome walking, should lead to further growth in the number of mutant genes cloned in 1995.

Considerable progress has also been made in expanding existing collections of mutants. For example, Chris Somerville (Stanford, CA) and his colleagues reported the identification of about 40 novel mutants with altered cell wall polysaccharide composition, which were isolated by screening 5,000 mutagenized lines by gas chromatography of sugar derivatives. These mutants should permit a new approach to the difficult problems associated with understanding cell wall biosynthesis and function.

fied by screening for mutants with phenotypes similar to well-established mutants. A good example is the identification by Ruth Finkelstein (Santa Barbara, CA) of several additional ABI loci involved in mediating responses to abscisic acid. Another example is the discovery of additional members of the leafy cotyledon class of mutants by Peter McCourt (Toronto, Canada) Helmut Baumlein (Gatersleben, Germany) John Harada (Davis, CA) and David Meinke (Stillwater, OK). These few examples underscore the conclusion that further screening of mutagenized populations is likely to yield additional examples of new genes with functions similar to known genes.

More detailed analysis of existing mutants has also resulted in interesting overlaps between phenotypic classes. For example, studies by John Schiefelbein (Ann Arbor, MI) and colleagues have recently shown that the ttg mutant -- known for many years as being defective only in trichome formation and seed coat pigmentation -- also exhibits interesting defects in the spatial distribution of root hairs. Recent efforts in other laboratories have shown that several fusca mutants, first identified by Andreas Muller (Gatersleben, Germany) based on inappropriate accumulation of anthocyanins during embryogenesis, are identical to several de-etiolated and constitutive photomorphogenic mutants. Joanne Chory (La Jolla, CA) and Xing-Wang Deng (New Haven, CT) showed that these latter mutants exhibit interesting defects in photomorphogenesis following germination.


Tag-based approaches for transcriptome research and genome annotation

With the increasing number of whole genome sequences available, genomic research has shifted toward the annotation of functional elements and transcribed regions. Thus, the related field of transcriptome research requires accurate methods for the profiling of genes that are not biased by known sequence information, and that also allow for the identification of promoter regions. Starting with serial analysis of gene expression (SAGE), methods making use of short sequencing tags have greatly contributed to transcriptome studies. Here we review recent developments in the use of short sequencing tags in expression profiling, gene discovery and genome annotation. These tags are obtained from the 5′ end of mRNAs, both terminal ends of mRNAs, or genomic regions. The 5′ end–specific tags, with their ability to identify transcripts along with their transcriptional start sites, will be of particular interest for gene network studies and may become one of the most important approaches in systems biology.


Assista o vídeo: Dziedziczenie i geny (Agosto 2022).