Em formação

6.S: Análise genética de múltiplos genes (Resumo) - Biologia

6.S: Análise genética de múltiplos genes (Resumo) - Biologia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

  • Os alelos de diferentes loci são herdados independentemente uns dos outros, a menos que estejam geneticamente ligados.
  • A proporção fenotípica esperada de um cruzamento di-hibrido é de 9: 3: 3: 1, exceto em casos de ligação ou interações gênicas que modifiquem essa proporção.
  • Razões modificadas de 9: 3: 3: 1 são vistas no caso de epistasia recessiva e dominante, genes duplicados e ação de gene complementar. Isso geralmente indica que os dois genes interagem dentro da mesma via biológica.

Segunda Lei de Mendel

Dihybrid

9:3:3:19:3:4

12:3:1

sortimento independente

ligação

epistasia recessiva

epistasia dominante

ação complementar

redundância

ação do gene duplicado

Laranja, longo, diluído, mascaramento branco, manchas malhadas, chita


Análise de via integrativa de estudos de associação de todo o genoma e dados de expressão gênica no câncer de próstata

Análise do caminho de grande escala ômicas os dados nos auxiliam no exame dos efeitos cumulativos de vários genes funcionalmente relacionados, que são difíceis de detectar usando a análise tradicional de um único gene / marcador. Até agora, a maioria dos estudos genômicos foram conduzidos em um único domínio, por exemplo, por estudos de associação do genoma (GWAS) ou investigação de expressão gênica de microarranjos. Uma análise combinada de genes de suscetibilidade a doenças em várias plataformas no nível da via é uma necessidade urgente, pois pode revelar informações mais confiáveis ​​e biologicamente importantes.

Resultados

Realizamos uma análise de via integrativa de um conjunto de dados GWAS e um conjunto de dados de expressão de genes de microarray no câncer de próstata. Obtivemos um conjunto abrangente de anotações de vias a partir de recursos públicos baseados em conhecimento, incluindo vias KEGG e o conjunto de genes candidatos ao câncer de próstata, e conjuntos de genes definidos especificamente com base em informações de plataforma cruzada. Aproveitando esta coleção de caminhos, primeiro procuramos caminhos significativos no conjunto de dados GWAS usando quatro métodos, que representam dois grandes grupos de abordagens de análise de caminhos. As vias significativas identificadas por cada método variaram muito, mas os resultados foram mais consistentes dentro de cada grupo de métodos do que entre os grupos. Em seguida, conduzimos uma análise de enriquecimento do conjunto de genes dos dados de expressão do gene microarray e encontramos 13 vias com evidências de plataforma cruzada, incluindo "fagocitose mediada por Fc gama R" (PGWAS = 0.003, Pexpr & lt 0,001, e Pcombinado = 6,18 × 10 -8), "regulação do citoesqueleto de actina" (PGWAS = 0.003, Pexpr = 0,009, e Pcombinado = 3,34 × 10 -4), e "via de sinalização Jak-STAT" (PGWAS = 0.001, Pexpr = 0,084, e Pcombinado = 8.79 × 10 -4 ).

Conclusões

Nossos resultados fornecem evidências, tanto na variação genética quanto nos níveis de expressão, de que várias vias importantes podem estar envolvidas no desenvolvimento patológico do câncer de próstata. Nossa estrutura que emprega dados de expressão gênica para facilitar a análise da via de dados GWAS não é apenas viável, mas também muito necessária no estudo de doenças complexas.


Opções de acesso

Obtenha acesso completo ao diário por 1 ano

Todos os preços são preços NET.
O IVA será adicionado mais tarde no check-out.
O cálculo do imposto será finalizado durante o checkout.

Obtenha acesso limitado por tempo ou ao artigo completo no ReadCube.

Todos os preços são preços NET.


Baixe e imprima este artigo para seu uso acadêmico, de pesquisa e educacional.

Compre uma única edição de Ciência por apenas $ 15 USD.

Ciência

Vol 326, Edição 5954
06 de novembro de 2009

Ferramentas de artigo

Faça login para adicionar um alerta para este artigo.

Por CM Wade, E. Giulotto, S. Sigurdsson, M. Zoli, S. Gnerre, F. Imsland, TL Lear, DL Adelson, E. Bailey, RR Bellone, H. Blöcker, O. Distl, RC Edgar, M. Garber, T. Leeb, E. Mauceli, JN MacLeod, MCT Penedo, JM Raison, T. Sharpe, J. Vogel, L. Andersson, DF Antczak, T. Biagi, MM Binns, BP Chowdhary, SJ Coleman, G. Della Valle, S. Fryc, G. Guérin, T. Hasegawa, EW Hill, J. Jurka, A. Kiialainen, G. Lindgren, J. Liu, E. Magnani, JR Mickelson, J. Murray, SG Nergadze, R. Onofrio , S. Pedroni, MF Piras, T. Raudsepp, M. Rocchi, KH Røed, OA Ryder, S. Searle, L. Skow, JE Swinburne, AC Syvänen, T. Tozaki, SJ Valberg, M. Vaudin, JR White, MC Zody, Broad Institute Genome Sequencing Platform, Broad Institute Whole Genome Assembly Team, ES Lander, K. Lindblad-Toh

Ciência 06 de novembro de 2009: 865-867

O genoma do cavalo revela um novo centrômero evolucionário e sequências cromossômicas conservadas em relação a outros mamíferos.


Resposta

Nós concordamos com Scott et al. essa análise de ligação será capaz de identificar genes de efeito principal, mas não genes de efeito modesto. Assim, também concordamos que a análise de ligação não deve ser abandonada arbitrariamente, porque, sem dúvida, ela levará à descoberta de alguns genes importantes para suscetibilidade a doenças. No entanto, não concordamos que a análise de ligação possa detectar a maioria dos genes subjacentes a doenças complexas e prevemos que poucos genes para doenças complexas serão identificados dessa maneira.

Conforme indicado por Scott et al., uma medida do efeito genético total para uma doença complexa é λs, a razão de risco de irmão (1). No entanto, geralmente é impossível determinar o número de loci que contribuem para esse total se o número for grande, mesmo para um grande valor de λs, então nenhum dos loci pode ser facilmente detectado por análise de ligação.

Mostramos em nossa Perspectiva (2) que os loci que conferem um risco relativo genotípico γ menor que 4 seriam difíceis ou impossíveis de identificar com as estratégias de ligação atuais. O número de pares de irmãos necessários para detectar a ligação que foi dada na tabela em nossa Perspectiva (2, p. 1516) foram realmente subestimados, por duas razões: (i) Houve um erro no programa de computador produzindo o número necessário de pares de irmãos para ligação; os números reais são aproximadamente 50% maiores do que os dados (3) e (ii) os números dados correspondem ao caso ideal de marcadores completamente informativos e nenhuma recombinação. Permitindo circunstâncias mais realistas de reduzida informatividade do marcador e recombinação moderada, os números corrigidos provavelmente seriam cerca de duas a três vezes maiores do que os dados na tabela. Assim, embora ainda seja possível detectar um locus com γ de 4 ou mais em uma grande coleção de família (digamos 500 ou mais), loci com valores menores de γ são improváveis ​​de serem detectados.

Quantos loci provavelmente existem para doenças complexas com γ & gt 4? Embora seja difícil saber de antemão, os modelos animais podem oferecer uma pista. Como um exemplo, o camundongo diabético não obeso (NOD) fornece um modelo útil para diabetes mellitus dependente de insulina humana por ser geneticamente complexo, ter uma etiologia autoimune e pela importância dos principais loci de histocompatibilidade. No entanto, experimentos de retrocruzamento mostraram que pelo menos 10 outros loci estão provavelmente envolvidos na suscetibilidade, e apenas um desses loci teve um valor de γ maior que 4, com o resto na faixa de 2 ou menos (4). Também observamos que os experimentos de retrocruzamento em animais são mais análogos aos estudos de associação humana do que aos estudos de ligação, e é por isso que eles têm sido mais bem-sucedidos na identificação de loci de suscetibilidade do que os estudos de ligação humana.

Conforme indicado por Scott et al., a esclerose múltipla é uma doença complexa com um componente genético substancial presumido (5). No entanto, três telas de genoma publicadas recentemente (6) de tamanho moderado não produziram evidências claras e replicáveis ​​de ligação em qualquer região cromossômica. Essa falta de loci de suscetibilidade de grande efeito nesta doença sugere que um grande número de famílias pode ser necessário para detectar a ligação.

A descoberta da apoE como um importante fator de risco para a doença de Alzheimer de início tardio é certamente uma das maiores histórias de sucesso da genética humana moderna. Assim, é importante avaliar os meios pelos quais essa descoberta foi feita. Conforme indicado por Scott et al., estimou-se que apoE confere um λs valor em torno de 2, com alguma modificação para a idade de início (7). Assim, em teoria, esse locus seria identificável por análise de ligação com um número suficiente de pares de irmãos (várias centenas no mínimo). Na verdade, a observação de ligação inicial no cromossomo 19 (8), que produziu uma pontuação de lod de 4, foi baseada em uma análise com marcadores que provavelmente estavam em desequilíbrio de ligação com apoE. A realização da análise de ligação com um marcador associado à doença leva a um aumento no escore de lod (9). A análise de ligação semelhante com um marcador próximo com pouco ou nenhum desequilíbrio de ligação (por exemplo, o microssatélite apo CII) no mesmo material não produz evidências significativas para ligação (8, 10). Assim, na realidade, a descoberta de “ligação” no cromossomo 19 foi na verdade baseada em uma associação entre loci marcadores e a doença.

Nós concordamos com Scott et al. que os estudos de associação de todo o genoma serão baseados na tecnologia futura, e não na atual (como indicado em nosso título) e, por enquanto, ainda estamos limitados à tecnologia existente. Embora concordemos que os estudos de ligação devem continuar a ser realizados, também acreditamos que essa abordagem produzirá apenas um número modesto de loci para doenças complexas.

Concordamos com Bell e Taylor que os genes candidatos são mais bem testados na estrutura de uma hipótese biológica, muitas vezes envolvendo uma interação com um agente ambiental predisponente, e os exemplos que eles fornecem são esclarecedores [para outros, ver (11)]. Além disso, como eles apontam, desenhos de estudos epidemiológicos clássicos, como caso-controle ou coorte, são excelentes para testar esses efeitos de interação gene-ambiente. A principal desvantagem de tais projetos para detectar efeitos genéticos, no entanto, é o potencial de confusão, levando a uma inferência incorreta de causalidade para uma associação observada (12). Especificamente, considere uma população que tem estratificação étnica e tendência à endogamia dentro dos estratos. Além disso, suponha que esses estratos diferem tanto na prevalência da doença quanto nas frequências de alelos em um locus não relacionado. Ao realizar um estudo de caso-controle de tal população mista, se os casos e controles forem desequilibrados para esses estratos, uma diferença de frequência de alelo entre casos e controles pode emergir que é artefato e não causal. A solução, é claro, é combinar precisamente os casos e controles de acordo com esses estratos, ou realizar uma análise estratificada que seria possível com os principais grupos étnicos, como existem nos Estados Unidos. No entanto, é provável que existam outros estratos dentro dos principais grupos étnicos (por exemplo, subgrupos europeus de caucasianos) para os quais a correspondência e a estratificação podem ser geralmente muito difíceis. Claro, esse problema desaparece em uma população de acasalamento completamente aleatório.

Esse problema também pode ser resolvido recorrendo a testes de associação de base familiar, como o TDT que usamos em nossa análise. Este teste demonstrou ser imune a confusão devido à estratificação da população (13). Além disso, na ausência de estratificação populacional, este teste tem poder semelhante ao desenho usual de caso-controle (14). Além disso, casos ou famílias (ou ambos) também podem ser classificados de acordo com uma exposição ambiental relevante e transmissão alélica comparada entre essas classes para pesquisar interações gene-ambiente. Também mostramos que, a menos que a frequência do alelo predisponente à doença seja alta, as famílias com mais de uma criança afetada podem ser substancialmente mais poderosas do que os únicos, embora também sejam mais difíceis de encontrar.

Por causa do problema potencial de estratificação genética, o projeto ideal para a busca de genes de efeito modesto, especialmente na ausência de um modelo biológico claro, é o projeto baseado na família, como irmãos únicos ou múltiplos afetados com os pais. Para doenças de início precoce, essas amostras não devem ser difíceis de obter e provavelmente valem o custo adicional potencial. Gostaríamos de acrescentar que a correspondência étnica precisa em um paradigma de controle de caso também pode levar ao aumento de despesas, se possível. Na situação de doenças de início tardio, onde os pais geralmente não estão disponíveis, um desenho alternativo são os pares de irmãos discordantes, onde efetivamente um irmão não afetado serve como um controle para o irmão afetado. Este projeto também protege contra artefato de estratificação genética, mas pode levar a uma potência um tanto reduzida por causa da correlação genética entre irmãos (14).

Grande et al. sugerem um desenho de estudo prospectivo em que uma amostra populacional aleatória é subsequentemente seguida para o desenvolvimento da doença. Presumivelmente, na iniciação, todos no estudo são genotipados para um grande número de loci. Eles mostram que se a doença é suficientemente comum, um poder razoável é obtido comparando-se as frequências dos alelos naqueles que desenvolvem a doença com aqueles que não a desenvolvem. O principal benefício dessa abordagem é que várias doenças podem ser estudadas usando a mesma população de indivíduos, novamente desde que as doenças sejam suficientemente comuns. Parece que uma frequência mínima de 10% é necessária para obter tamanhos de amostra plausíveis para poder suficiente.

Existem também várias desvantagens nesta abordagem. Em primeiro lugar, quanto aos paradigmas epidemiológicos típicos, como os estudos de caso-controle, existe o problema da subestrutura da população, conforme descrevemos (em nossa resposta a Bell e Taylor) e também mencionado por Long et al. Em segundo lugar, com esta abordagem, o agrupamento da amostra não é possível, porque não se sabe a priori quais indivíduos serão afetados. Assim, esta abordagem requer a construção de genótipos individuais, o que pode ampliar muito o esforço técnico. Em contraste, para um projeto de caso-controle típico, dois pools podem ser formados - um para os indivíduos afetados, outro para os não afetados e as frequências alélicas gerais dentro dos dois grupos determinadas. Assim, para um estudo de n casos e n controles e t loci, genótipos para apenas 2t as amostras precisam ser determinadas, ao contrário de 2nt amostras (15). A mesma eficiência pode ser obtida para um projeto baseado na família, como indivíduos afetados e seus pais, onde os afetados são agrupados e contrastados com o grupo agrupado de pais. Embora essa abordagem não possa fornecer os dados precisos necessários para uma análise de TDT, ela ainda fornece um meio robusto, poderoso e eficiente para a triagem inicial de quaisquer loci positivos que possam ser subsequentemente submetidos à genotipagem individual (14).

A abordagem de Long et al. não seria prático para doenças raras, por exemplo, aquelas com uma frequência populacional inferior a 5%. No entanto, um acordo é possível. Já existem numerosos estudos que amostram indivíduos afetados, com pais ou irmãos não afetados, por uma variedade de doenças. Os sujeitos desses estudos podem ser acompanhados por uma variedade de outras doenças e, em seguida, submetidos à análise à medida que desenvolvem essas outras doenças mais frequentes. O agrupamento de estudos pode, então, fornecer material suficiente.

Conforme indicado por Müller-Myhsok e Abel, nossa análise foi baseada em estudos de associação onde o polimorfismo predisponente à doença real está em mãos. É por isso que incorporamos um número tão grande de alelos testados (1.000.000). Também indicamos que o número de loci a ser testado pode ser reduzido substancialmente se for permitido o desequilíbrio de ligação. No entanto, como apontado por Müller-Myhsok e Abel, depender do desequilíbrio de ligação não é isento de riscos. O poder do teste de associação pode diminuir drasticamente à medida que o desequilíbrio de ligação diminui ou se o alelo testado tem uma frequência substancialmente diferente do alelo da doença. Em grande medida, a expectativa com relação ao desequilíbrio de ligação em todo o genoma é um território desconhecido e, portanto, é difícil prever o poder de usar um mapa menos denso neste momento. No entanto, podemos apresentar dois casos que fornecem algum grau de otimismo. O primeiro diz respeito à apoE e à doença de Alzheimer de início tardio. Vários polimorfismos na região apoE mostram forte desequilíbrio de ligação e frequências alélicas comparáveis, permitindo que a associação seja prontamente detectada com outros polimorfismos vizinhos (16). Um segundo exemplo é a região VNTR da insulina do cromossomo 11p. Vários polimorfismos nessa região foram identificados, mostrando forte desequilíbrio e frequências alélicas semelhantes, levando a graus comparáveis ​​de associação com a doença (17).

À medida que os estudos de ligação em todo o genoma são suplantados por estudos de associação em todo o genoma e a distribuição do desequilíbrio de ligação entre os cromossomos e as populações é explorada, o grau em que o desequilíbrio de ligação em oposição à causalidade direta pode ser utilizado para localizar locais de susceptibilidade a doenças no o genoma se tornará mais aparente.


Reconhecimentos

Esta pesquisa foi conduzida usando o UK Biobank Resource sob o pedido número 24983, 'Gerando hipóteses terapêuticas eficazes a partir de dados genômicos e de ligação hospitalar' (http://www.ukbiobank.ac.uk/wp-content/uploads/2017/06/24983 -Dr-Manuel-Rivas.pdf). Com base nas informações fornecidas no protocolo 44532, o Stanford IRB determinou que a pesquisa não envolve seres humanos, conforme definido em 45 CFR 46.102 (f) ou 21 CFR 50.3 (g). Todos os participantes do estudo UK Biobank forneceram consentimento informado por escrito (mais informações disponíveis em https://www.ukbiobank.ac.uk/2018/02/gdpr/). O projeto FinnGen foi aprovado pelo Instituto Finlandês de Saúde e Bem-estar (THL), número de aprovação THL / 2031 / 6.02.00 / 2017, alterações THL / 1101 / 5.05.00 / 2017, THL / 341 / 6.02.00 / 2018, THL / 2222 / 6.02.00 / 2018, THL / 283 / 6.02.00 / 2019), agência de serviços de dados digitais e populacionais VRK43431 / 2017-3, VRK / 6909 / 2018-3, Instituição de Seguro Social (KELA) KELA 58 / 522/2017, KELA 131/522/2018, KELA 70/522/2019 e Estatísticas da Finlândia TK-53-1041-17. As decisões de acesso de biobanco para amostras e dados de FinnGen incluem: THL Biobank BB2017_55, BB2017_111, BB2018_19, BB_2018_34, BB_2018_67, BB2018_71, BB2019_7 Finnish Red Cross Blood Service Biobank 7.12.2017, Helsinki Biobank HUS / 359/2017, Auria4 Biobank Biobank Borealisof Northern Finland_2017_1013, Biobank of Eastern Finland 1186/2018, Finnish Clinical Biobank Tampere MH0004, Central Finland Biobank 1-2017 e Terveystalo Biobank STB 2018001. Os seguintes biobancos são reconhecidos por coletar as amostras do projeto FinnGen: Auria Biobank (https: / /www.auria.fi/biopankki), THL Biobank (https://thl.fi/fi/web/thl-biopankki), Helsinki Biobank (https://www.terveyskyla.fi/helsinginbiopankki), Biobank Borealis of Northern Finlândia (https://www.oulu.fi/university/node/38474), Finnish Clinical Biobank Tampere (https://www.tays.fi/en-US/Research_and_development/Finnish_Clinical_Biobank_Tampere), Biobank of Eastern Finland (https: //ita-suomenbiopankki.fi), Central Finland Biobank (http s: //www.ksshp.fi/fi-FI/Potilaalle/Biopankki), Biobanco do Serviço de Sangue da Cruz Vermelha Finlandesa (https://www.veripalvelu.fi/verenluovutus/biopankkitoiminta) e Terveystalo Biobank (https: // www. terveystalo.com/fi/Yritystietoa/Terveystalo-Biopankki/Biopankki/). Todos os biobancos finlandeses são membros da infraestrutura BBMRI.fi (www.bbmri.fi). As análises de ajuste de estatinas foram conduzidas por meio do aplicativo UK Biobank 7089, usando um protocolo aprovado pelo Partners HealthCare Institutional Review Board. Agradecemos a todos os participantes dos estudos UK Biobank e FinnGen. Agradecemos A. Paterson e membros dos laboratórios Rivas, Pritchard e Bejerano por seus comentários. O projeto Genotype-Tissue Expression (GTEx) foi apoiado pelo Fundo Comum do Escritório do Diretor dos Institutos Nacionais de Saúde (NIH) e pelo NCI, o Instituto Nacional de Pesquisa do Genoma Humano (NHGRI), NHLBI, NIDA, NIMH e NINDS. Os dados usados ​​para as análises descritas neste manuscrito foram obtidos no Portal GTEx em 19 de outubro de 2020. Este trabalho foi apoiado pelo NHGRI do NIH sob os prêmios R01HG010140 (M.A.R.), R01EB001988-21 (T.H.) e R01HG008140 (J.K.P.). O conteúdo é de responsabilidade exclusiva dos autores e não representa necessariamente a opinião oficial do NIH. Parte da computação para este projeto foi realizada no cluster Sherlock da Universidade de Stanford. Gostaríamos de agradecer à Stanford University e ao Stanford Research Computing Center por fornecerem recursos computacionais e suporte que contribuíram para os resultados dessas pesquisas. N.S.-A. é apoiado pelo Departamento de Defesa por meio de uma bolsa de Ciência e Engenharia de Defesa Nacional e por uma bolsa de graduação de Stanford. Y.T. é financiado por uma bolsa da Funai Overseas da Funai Foundation for Information Technology e da Stanford University School of Medicine. N.M. é apoiado pela Academia da Finlândia (no. 331671). H.M.O. é apoiado pela Academia da Finlândia (no. 309643). F.R. é apoiado por uma bolsa do National Heart, Lung e Blood Institute (1K01HL144607). O projeto FinnGen é financiado por duas doações da Business Finland (HUS 4685/31/2016 e UH 4386/31/2016) e por 12 parceiros da indústria (AbbVie Inc, AstraZeneca UK Ltd., Biogen MA Inc., Celgene Corporation, Celgene International II Sàrl, Genentech Inc, Merck Sharp & amp Dohme Corp, Pfizer Inc., GlaxoSmithKline Intellectual Property Development Ltd., Sanofi US Services Inc., Maze Therapeutics Inc., Janssen Biotech Inc. e Novartis AG). M.A.R. é em parte apoiado pelo NHGRI do NIH sob o prêmio R01HG010140 (M.A.R.) e um Centro NIH para Mapeamento Multi e Transétnico de Doenças Mendelianas e Complexas (5U01 HG009080). A terra na qual parte desse trabalho foi realizado é a terra ancestral e não cedida dos Muwekma Ohlone, e prestamos nossos respeitos aos seus antepassados ​​do passado e do presente.


Banco de dados Gramene: Navegando em recursos genômicos comparativos de plantas ☆

Gramene (http://www.gramene.org) é um recurso online, de código aberto, com curadoria de genômica comparativa de plantas e análise de vias, projetado para apoiar pesquisadores que trabalham em genômica de plantas, melhoramento, biologia evolutiva, biologia de sistemas e engenharia metabólica. Ele explora relações filogenéticas para enriquecer a anotação de dados genômicos e fornece ferramentas para realizar análises comparativas poderosas em um amplo espectro de espécies de plantas. Consiste em um portal integrado para consultar, visualizar e analisar dados para 44 genomas de referência de plantas, conjuntos de dados de variação genética para 12 espécies, dados de expressão para 16 espécies, vias de arroz com curadoria e projeções de vias com base em ortologia para 66 espécies de plantas, incluindo várias culturas. Aqui, descrevemos brevemente as funções e os usos do banco de dados Gramene.

Este artigo é parte de uma edição especial intitulada “Recursos e bancos de dados genômicos”, publicado na revista Current Plant Biology 7–8, 2016.


Fundo

A recombinação entre dois cromossomos homólogos durante a meiose gera novas combinações de genes e cria diversidade genética entre os cromossomos. Além disso, a recombinação é crítica para a segregação adequada de cromossomos homólogos e é um fator importante na formação de padrões de desequilíbrio de ligação (LD) no genoma [1]. Muitas pesquisas foram feitas recentemente para estabelecer mapas genéticos humanos com base na recombinação e na estimativa das taxas de recombinação local para aumentar os estudos de LD e auxiliar no desenho e interpretação do estudo de LD [1–8]. Kong et al. [2] encontraram diferenças regionais marcantes nas taxas de recombinação e concluíram que as mudanças no DNA que contribuem para a evolução podem não ser completamente aleatórias, mas mais concentradas em regiões específicas. Essa diferença pode ser motivada por recursos de sequência. Além disso, a taxa de recombinação está sob controle genético, conforme exemplificado na descoberta de Ji et al. [9] aquele milho meiótico mutante dessináptico é um modificador de recombinação que controla as taxas de recombinação. Neste estudo, buscando identificar regiões que potencialmente afetam as taxas de recombinação, conduzimos estudos de associação de todo o genoma com base em microssatélites e polimorfismos de nucleotídeo único (SNPs) dos dados do Estudo Colabroativo sobre a Genética do Alcoolismo (COGA) fornecidos pelo Workshop de Análise Genética 14 (GAW14). Um total de 315 microssatélites e 10.081 SNPs de Affymetrix em 22 cromossomos autossômicos foram analisados. Encontramos oito regiões / treze SNPs que mostraram alguma evidência de associação com contagens de recombinação. Nenhuma região foi considerada significativa usando microssatélites após o ajuste para comparações múltiplas com base no critério de taxa de descoberta falsa positiva (pFDR).


Afiliações

Área de Cultivos Hortofrutícolas y Forestales, SERIDA, Apdo. 13, Villaviciosa, Asturias, 33300, Espanha

Ana Campa e Juan José Ferreira

Instituto de Agricultura Sostenible, CSIC, Apdo. 4084, Córdoba, E-14080, Espanha

Departamento de Biologia Funcional, Universidade de Oviedo, Oviedo, 33006, Espanha

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Você também pode pesquisar este autor no PubMed Google Scholar

Autor correspondente


Métodos

Material vegetal

Um F1 população de pêssego de 202 indivíduos derivados do cruzamento entre Prunus persica cv. ‘Shahong’ (SH) e Prunus persica cv. 'Hongfurong' (HFR) foi usado. SH foi identificado em 1999 pelo Comitê de Exame de Variedade de Culturas da Província de Shaanxi, China. O HFR foi identificado em 2000 pelo Comitê de Exame de Variedades de Culturas de Pequim, China. Nossa equipe de pesquisa apresentou SH e HFR do National Fruit Tree Germplasm Repository, Zhengzhou Fruit Research Institute, Chinese Academy of Agricultural Sciences, na China em 2003. SH era uma mutação de botão de 'Kurakato Wase' caracterizada por um período de amadurecimento precoce, o pêssego com fruta de peso médio, casca de fruta parcialmente colorida, teor de açúcar e acidez médios e pegajosa. O HFR foi desenvolvido a partir de um cruzamento entre ‘Qiuyu’ e ‘Xiufeng’ caracterizado por um tempo de maturação tardio, nectarina com peso médio do fruto, casca do fruto parcialmente colorida, alto teor de açúcar, baixa acidez e semi-pedra calcária. Duzentas e duas mudas de F1 a prole foi cultivada em um viveiro em 2008 e plantada na primavera seguinte com suas próprias raízes (4 × 1,0 m) em um campo na Estação de Demonstração Experimental de Pêssego da Universidade Northwest A & ampF (33 ° 59'N, 107 ° 39'E) , Província de Shaanxi, China. Pais e híbridos foram cultivados em condições de chuva natural, sem irrigação, e fertilizante NPK foi aplicado a cada primavera. A poda era realizada anualmente e as pragas e doenças eram controladas por técnicas convencionais. O desbaste manual foi realizado antes do endurecimento em caroço para uma carga de 60–90 frutos por árvore. Quinze frutos por árvore foram colhidos na maturidade comercial com base na mudança visual de cor e no índice de diferença de absorbância (IAD). Frutos com um IAD entre 0,8 e 1,5 foram selecionados [59]. Além disso, dentro do F1 progênies, 12 genótipos (22–10, 22–11, 23–6, 23–8, 24–5, 24–16, 24–25, 25–8, 25–14, 25–15, 25–37 e 25 –38) foram selecionados para análise qPCR. Esses genótipos foram selecionados porque 24–5, 24–16 e 25–15 tinham alto teor de sólidos solúveis (SSC), enquanto 22–10, 22–11 e 25–37 tinham baixo SSC 23–6, 24–25 e 25 –8 tinha alto teor de acidez de fruta (FA), enquanto 23–8, 25–14 e 25–38 tinham baixo FA.

Extração de DNA, construção de biblioteca SLAF e sequenciamento

O DNA genômico de pais e progênies foi extraído de folhas jovens usando o kit de DNA genômico de plantas (Tiangen, Pequim, China) seguindo o protocolo do fabricante. A concentração e a qualidade do DNA foram examinadas por eletroforese em géis de agarose a 1% e espectrofotômetro ND-1000 (NanoDrop, Wilmington, DE, EUA). A estratégia SLAF-seq de sequenciamento de alto rendimento foi usada para a construção da biblioteca. Resumidamente, o genoma de referência de Prunus persica eu. (http://www.ncbi.nlm.nih.gov/genome/388) foi usado para selecionar combinações de enzimas de restrição. Rsaeu e HaeIII (New England Biolabs, NEB, EUA) foram aplicados para digerir o DNA genômico de cada amostra. Os fragmentos digeridos foram submetidos à adição de um único nucleotídeo A em suas extremidades 3 '. A ligação de adaptadores de sequenciamento, amplificação de PCR e purificação e sequenciamento de produtos de PCR seguiram as recomendações do fabricante, em que os fragmentos de PCR variando de 264 a 364 bp foram purificados e o sequenciamento foi realizado usando um sistema Illumina HiSeq ™ 2500 (Illumina Inc ., San Diego, CA, EUA).

Análise de dados SLAF-seq e genotipagem

A identificação e genotipagem dos marcadores SLAF foram realizadas de acordo com o método de Zhang et al. [27, 60]. Resumidamente, depois de filtrar as leituras de baixa qualidade (pontuação de qualidade & lt 20e), as leituras restantes foram classificadas para cada progênie com base em sequências de código de barras duplex. O software SOAP foi usado para mapear as leituras limpas com o terminal 5 bp aparado no genoma de referência do pêssego [61]. O limite para a definição de um locus SLAF foi superior a 95% da identidade de sequência, e os alelos em cada locus SLAF foram definidos pela avaliação da frequência do alelo menor. Polimorfismos de nucleotídeo único (SNPs) foram detectados entre os pais usando o software GATK (https://software.broadinstitute.org/gatk/best-practices/#variant-disco) e BWA (http://bio-bwa.sourceforge.net /), e SLAFs com & gt três SNPs foram removidos. SLAFs com mais de quatro alelos foram definidos como SLAFs repetitivos e descartados.

Todos os loci SLAF polimórficos foram genotipados de acordo com os loci SNP parentais e descendentes. A análise do código do marcador dos SLAFs polimórficos foi realizada com base no software HighMap com um tipo de população de polinização cruzada (um cruzamento entre dois pais diplóides heterozigotos), que era composto por cinco tipos de segregação (ab × cd, ef × eg, hk × hk, lm × ll e nn × np). No entanto, apenas três tipos de segregação (lm × ll, nn × np e hk × hk) foram genotipados neste trabalho. Para garantir a qualidade do mapa genético, os loci válidos para o mapeamento genético foram filtrados usando as seguintes regras. Primeiro, o genótipo de menor profundidade foi definido como ausente e aqueles com mais de 10 pontos de dados ausentes em cada locus foram eliminados. Em segundo lugar, um teste de qui-quadrado foi realizado, e o limiar P-valor foi definido como 0,01. Os tipos 'lm × ll' e 'nn × np' tinham taxas de segregação de 1: 1, enquanto que 'hk × hk' era 1: 2: 1. Finalmente, SNPs com integridade inferior a 70% e marcadores parentais que não eram homólogos para polimorfismos foram tratados da mesma forma.

Dados fenotípicos de características relacionadas a frutas

A identificação fenotípica das características de qualidade do fruto em pêssego foi realizada em 2015 e 2016 de acordo com o método de Frett et al. (2012) e Wang et al. (2005) [62, 63]. O período de desenvolvimento do fruto (FDP) foi o número de dias desde a plena floração até o amadurecimento dos frutos. O peso do fruto (FW) e o diâmetro do fruto (FD) foram medidos como a média de 10 amostras aleatórias de frutos de cada árvore. A porcentagem da cor da pele vermelha (PSC) foi uma estimativa visual da superfície coberta. O vermelho na carne (RF) e o vermelho ao redor do caroço (RP) foram determinados separadamente por estimativa visual da presença de vermelho na carne e ao redor do caroço, que foi classificado como presente 1 ou ausente 0 (Tabela 1). A aderência da carne ao caroço (AP) foi registrada como freestone (carne e caroço completamente separados), semi-freestone (a carne se separa parcialmente do caroço) e clingstone (sem separação entre a carne e o caroço) (Tabela 3). A qualidade alimentar (EQ), o sabor da fruta (FV) e o conteúdo de fibra da fruta (FFC) foram determinados por estimativa de degustação de nove criadores juntamente com pelo menos dez frutos maduros de cada árvore. EQ e FV foram medidos qualitativamente em uma escala de 1 a 5, e FFC foi medido de 1 a 3 (Tabela 3).

Amostras de frutas para medir o teor de sólidos solúveis (SSC, graus brix médios) e o teor de acidez da fruta (FA) também foram coletadas na maturidade comercial e armazenadas a 25 ± 0,5 ° C com umidade relativa de 75-85%. O SSC e FA dos frutos (pelo menos 5 frutos por vez) foram medidos em intervalos de um dia durante o armazenamento até que a firmeza média fosse inferior a 1 kg / cm 2. A SSC foi medida com um refratômetro (ATAGO, modelo PAL-1) e a FA foi medida com um medidor de acidez de frutas (Coréia, modelo GMK-835F). Os métodos de padronização de fenótipo para 12 características de qualidade de frutos são mostrados na Tabela 3.

Linkage map construction and QTL analysis

HighMap software (http://highmap.biomarker.com.cn/.) was used for linkage map construction [64]. The SLAF markers were mapped to the peach reference genome based on locations and then partitioned into eight linkage groups (LGs). The modified logarithm of odds (MLOD) scores between markers were calculated, and the SLAF markers that scored less than 5.0 were eliminated. The genetic distance in centimorgans (cM) was calculated using Kosambi’s mapping function. Quality assessment of the linkage map in terms of collinearity analysis. MapChart 2.3 (https://www.wur.nl/en/show/Mapchart-2.30.htm) was used to make linkage group figures.

MapQTL6.0 software (https://www.kyazma.nl/index.php/mc.MapQTL/sc.Evaluate/) was used for QTL mapping. The Kruskal–Wallis test was used to detect candidate QTLs (P value < 0.01). Additionally, QTLs with LOD scores greater than the threshold at a 0.99 confidence level based on a 1000-permutation test were declared significant. Neighbouring associated loci having the highest LOD scores (P < 0.02) were selected as co-factors in the multiple QTL model analysis.

Identification of candidate genes

Mapping-associated markers were used to identify the homologous regions of QTLs on the physical map. Corresponding genes in QTLs were referred to the peach genome from GDR [65]. The corresponding genes in QTLs for each trait were mapped to the KEGG database (fttp://fttp.genome.jp/pub/kegg/pathway) for KEGG pathway enrichment analyses. KEGG terms with corrected P values < 0.05 were considered to be significantly enriched.

RNA extraction and gene expression analysis using real-time quantitative PCR (qPCR)

Total RNA was isolated from the peach flesh using a modified PowerPlant® RNA Isolation Kit. RNA quality and integrity were detected by ultraviolet spectrophotometer and agarose gel electrophoresis. The PrimeScript RT Reagent Kit gDNA Eraser (Takara, Beijing, China) was used for converting total RNA to cDNA.

The primer sequences for qPCR were designed by Beacon Designer 8.0 (Table S3). qPCR was carried out with an iQ5 real-time PCR system (BioRad, Plano, TX, USA). The PCR was completed in a 10 μl volume containing 1 μl cDNA, 1 μl of each primer, 2 μl ddH2O and 5 μl SYBR Premix Ex Taq II (2×) (Takara). The qPCR programme was as follows: 1 min at 95 °C, followed by 40 cycles of 15 s at 95 °C, 20 s at 60 °C and 20 s at 72 °C. The mixed sample was heated to 95 °C for 10 s and cooled to 65 °C for 15 s. The sample was then heated to 95 °C at a rate of 0.1 °C/s for melting curve analyses. Peach 18S ribosomal RNA (18S rRNA) was used as the reference gene. Relative expression levels were analysed using the 2 −ΔΔCt method. Each sample was analysed in triplicate.


Assista o vídeo: Complementation test (Junho 2022).


Comentários:

  1. Finlay

    Bravo, brilhante ideia

  2. Chano

    Informações úteis concedidas

  3. Urbano

    Entre nós falando, na minha opinião, é óbvio. Eu recomendo procurar a resposta para sua pergunta no google.com

  4. Oz

    Já estou usando

  5. Lindsay

    Esta é a frase preciosa

  6. Ferran

    Sugiro que você veja o site, com um grande número de artigos sobre o tópico que lhe interessa.



Escreve uma mensagem