Em formação

7.1: Limblessness como um traço discreto - Biologia

7.1: Limblessness como um traço discreto - Biologia



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Marcação R para recriar análises

Squamates, o clado que inclui todas as espécies vivas de lagartos, são bem conhecidos por sua diversidade. Do gigantesco dragão de Komodo da Indonésia (Figura 7.1A, Varanus komodoensis) a minúsculos camaleões de folhas de Madagascar (Figura 7.1B, Brookesia), os escamatos abrangem uma gama impressionante de formas e uso de nicho ecológico (Vitt et al. 2003; Pianka et al. 2017). Até mesmo as cobras (Figura 7.1C e D), extraordinariamente diversas em seu próprio direito (~ 3.500 espécies), são na verdade um clado que está aninhado dentro de escamatas (Streicher e Wiens 2017). A linhagem squamate que é ancestral das cobras tornou-se sem membros há cerca de 170 milhões de anos (ver Hedges et al. 2006) - e também passou por uma série de mudanças no formato da cabeça, trato digestivo e outras características associadas ao estilo de vida sem membros. Em outras palavras, as cobras são lagartos - lagartos altamente modificados, mas ainda assim lagartos. E as cobras não são a única linhagem sem membros de escamatas. Na verdade, as linhagens dentro dos escamados perderam seus membros repetidamente ao longo de sua história (por exemplo, Figura 7.1E e F), com algumas estimativas de que os escamosos perderam seus membros pelo menos 26 vezes nos últimos 240 milhões de anos (Brandley et al. 2008).

Figura 7.1. Squamates, com e sem pernas. A. Dragão Komodo, camaleão B. Brookesia, C. False coral (Oxyrhopus guibei) e D. cobras hognose, E. um pigopodídeo - uma lagartixa sem membros e F. uma anguida, outro lagarto sem pernas. Créditos das fotos: A: Usuário: Raul654 / Wikimedia Commons / CC-BY-SA-3.0, B. Brian Gratwicke / CC-BY-2.0, C. Usuário: Gionorossi / Wikimedia Commons / CC-BY-SA-4.0, D. Usuário: Bladerunner8u / Wikimedia Commons / CC-BY-SA-3.0, E. Usuário: Smacdonald / Wikimedia Commons / CC-BY-SA-2.5, F. Usuário: Marek_bydg / Wikimedia Commons / CC-BY-SA-3.0.

Limblessness é um exemplo de um traço discreto - um traço que pode ocupar um de um conjunto de estados de caráter distintos. Analisar a evolução de características discretas requer uma abordagem de modelagem diferente daquela que usamos para características contínuas. Neste capítulo, discutirei o modelo Mk (Lewis 2001), que é uma abordagem geral para modelar a evolução de características discretas em árvores. Ajustar este modelo a dados comparativos nos ajudará a entender a evolução de características como a ausência de membros, onde as espécies podem ser colocadas em um de vários estados de caracteres discretos.


Ferramentas filogenéticas para biologia comparativa

Recentemente, no Twitterverse, encontrei um tópico em que o autor descreveu o uso de revBayes para caber em um Mk modelo para várias características discretas ao mesmo tempo, assumindo o mesmo valor da matriz de transição (Q) para todas as características.

Isso é lógico para alguns traços, porque o ajuste do Mk modelo para uma única característica discreta pode muitas vezes ter dados limitados, particularmente se a característica muda raramente (o que deixará, portanto, muito poucas informações sobre o processo de transição para qualquer característica particular).

Isso não faria muito sentido para situações em que, por exemplo, esperávamos que a taxa de mudança fosse muito diferente de característica para característica. Por outro lado, faz muito sentido se as mudanças forem raras e / ou se houver razões biológicas para presumir que a taxa de mudança na característica é semelhante para características diferentes e, particularmente, se pretendemos continuar a usar nossa estimativa valor para Q em outras análises, como na reconstrução do estado ancestral ou mapeamento estocástico. (Mais sobre isso em um episódio separado!)

Claro, isso pode tb ser feito em R!

Em primeiro lugar, isso pode ser feito usando meu fitools função taxa por árvore porque esta função (por padrão) se ajusta a dois modelos & ndash um em que as taxas de transição são diferentes em todas as árvores e um segundo em que são tudo o mesmo.

No entanto, ele também pode ser ajustado apenas criando sua própria função de probabilidade personalizada e, em seguida, otimizando-a. Vou demonstrar essa opção aqui, pois será executado mais rápido do que usar ratebytree & ndash simplesmente porque não estamos ajustando o modelo de múltiplas taxas também.

Primeiro, deixe-me carregar fitools e, em seguida, simular uma árvore e 20 caracteres binários na filogenia com um valor constante da matriz de transição Q do seguinte modo.

Os leitores podem ver que simulei dados para uma característica binária com dois níveis, 0 e 1, em que a taxa de transição de 0 & rarr 1 é 2,0, enquanto a taxa de transição de 1 & rarr 0 é 1,0.

Ótimo, agora vamos fazer nossa função de probabilidade.

A maneira como vou fazer isso é usando o fitools função fitMk, mas na qual eu consertar o valor de Q a um valor que pré-especificarei em nossa função de verossimilhança.

Poderíamos ter feito isso de outras maneiras. Por exemplo, fitMk e fitDiscrete no Geiger pacote também exporta a função de verossimilhança como parte do objeto de modelo.

Aqui está a aparência de nossa função de probabilidade. Observe que para usar mapply para adicionar as verossimilhanças de log em todas as características, primeiro recomponho minha matriz de dados de características (X) e minha Q matriz (Q) em listas. Em teoria, este código não exigem que eu tenha a mesma codificação de caracteres para cada característica & ndash, apenas que estou disposto a assumir o mesmo valor de Q, dada a ordem da linha / coluna corresponde à ordem dos níveis de cada característica. (Também pressupõe que cada característica tem mais de um estado. Seria uma solução simples relaxar essa suposição.)

Agora que tenho minha função de probabilidade, posso ir em frente e otimizá-la usando uma das rotinas de otimização numérica integradas do R & # 39. Vou usar o optim & ndash, mas há outros que poderia ter tentado (por exemplo, nlminb).

Na otimização, utilizarei o método & quotL-BFGS-B & quot, que é uma rotina & # 39 restrita à caixa & # 39. Valores para Qeu j (para eu & ne j) são logicamente restritos a serem & ge 0, mas para evitar problemas, definirei os limites inferiores para 10 -8. Definirei meu limite superior para 100, mas isso pode ser ajustado com base na profundidade total da árvore.

Lembrando que para simular nossos dados, configuramos Q1,2 ser 2.0 e Q2,1 para ser 1,0. Nossas estimativas acabaram sendo realmente muito fechar.

Agora vamos comparar a taxa por árvore da seguinte maneira:

Arrumado. Isso também nos diz como variado nosso parâmetro de modelo ajustado estimado teria sido se encaixarmos nosso Mk modelo para qualquer um desses 20 vetores de características individualmente!


Fundo

Estudos seminais de King e Wilson [1] analisando a evolução de proteínas em vertebrados especularam a importância das mudanças evolutivas nos “processos regulatórios” da diversidade morfológica [2, 3]. Essas ideias foram logo expandidas por François Jacob [4], que sugeriu que o "remendo" molecular de sistemas pré-existentes é uma marca da evolução onde, por exemplo, os processos regulatórios podem ser transformados ou combinados para ganho funcional [4] . Essas teorias fundamentam muitos estudos sobre a divergência de processos regulatórios associados à evolução morfológica e amplamente focam nas mudanças nas redes regulatórias de genes (GRNs) que determinam os padrões de expressão dos genes [5, 6]. Essas mudanças podem ser mutações nos locais de ligação do fator de transcrição (TFBSs) localizados em cis-elementos reguladores (promotores e potenciadores) de genes ou trans mudanças regulatórias que são devidas a mudanças no nível de um regulador [6]. Alterações de GRNs podem levar à divergência fenotípica [7], e essas mudanças de GRN entre espécies, independentemente da consequência funcional direta e indireta, são definidas como eventos de “religação” de GRN. Este é caracterizado por interações regulatórias presentes em uma ou mais espécies, mas ausentes em outra espécie, e potencialmente substituídas por uma nova interação entre o FT ortólogo e um gene alvo. Vários estudos comparativos de GRNs subjacentes aos mecanismos de adaptação e evolução foram realizados em procariotos unicelulares, E. coli [8] e vários eucariotos não vertebrados, incluindo leveduras [9, 10], plantas [11], mosca da fruta [12] e equinodermos [12, 13]. Embora haja esforços para reunir e integrar vários conjuntos de dados genômicos para vertebrados, incluindo humanos e camundongos [14], a análise comparativa de redes regulatórias a partir desses dados por si só permanece um grande desafio computacional e muito pouco se sabe sobre o efeito fenotípico da regulação de todo o genoma eventos de religação de rede em vertebrados não-modelo [15].

Nos vertebrados, os peixes com nadadeiras raiadas são a maior radiação de qualquer grupo, e os ciclídeos da África Oriental representam, sem dúvida, os exemplos modernos mais específicos de radiações adaptativas. Nos grandes lagos da África Oriental (Tanganica, Victoria e Malawi) e nos últimos milhões de anos [16, 17], uma ou algumas linhagens ancestrais de peixes ciclídeos irradiaram-se independentemente para dar origem coletivamente a mais de 1.500 espécies. Essas espécies ocupam uma grande diversidade de nichos ecológicos e diferem dramaticamente em características fenotípicas, incluindo morfologia esquelética, dentição, padrões de cores e uma variedade de características comportamentais. Demonstramos anteriormente que uma série de mecanismos moleculares moldaram os genomas dos ciclídeos da África Oriental, por exemplo, rápida evolução de elementos reguladores e divergência de expressão gênica [18], e o "remendo evolutivo" desses sistemas [19] forneceu o substrato necessário para diversificação [18]. Isso, juntamente com a origem recente das espécies de ciclídeos e o fluxo gênico contínuo [20], sugere que as mudanças regulatórias evolutivas têm um papel funcional importante no controle da expressão gênica e, em última análise, na variação fenotípica. No entanto, muito pouco se sabe sobre a evolução do genoma das redes regulatórias que podem estar subjacentes a várias características da diversidade fenotípica dos ciclídeos. Aqui, desenvolvemos um novo arcabouço computacional para caracterizar a evolução das redes regulatórias e analisar a plausibilidade de se o “ajuste” dos sistemas regulatórios poderia contribuir para a diversidade fenotípica em ciclídeos intimamente relacionados.


Comportamento estatístico

O modelo MuSSCRat tem muitos parâmetros relativos ao número de observações, | $ mathcal$ | e | $ mathcal$ | ⁠. Portanto, não está claro o quão bem este modelo complexo pode detectar a variação da taxa ou distinguir entre as fontes de variação da taxa dependentes do estado e de fundo. Nesse sentido, realizamos um estudo de simulação para caracterizar o comportamento estatístico do modelo dependente de estado. Especificamente, realizamos experimentos para compreender: 1) sua capacidade de detectar variação de taxa dependente do estado na ausência de variação de taxa de fundo 2) sua capacidade de detectar variação de taxa dependente de estado na presença de variação de taxa de fundo 3) o custo de incluir a variação da taxa de background no modelo quando as taxas de background são realmente constantes e 4) as consequências de assumir que as taxas de background são constantes quando são realmente variáveis.

Para as análises a seguir, aproximamos a densidade de probabilidade posterior conjunta executando duas simulações MCMC replicadas para cada conjunto de dados simulado. Realizamos o diagnóstico MCMC para garantir que a densidade posterior da articulação foi adequadamente aproximada. Fornecemos detalhes das simulações MCMC e diagnósticos MCMC no Material Suplementar disponível no Dryad.

Medidas de Desempenho

Propriedades freqüentistas

A interpretação frequentista de um intervalo de credibilidade bayesiano (IC) é que o valor verdadeiro de um parâmetro tem um | $ <100 (1 - alpha) \%> $ | chance de estar dentro de | $ <100 (1 - alpha) \%> $ | CI de sua distribuição posterior marginal correspondente (assumindo que o modelo seja verdadeiro, ver Huelsenbeck e Rannala 2004). Com essa interpretação em mente, avaliamos as propriedades frequentistas de | $ 95 \% $ | IC inferido para nossos conjuntos de dados simulados (assumindo o nível de significância convencional, | $ alpha = 0,05 $ | ⁠). Nós definimos o probabilidade de cobertura como a frequência com que o valor verdadeiro de um parâmetro está contido no | $ 95 \% $ | CI, o taxa de falso positivo como a frequência com que o valor verdadeiro é excluído de | $ 95 \% $ | CI (um menos a probabilidade de cobertura), e o potência como a frequência com que um modelo independente de estado é excluído de | $ 95 \% $ | CI quando o modelo dependente do estado for verdadeiro.

Precisão e preconceito

Experimentos de Simulação

Experimento 1: taxas de fundo constantes

Simulamos conjuntos de dados de diferentes tamanhos (com | $> $ | caracteres contínuos), em uma variedade de tamanhos de árvore (com | $> $ | espécies) e razões de taxas dependentes do estado, | $ < zeta ^ 2_1 / zeta ^ 2_0 = <1, 2, 4, 8 >> $ | (onde | $ < zeta ^ 2_1 / zeta ^ 2_0 = 1> $ | corresponde ao caso em que as taxas não dependem do estado do traço discreto). Para cada combinação de | $ c $ | ⁠, | $ N $ | ⁠ e | $ < zeta ^ 2_1 / zeta ^ 2_0> $ | ⁠, simulamos 100 árvores sob um processo de nascimento-morte de taxa constante com uma taxa de especiação de 1 e uma taxa de extinção de 0,5 usando o pacote R (R Core Team 2017) TESS (Höhna et al. 2015), então redimensionamos cada árvore para ter uma altura de raiz de 1. Simulamos histórias de caracteres discretos sob um cadeia de Markov simétrica de tempo contínuo com uma taxa especificada de modo que o número esperado de transições fosse 5. Em seguida, desenhamos matrizes de correlação de uma distribuição LKJ com | $ < eta = 1> $ | ⁠, e taxas relativas para cada caractere contínuo de uma distribuição simétrica de Dirichlet com | $ < gamma = 1> $ | ⁠. Finalmente, simulamos | $ c $ | caracteres contínuos sob um modelo de movimento browniano multivariado assumindo uma taxa de fundo de 1. Fornecemos mais detalhes para o procedimento de simulação no Material Suplementar disponível no Dryad.

Analisamos cada conjunto de dados simulado no RevBayes sob o modelo MuSSCRat, assumindo que a verdadeira filogenia era conhecida. Limitamos o modelo para que a taxa de fundo fosse igual para cada linhagem (ou seja, o modelo de taxa constante) e excluímos o parâmetro de desvio padrão, | $ nu $ | ⁠, do modelo. Estimamos os parâmetros restantes do modelo a partir dos dados simulados usando os antecedentes descritos na seção de inferência bayesiana, acima. Uma vez que o modelo de geração e o modelo de inferência excluem a variação da taxa de fundo, este cenário de simulação reflete o desempenho do método quando o modelo é especificado corretamente.

A taxa de falsos positivos para esta experiência de simulação foi de | $ 5,3 \% $ | (ou seja, quando | $ zeta ^ 2_1 / zeta ^ 2_0 = 1 $ | ⁠ Fig. 3, a linha superior dos três painéis superiores), que é indistinguível do esperado | $ 5 \% $ | (teste binomial bicaudal | $ <

neq 0.05> $ | ⁠, | $ P- < text aprox 0,6> $ | ⁠). Em seguida, calculamos a potência quando as taxas de evolução de caracteres contínuos variam entre os estados discretos (⁠ | $ < zeta ^ 2_1 & gt zeta ^ 2_0> $ | ⁠). A potência variou de | $ < approx 21 \%> $ | para | $ 100 \% $ | do pior caso ao melhor cenário. Previsivelmente, a potência melhorou à medida que o número de caracteres contínuos e espécies aumentaram em geral, a potência média foi de | $ 80,4 \% $ | (Fig. 3, três painéis superiores, excluindo a fileira superior). A estimativa da média posterior de | $ zeta ^ 2_1 $ | foi ligeiramente tendencioso para pequenos números de caracteres contínuos (⁠ | $$ | ⁠), mas convergiu rapidamente para o valor verdadeiro à medida que o número de caracteres e espécies aumentava (Fig. 4, linha superior de painéis).

A frequência com que | $ < zeta ^ 2_1 / zeta ^ 2_0 = 1> $ | foi excluído de | $ 95 \% $ | CI quando as taxas de fundo eram constantes (linha superior dos painéis) ou variáveis ​​(linha inferior dos painéis). Cada painel corresponde a simulações para um determinado número de espécies, | $$ | ⁠. Em cada painel, as linhas correspondem a diferentes graus de variação da taxa dependente do estado, | $ < zeta ^ 2_1 / zeta ^ 2_0> $ | ⁠, e as colunas correspondem a diferentes números de caracteres contínuos, | $$ | ⁠. Cada célula representa a fração de | $ 95 \% $ | IC que exclui | $ zeta ^ 2_1 / zeta ^ 2_0 = 1 $ | ⁠, colorido de acordo com a escala (à direita).

A frequência com que | $ < zeta ^ 2_1 / zeta ^ 2_0 = 1> $ | foi excluído de | $ 95 \% $ | CI quando as taxas de fundo eram constantes (linha superior dos painéis) ou variáveis ​​(linha inferior dos painéis). Cada painel corresponde a simulações para um determinado número de espécies, | $$ | ⁠. Em cada painel, as linhas correspondem a diferentes graus de variação da taxa dependente do estado, | $ < zeta ^ 2_1 / zeta ^ 2_0> $ | ⁠, e as colunas correspondem a diferentes números de caracteres contínuos, | $$ | ⁠. Cada célula representa a fração de | $ 95 \% $ | IC que exclui | $ zeta ^ 2_1 / zeta ^ 2_0 = 1 $ | ⁠, colorido de acordo com a escala (à direita).

O erro percentual das estimativas da média posterior de | $ < zeta ^ 2_1> $ | quando as taxas de fundo eram constantes (linha superior de painéis) ou variáveis ​​(linha inferior de painéis). Cada coluna de painéis corresponde a simulações para um determinado número de espécies, | $$ | ⁠. Em cada painel, os boxplots representam a distribuição da porcentagem de erro em 100 conjuntos de dados simulados para cada um dos | $ c $ | caracteres contínuos (ao longo do eixo x), coloridos pelas taxas dependentes de estado verdadeiras, | $ zeta ^ 2_1 / zeta ^ 2_0 $ | (veja a legenda inserida). Os boxplots representam o meio | $ 50 \% $ | (caixas) e o meio | $ 95 \% $ | (bigodes) de simulações.

O erro percentual das estimativas da média posterior de | $ < zeta ^ 2_1> $ | quando as taxas de fundo eram constantes (linha superior de painéis) ou variáveis ​​(linha inferior de painéis). Cada coluna de painéis corresponde a simulações para um determinado número de espécies, | $$ | ⁠. Em cada painel, os boxplots representam a distribuição da porcentagem de erro em 100 conjuntos de dados simulados para cada um dos | $ c $ | caracteres contínuos (ao longo do eixo x), coloridos pelas taxas dependentes de estado verdadeiras, | $ zeta ^ 2_1 / zeta ^ 2_0 $ | (veja a legenda inserida). Os boxplots representam o meio | $ 50 \% $ | (caixas) e o meio | $ 95 \% $ | (bigodes) de simulações.

Experimento 2: taxas de fundo variáveis

Neste cenário de simulação, reutilizamos todas as árvores simuladas, histórias de caracteres discretos, matrizes de correlação e parâmetros de taxa relativa que descrevem o grau de variação entre caracteres contínuos do primeiro experimento de simulação (com taxas de fundo constantes). Nesta simulação, no entanto, simulamos taxas específicas de linhagem de evolução de caracteres contínuos, desenhando a taxa de fundo para cada linhagem, | $ beta ^ 2_l $ | ⁠, a partir de uma distribuição lognormal com média | $ < mu = 1> $ | e desvio padrão | $ < nu = H> $ | ⁠.

Para este cenário, analisamos cada conjunto de dados simulado usando o modelo MuSSCRat com variação da taxa de fundo, permitindo | $ beta ^ 2_l $ | para variar entre os ramos, conforme descrito na seção de inferência Bayesiana (MuSSCRat + UCLN). Novamente, este cenário de simulação reflete o desempenho do método quando o modelo é especificado corretamente, uma vez que o modelo de geração de dados e o modelo de inferência permitem que as taxas de background variem entre as linhagens.

A taxa de falsos positivos para esta experiência foi de | $ 4,9 \% $ | (Fig. 3, linha superior dos três painéis inferiores), novamente indistinguível do esperado | $ 5 \% $ | (teste binomial bicaudal | $ P neq 0,05 $ | ⁠, | $ P- < text approx 1> $ | ⁠). A potência foi apenas ligeiramente inferior à do experimento 1: a potência foi de | $ 14,7 \% $ | no pior caso, e | $ 100 \% $ | No melhor caso. Em média, a energia era de | $ 73,7 \% $ | (Fig. 3, três painéis inferiores, excluindo a fileira superior). Novamente, a estimativa da média posterior de | $ zeta ^ 2_1 $ | foi apenas modestamente tendencioso para análises baseadas em um pequeno número de caracteres contínuos (Fig. 4, linha inferior de painéis).

Experimento 3: Custo da variação da taxa de fundo

Quando as taxas de fundo de evolução de caractere contínuo são constantes, esperamos que a inclusão de parâmetros desnecessários (ou seja, para acomodar a variação da taxa de fundo) no modelo de inferência deve diminuir nossa capacidade de detectar variação de taxa dependente do estado. O objetivo deste experimento de simulação é entender o custo de acomodar a variação da taxa de fundo quando ela está ausente. Para conseguir isso, reutilizamos os conjuntos de dados do Experimento 1 (simulado sob taxas de fundo constantes) com | $$|⁠ , |$$ | ⁠ e | $ < zeta ^ 2_1 / zeta ^ 2_0 = <1, 2, 4, 8 >> $ | ⁠, mas analisou esses conjuntos de dados sob o modelo MuSSCRat + UCLN.

Para o Experimento 1 - onde presumimos corretamente que as taxas de background eram constantes - a probabilidade de cobertura era de | $ 95,3 \% $ | (teste binomial bicaudal | $ <

neq 0.95> $ | ⁠, | $ P- < text aprox 0,4> $ | ⁠). Por outro lado, neste experimento - quando assumimos incorretamente que as taxas de histórico são variáveis ​​- a probabilidade de cobertura foi de | $ 97,4 \% $ | (teste binomial bicaudal | $ <

neq 0.95> $ | ⁠, | $ P- < text = 0,02> $ | ⁠). No geral, o custo de acomodar a variação da taxa de fundo quando ausente foi, portanto, bastante modesto (⁠ | $ <97,4 \% - 95,3> \% = 2,1 \% $ | ⁠). Além disso, as distribuições posteriores do parâmetro de variação da taxa de fundo, | $ nu $ | ⁠, encolheram fortemente em direção ao valor verdadeiro, | $ < nu = 0> $ | (o modelo de taxa de background constante): a estimativa média posterior média de | $ nu $ | nessas simulações foi de | $ < approx 0.21> $ | (em comparação com uma média anterior de | $ < approx 0,59> $ | ⁠ consulte o Material Suplementar disponível na Dríade).

Experimento 4: Consequências de ignorar a variação da taxa de fundo

Quando as taxas de histórico de evolução de caráter contínuo variam entre as linhagens, esperamos que excluindo a variação da taxa de background do modelo de inferência pode ser positivamente enganosa. O objetivo deste experimento de simulação é compreender as consequências de não acomodar a variação da taxa de fundo em inferências sobre taxas dependentes de estado de evolução de caracteres contínuos. Para conseguir isso, reutilizamos os conjuntos de dados do Experimento 2 (simulado sob taxas de fundo variáveis), com | $$|⁠ , |$$ | ⁠, e | $ < zeta ^ 2_1 / zeta ^ 2_0 = <1, 2, 4, 8 >> $ | ⁠, mas analisou esses conjuntos de dados usando o modelo MuSSCRat "restrito" (ou seja, que assume uma taxa de evolução de fundo constante, forçando | $ beta ^ 2_l $ | a ser o mesmo para todas as linhagens).

Para o Experimento 2 - onde presumimos corretamente que as taxas de fundo são variáveis ​​- a probabilidade de cobertura era de | $ 94,5 \% $ | (teste binomial bicaudal | $ <

neq 0.95> $ | ⁠, | $ P- < text approx 0,19> $ | ⁠). Em contraste, neste experimento - quando incorretamente assumimos que as taxas de fundo são constantes - a probabilidade de cobertura diminuiu para | $ 85,4 \% $ | (teste binomial bicaudal | $ <

neq 0.95> $ | ⁠, | $ P- < text & lt 1e-10> $ | ⁠). Esta probabilidade de cobertura diminuída implica que estamos muito confiantes na resposta errada sobre | $ 10 \% $ | com mais frequência do que deveríamos. Por exemplo, quando as taxas dependentes do estado são verdadeiramente iguais (⁠ | $ < zeta ^ 2_1 / zeta ^ 2_0 = 1> $ | ⁠), inferiremos incorretamente - mas com confiança - que as taxas dependentes do estado diferem | $ 17,7 % $ | do tempo.


Ferramentas filogenéticas para biologia comparativa

Eu (não muito) recentemente fiz a seguinte pergunta sobre o mapa de densidade da função fitool:

É possível fazer o mesmo que o seu método 1 & # 39Visualizando o resultado agregado do mapeamento estocástico, em seu artigo (2013): & ldquoDois novos métodos gráficos para mapear a evolução da característica em filogenias & rdquo, para uma característica discreta que não é uma característica binária?

Atualmente, o densityMap, que cria uma visualização da densidade de probabilidade posterior a partir do mapeamento estocástico de um caractere binário na árvore, não funciona com mais de dois caracteres. Isso ocorre principalmente porque é difícil imaginar a visualização de cores em mais de uma dimensão! (Um possível para um caractere de três estados seria colocar as probabilidades em uma escala 3D RGB - mas isso adiciona apenas uma dimensão à análise de qualquer maneira.)

A única solução agora é usar mergeMappedStates nas árvores & quot & quotA & quotA & quot vs. & quotnot A & quot;

Aqui está uma rápida demonstração de como fazer isso, que teria que variar dependendo dos estados de personagem específicos que estavam sendo modelados:


Relações genéticas baseadas em traços dentários discretos: Basketmaker II e Mimbres

As investigações das relações entre cultura e biologia entre populações pré-históricas do sudoeste dos Estados Unidos podem aprimorar nossa reconstrução das interações sociais. O presente estudo analisa a dentição permanente de indivíduos Basketmaker II e Mimbres de múltiplos locais usando o sistema de antropologia odontológica da Arizona State University e os compara com uma amostra regional. A análise discreta das características dentais fornece um meio útil para avaliar o grau de parentesco genético entre populações quando grandes amostras comparativas estão disponíveis. Ambos no local a mudança cultural e a substituição da população foram postuladas como o mecanismo dominante atuando nos grupos Basketmaker e primeiros Puebloan. Examinamos a relação dessas populações com prováveis ​​falantes do uto-asteca à luz da hipótese da migração de fazendeiros uto-asteca. O complexo Basketmaker II, tradicionalmente reconhecido como uma unidade cultural distinta, exibe considerável heterogeneidade populacional. Os cestistas ocidentais parecem compartilhar laços biológicos com os falantes do uto-asteca, enquanto os cestistas orientais não, como previsto pelo modelo. A relação dos mimbres com prováveis ​​falantes uto-astecanos é menos clara porque os mimbres mostram apenas afinidades fracas com as populações do norte do México. Copyright © 2007 John Wiley & Sons, Ltd.


Biologia Capítulo 14

Mendel poderia facilmente projetar seus experimentos controlando quais pais estavam envolvidos no acasalamento e quais indivíduos estavam disponíveis que diferiam em características facilmente reconhecíveis, como cor da flor ou formato da semente

Mendel evitou a autofecundação removendo os órgãos reprodutores masculinos antes que qualquer pólen se formasse

Mendel começou seu trabalho obtendo indivíduos de linhagens verdadeiras ou puras (consiste em indivíduos que produzem descendentes idênticos a eles quando são autofecundados ou cruzados com outro membro da mesma população de linha pura)

Ao começar com linhas puras previsíveis, ele poderia ter certeza de que qualquer novo fenótipo após o cruzamento era devido ao cruzamento

Os indivíduos usados ​​no cruzamento inicial são a geração parental e sua progênie é a geração F1

Geração F1 acasalando-se

Pais híbridos para uma única característica

Na geração F2, as sementes enrugadas apareceram novamente

Traço enrugado = recessivo em relação ao traço da semente redonda
Forma redonda = traço dominante em relação à forma enrugada

Dominante não é necessariamente mais apto do que indivíduos com fenótipo recessivo

Mendel propôs que cada indivíduo pode ter duas versões de qualquer gene - Alelo

Como resultado, cada gameta contém um alelo de cada gene

Isso é chamado de Princípio de Segregação

Alelos segregados presentes nos gametas de cada pai se reúnem na fertilização para produzir um zigoto, a primeira célula da prole

Indivíduos com dois alelos diferentes para o mesmo gene

Existiam duas possibilidades de como os alelos dos genes - gene para a forma da semente e gene para a cor da semente - seriam transmitidos à descendência de um cruzamento di-híbrido:

(1) O alelo para a forma da semente e o alelo para a cor da semente originalmente presente em cada um dos pais separariam um do outro e seriam transmitidos de forma independente - sortimento independente

(2) O alelo para a forma da semente e o alelo para a cor da semente originalmente presente em cada um dos pais seriam transmitidos para os gametas juntos - Sortimento dependente

Mendel descobriu que todos os descendentes F1 tinham sementes amarelas e redondas - ao examinar os fenótipos dos descendentes F2, ele descobriu que eles se conformavam com as predicações da hipótese de Sortimento Independente - 4 fenótipos, proporção de 9: 3: 3: 1

Mendel analisou um grande número de descendentes - quanto menor o tamanho da população, menor a chance de se aproximar das proporções previstas

Existem duas maneiras igualmente prováveis ​​para os pares homólogos se alinharem, e esta é a base física do princípio de classificação independente de Mendel

Tipo selvagem: fenótipos comuns usados ​​porque as moscas não podem ser de & quot linha pura & quot como ervilhas de Mendel

Um indivíduo com um fenótipo incomum devido a uma mutação é um mutante

Padrões de herança observados em genes transportados nos cromossomos sexuais

Mulheres e homens têm diferentes números de alelos de um gene

Vinculado significa inseparável?

Visto quando os genes estão no mesmo cromossomo

Uma pequena porcentagem de homens carregava um cromossomo X com novas combinações de alelos: Xwy ou XWY - Morgan se referia a esses indivíduos como Recombinantes porque os alelos em seu cromossomo X eram diferentes (recombinados) das combinações presentes em sua mãe

Morgan concluiu que os alelos no mesmo cromossomo costumam ficar juntos, mas nem sempre, e propôs que gametas com novas combinações de alelos foram gerados quando o crossing over ocorreu durante a prófase da meiose I em mulheres

A classificação independente prevê uma proporção de 1: 1: 1: 1 de todas as quatro combinações de fenótipos, enquanto a ligação completa daria apenas os dois fenótipos associados aos cromossomos não recombinantes ou parentais

Quanto mais genes estiverem separados no mesmo cromossomo, mais provável é que ocorra um cruzamento em algum lugar entre esses genes - Mapa Genético

Os genes ligados são herdados juntos, a menos que ocorra o cruzamento entre eles e, quando o cruzamento ocorre, ocorre a recombinação genética


Resultados

Uma análise de agrupamento K-médias não supervisionada de 10 variáveis ​​colorimétricas (Tabela 1) revelou que o número ideal de agrupamentos de cores para mulheres e homens é 3 (Tabela 2). Tanto para mulheres quanto para homens, o número global ideal de K-médias foi 3, com uma estatística de gap máximo em K-médias = 3 (Tabela 2).

2017 Mulheres
N = 47
2017 Homens
N = 85
Discriminante linear Discriminante linear 1 Discriminante linear 2 Discriminante linear 1 Discriminante linear 2
Brilho médio 0.092 0.138 −0.213 0.088
Intensidade 0.105 0.156 0.101 0.051
Croma UV −1318.082 11529.59 −867.469 5969.393
Croma amarelo 133.069 −63.721 −12.332 −105.373
Croma azul −1299.786 11522.04 −846.666 5934.362
Croma verde −1355.169 11550.36 −888.693 6035.815
Croma vermelho −1395.448 11597.21 −887.764 6007.215
Contraste −0.155 −0.246 0.049 −0.105
Saturação espectral −6.105 −2.555 −9.871 0.476
Matiz 0.129 0.041 −0.019 0.027
Observado
laranja
Observado
amarelo
Observado
Branco
Soma
2017
Mulheres
Previsto
laranja
7 0 0 7
Previsto
amarelo
1 20 1 22
Previsto
Branco
0 0 18 18
Soma 8 20 19 47
2017
Machos
Previsto
laranja
27 0 0 27
Previsto
amarelo
4 29 1 34
Previsto
Branco
0 0 24 24
Soma 31 29 25 85

As análises de função discriminante linear das mesmas 10 variáveis ​​colorimétricas (Tabela 1) discriminaram entre as três classes de morfologia de cor (Figs. 2A e amp 2B) em P. erhardii com alguma sobreposição nas elipses de confiança de 95% de morfos de laranja e amarelo para ambos os sexos (Figs. 2C e amp 2D). Os resultados de LDFA de mulheres e homens mostram que as três formas de cores são discerníveis (Figs. 2C e 2D), e as formas de cores diferem significativamente com base nas 10 variáveis ​​colorimétricas (Wilks ’Lambda p & lt 0,001). As previsões de morfismo de LDFAs para mulheres e machos corresponderam estreitamente às atribuições de morfologias observadas (Tabela 3). Para mulheres, a discriminação multivariada de morfologia de cor com base nas 10 variáveis ​​colorimétricas foi significativa (Wilks ’Lambda = 0,042, F (2,44) = 13,533, p & lt 0,001). Para os homens, a discriminação multivariada de morfologia de cor com base nas mesmas 10 variáveis ​​colorimétricas também foi significativa (Wilks 'Lamdba = 0,029, F (2,82) = 35,729, p & lt 0,001).

Figura 2: A cor se transforma em Podarcis erhardii.

2017 Mulheres
N = 47
2017 Homens
N = 85
K-means Estatística de lacuna Padrão Erro Estatística de lacuna Padrão Erro
1 0.272 0.035 0.309 0.025
2 0.363 0.033 0.440 0.024
3 0.385 0.031 0.502 0.022
4 0.358 0.031 0.492 0.022
5 0.366 0.032 0.496 0.021
6 0.382 0.032 0.495 0.021

A força máxima de mordida foi fortemente correlacionada positivamente com todos os dados morfométricos da cabeça (comprimento da cabeça, largura da cabeça, altura da cabeça) e a morfometria da cabeça também foi fortemente correlacionada positivamente com o tamanho do corpo em ambos os sexos (Tabela 4), então nos concentramos aqui na relação entre a força de mordida , mudança de cor e tamanho do corpo porque o tamanho do corpo influencia o tamanho da cabeça. A força máxima de mordida em lagartos machos foi fortemente correlacionada positivamente com o tamanho do corpo do lagarto (regressão linear força máxima de mordida ∼SVL, adj. r 2 = 0.644, p = 0.002, N = 81, df = 79, Fig. 3A), e os morfos de cores masculinos tinham SVLs significativamente diferentes (ANOVA SVL ∼morfia F (2,78) = 11,6, p & lt 0,05, Tabela 4, Fig. 3A). A post hoc Tukey HSD test showed that orange males had significantly longer SVLs than white and yellow males, which did not differ from each other in SVL (Table 4). We then analyzed differences in bite force among male morphs that accounted for lizard size in a GLM that included morph and SVL as fixed effects, and found no significant effect of morph on maximum bite force capacity (GLM maximum bite force ∼morph + SVL, F(3,77) = 13.41, morph p > 0.05, SVL p < 0.001).

Morphometric
ANOVA
Post hoc
comparisons
Male
Difference
Male
P (adj)
Female
Difference
Female
P (adj)
Male SVL
F(2,78) = 11.6
Female SVL
F(2,43) = 0.527
white-orange −3.748 0.001* −0.805 0.932
yellow-orange −4.601 <0.001* −2.268 0.568
yellow-white −0.853 0.709 −1.463 0.675
Male head length
F(2,78) = 14.64
Female head length
F(2,43) = 0.221
white-orange −1.161 <0.001* −0.158 0.892
yellow-orange −1.33 <0.001* −0.523 0.285
yellow-white −0.169 0.821 −0.365 0.360
Male head width
F(2,78) = 12.41
Female head width
F(2,43) = 0.469
white-orange −0.865 <0.001* −0.062 0.957
yellow-orange −0.879 <0.001* −0.184 0.669
yellow-white −0.014 0.997 −0.123 0.744
Male head height
F(2,78) = 11.1
Female head height
F(2,43) = 0.822
white-orange −0.417 0.043* −0.287 0.431
yellow-orange −0.422 0.032 * −0.245 0.531
yellow-white −0.005 0.999 −0.043 0.968

Female maximum bite force was also positively correlated with body size (Linear regression maximum bite force ∼SVL, adj. r 2 = 0.704, p < 0.001, N = 46, df = 44, Fig. 3B). In contrast to males, female color morphs did not differ in body size (ANOVA SVL ∼morph F(2,43) = 0.651, p = 0.527, Fig. 3B,da Table 4), or head morphometrics (Table 4). In a GLM that included morph and SVL as fixed effects, we did not detect a significant effect of morph on maximum bite force for female color morphs of P. erhardii from the same population (GLM maximum bite force ∼morph + SVL, F(3,42) = 14.72, morph p > 0.05, SVL p < 0.001).

Figure 3: Relationship between maximum bite force and lizard body size (SVL) among color morphs.

From the femoral gland secretions of male P. erhardii (N = 39) originating from the study population in Moni (Naxos, Greece), we could identify 81 different lipophilic compounds (Supplemental Information 3). Considering all individuals together, secretions were mainly a mixture of steroids (average ± SE % of TIC: 68.4 ±1.21%), waxy esters (17.7 ± 0.82%) and tocopherol (5.6 ±0.88%). Fatty acids (3.3 ± 0.40%), alcohols (1.8 ± 0.10%), and aldehydes (1.4 ± 0.11%) were present in intermediate concentrations. Amides (0.6 ± 0.13%), ketones (0.5 ± 0.06%), a terpenoid (0.3 ± 0.06%), and furanones (0.3 ± 0.03%) were the four chemical classes with the lowest average proportion. On average, the five most abundant chemicals were cholesterol (39.8 ± 1.37%), campesterol (7.9 ± 0.41%), α-tocopherol (5.6 ± 0.88%), the 1,2-ethanediyl ester of hexadecanoic acid (5.5 ± 0.47%), and β-sitosterol (4.2 ± 0.45%).

The PERMANOVA, based on the resemblance matrix comparing the three morphs, showed borderline significant differences in the chemical profile of the three color morphs (pseudo F(2,38) = 1.587, p = 0.067). Pairwise PERMANOVA tests indicated statistically significant differences in the chemical composition of the glandular secretions, specifically, between orange and white morphs (t = 1.590, p = 0.021). There were no significant differences between yellow and white morphs (t = 1.125, p = 0.243) and orange and yellow morphs (t = 0.991, p = 0.435). The CAP analysis classified 51.28% of the chemical profiles into the correct population using leave-one-out cross-validation (δ = 0.97, p = 0.389, m = 34 axes Fig. 4A).

Figure 4: Chemical analyses of pore exudate.

The first four principal components jointly explained 64.0% of the variation, with the first axis (29.0%) being strongly affected by α-tocopherol (loading = 0.70), eicosyl 9-octadecenoate (0.27), the 1,2-ethanediyl ester of hexadecanoic acid (−0.25), octadecanoic acid (0.25), and tetradecyl 9-octadecenoate (−0.24). We used the scores of the first four principal components (PCs) to test for among-morph differences using four separate univariate analyses of variance (ANOVAs). These tests indicated that PC1 varied significantly among color morphs (F(2,36) = 4.273, p = 0.0216 Fig. 4B). A post hoc LSD multi-comparison (with Bonferroni correction) showed a significant difference between white and orange color morphs (Table 5), with orange males having higher proportions of α-tocopherol, eicosyl 9-octadecenoate, and octadecanoic acid, but lower proportions of 1,2-ethanediyl ester of hexadecanoic acid and tetradecyl 9-octadecenoate. There were no significant among-morph differences in PC2, PC3, and PC4 (all F ≤ 0.669 p ≥ 0.518). Lastly, variation in the chemical composition of the glandular secretion of P. erhardii could not be explained by variation in body size as none of the PCs showed a significant link with SVL (all F ≤ 1.382, p ≥ 0.175).


Resumo

The human capacity to acquire complex language seems to be without parallel in the natural world. The origins of this remarkable trait have long resisted adequate explanation, but advances in fields that range from molecular genetics to cognitive neuroscience offer new promise. Here we synthesize recent developments in linguistics, psychology and neuroimaging with progress in comparative genomics, gene-expression profiling and studies of developmental disorders. We argue that language should be viewed not as a wholesale innovation, but as a complex reconfiguration of ancestral systems that have been adapted in evolutionarily novel ways.


METHODS

Simulations

I generated a set of 100 pure birth trees using the Phytools package ( Revell 2012) package in R ( R Core Team 2016), each containing ten taxa. All trees were ultrametric and generated with a total length of 1.0 units for consistency in parameter scaling for trait simulations ( Fig. 1). These trees were used to simulate continuous characters evolving along an unbounded BM process, again using Phytools. This is a Markovian process in continuous time where the variance of the process can increase infinitely through time. This differs from the BM |$sigma^2$| parameter, which gives the variance in the amount of character displacement at each draw, effectively describing the magnitude of the random BM walk or a rate of character displacement. To assess performance across several biological scenarios, traits were simulated at |$sigma^2$| parameterizations of 0.05, 0.5, 1.0, 1.5, and 3. Since the process under which traits were simulated is unbounded, phylogenetic signal is expected to remain consistent across rates ( Revell et al. 2008), but different rates were chosen to illustrate this consistency and to provide even comparison to discrete trait simulations. Discrete characters were simulated in the Phytools package ( Revell 2012) under an Mk model with homogeneous transition probabilities. Traits were generated at transition rates 0.05, 0.5, 1.0, 1.5, and 3. All character matrices were generated without rate heterogeneity, and include invariable sites (i.e., no acquisition bias).

a) Exemplar true simulated tree. b) Tree inferred from 20 discrete characters simulated under Mk from true tree. c) Tree inferred from 20 continuous characters simulated under Brownian motion. Dots denote incorrect bipartitions.


Assista o vídeo: Taxonomia e Filogenética A MELHOR FORMA DE ENTENDER ESSE ASSUNTO (Agosto 2022).