Aulas do Curso de Modelagem matemática IV da FGV-EMAp
License: GPL3
Image: default
Espaços de Sequências
Genomas são sequèncias de 4 nucleotídeos, denotados pelas letras A (adenina), C (citosina), T (timina) e G (guanina). Toda a informação codificada nesta sequência (genótipo) é transmitida de geração para geração, quase que perfeitamente. Durante a reprodução, dos organismos, processos geradores de variabilidade tais como mutação e recombinação podem introduzir "erros" no processo de cópia do genoma. Genomas de Comprimento L permitem sequencias diferentes. Modelos computacionais de evolução de sequências frequentemente simplificam esta representação para sequências binárias cuja manipulação é mais natural em computadores.
A figura abaixo mostra um exemplo de um espaço de sequências binárias, particularmente para uma sequencia de comprimento 3, . Para sequências deste tamanho, o espaço consiste em reticulado dem 3 dimensões no qual cada vértice representa uma sequência possível. Cada dimensão no espaço de sequências assim definido, contém tantos pontos quantos valores possíveis para cada locus da sequencia. Logo, para sequências de DNA, são 4 pontos e para sequências binárias, 2. Para representar o genoma humano precisaríamos de cerca de 3 bilhões de dimensões.
A distância entre duas sequências no espaço de sequências como o ilustrado acima é o caminho mais curto, passando pelas arestas do reticulado (e não pelas diagonais). Assim, temos que a distância entre e é e não (pela distância Euclidiana) . Esta distância é chamada de distância de Hamming, ou distância de Manhattan.
A Equação da Quasi-Espécie
Com o conceito de sequência como uma série de elementos que podem sofrer mutação ou outros tipos de error de replicação durante a reprodução, Podemos introduzir o conceito de quasi-espécie que é o conjunto de variantes de sequências em uma população que podem pretencer a uma mesma espécie biológica. Se atribuirmos um fitness ao genoma i de uma população infinita de de indivíduos de genoma com comprimento L, podemos escrever a equação da quasi-espécie:
Onde é a matrix de mutação, como vimos anteriormente. Caso não haja erros na reprodução, a matriz de mutação é a matriz identidade e a equação da Quasi-espécie se reduz à equação da seleção, vista anteriormente. Caso existam erros, e algum seja maior do que os demais, o equilíbrio não maximiza o fitness médio da população.
Na equação acima, é comum combinar o vetor com a matrix , para obter a matrix de mutação-seleção, :
Assim em notação vetorial,
cujo equilíbrio é dado por:
Exercício 1:
Mostre por meio de simulação que o fitness médio da população é menor que o fitness da sequência com maior , quando a matrix é diferente da identidade.
Calculando a matriz de mutação para mutações pontuais
Considere o conjunto de todas as sequências de tamanho L. A distância de Hamming conta o número de posições diferentes entre duas sequências e . Por exemplo, a distância de Hamming entre a sequência 1010 e a sequência 1100 é 2. seja a probabilidade de que uma mutação ocorra em uma posição da sequência. Logo, é a probabilidade da sequência ser copiada corretamente. Nós podemos escrever a probabilidade da replicação da sequência gerar a sequência como
ou seja, uma mutação precisa ocorrer em tantas posições quantos sejam as posições diferentes entre e , que é precisamente o que nos dá a distância de Hamming. E nenhuma mutação deve ocorrer nas posições remanescentes. Este cálculo assume independencia entre as mutações nas várias posições e não considera outros tipos de mutações como inserções e deleções.
Teoria de Jogos Evolutivos
A teoria dos jogos, inventada por John von Neumann, versa estratégias racionais para maximizar os retornos em um jogo cujas regras são conhecidas. Jonh Maynard Smith e George Price em um artigo publicado na revista Nature em 1973, combinaram a teoria dos jogos com conceitos de evolução gerando o conceito de jogos evolutivos.
Na teoria dos jogos evolutivos uma população infinitamente grande de jogadores, com estratégias fixas competem em rodadas do jogo. Neste contexto, o retorno esperado do cada encontro conforme explicitado na matrix de retornos (Payoff Matrix) é interpretada como o fitness da estratégia. Estratégia com maior retorno vêem sua frequência crescer, enquanto que as demais podem ser excluídas competitivamente.
A Equação do Replicador
A equação do Replicador é uma extensão da equação da Quasi-espécie, pois ela permite que o fitness de cada tipo seja definida em função da estrutura da população ao invés de ser constante para cada tipo. Na sua forma mais simples, sem mutação, pode escrita da seguinte forma:
A função de fitness é definida, matricialmente, como que é o payoff esperado de , se assumirmos que o fitness depende linearmente da distribuição de frequências dos tipos. é a chamada matriz de payoff e contém toda a informação do fitness dos tipos. O Fitness médio da população pode ser escrito como .
Duas estratégias e
seja a frequência de e a frequência de . O vetor define a composição da população. Seja o fitness de e o fitness de . Então a dinâmica de seleção pode ser escrita como
O fitness médio fica sendo .
como sempre, podemos introduzir a variável , tal que e . As funções de fitness passam a ser apenas e . e o fitness médio fica sendo
então podemos escrever o modelo de seleção como
Payoff matrix:
- | A | B |
---|---|---|
A | ||
B |
Agora, como o fitness de cada tipo depende da estrutura da população, definimos o fitness de cada tipo em função das interações possíveis. Logo a matriz de payoff acima pode ser interpretada como:
se encontra com , ambos tem payoff , se se encontra com ambos tem payoff , se se encontra com , tem payoff e tem payoff . A Matriz de Payoff tem sua origem na teoria de jogos, na qual seus valores correspondem aos ganhos de dois jogadores. Na teoria dos jogos evolutivos, os ganhos são interpretados como fitness. Neste caso
se nós plugarmos estas funções lineares de fitness no modelo de seleção, temos
Calculando o fitness médio de ambas as estratégias:
Há cinco possibilidades para a dinâmica da seleção entre dois tipos: A domina B, B domina A, A e B são Bi-estáveis, A e B coexistem em um equilíbrio estável, e A e B são variantes Neutras um do outro. Esta dinâmica é denominada seleção dependente da frequência.
Exercício 2:
Construa o Gráfico das outras 3 situações.
O Equilíbrio de Nash
Nó já vimos que os tipos dos modelos de seleção podem ser interpretados como as estratégias de um jogo. O equilíbrio de Nash, é um equilíbrio no qual nenhum dos jogadores pode desviar de sua estratégia e obter um melhor payoff.
no caso da matriz de payoff para duas estratégias, A e B, as seguintes condições levam a um equilíbrio de Nash:
A é um equilíbrio e Nash estrito se
A é um equilíbrio de Nash se
B é um equilíbrio de Nash estrito, se
B é um equilíbrio de Nash se Consideremos o seguinte exemplo de jogo:
Se ambos os jogadores escolherem a estratégia A: a1,1, então um dos jogadores pode melhorar o seu retorno trocando para a estratégia B. Se ambos jogarem B nenhum jogador consegue melhores condições mudando de estratégia. Logo a estratégia B é um equilíbrio de Nash. Note que apesar de B dominar A, o Payoff de jogar no equilíbrio de Nash é menor do que jogar a estratégia dominada A. Este é um exemplo do famoso dilema do prisioneiro.
Considere este outro jogo:
Neste caso ambas estratégias são esquilíbrios de Nash.
Estratégia Evolutivamente Estável (ESS)
Este conceito foi introduzido pelo biólogo John Maynard Smith sem que ele tivesse conhecimento dos conceito de equilíbrio de Nash na teoria de jogos.
Imagine uma grande população de jogadores do tipo A. Uma quantidade infinitesimal de um mutante tipo B, é introduzida na população. Se temos a matriz de payoff abaixo, e as frequências de B e A são, respectivamente, e , que condições seletivas impedem a invasão de B em A?
Para que B não invada, o fitness de A tem que ser maior que o fitness de B, logo:
Cancelando os termos com , chegamos à seguinte conclusão:
Contudo, se , então temos que
Em suma, A é uma ESS se:
e
Esta conclusão no entanto só vale para populações infinitamente grandes e quantidade infinitesimalmente pequenas da estratégia invasora.
Mais de duas estratégias
Seja o payoff da estratégia S_i versus a estratégia S_j denotado por
A estratégia é um equilíbrio de Nash estrito se:
A estratégia é um equilíbrio de Nash se:
A estratégia é ESS se temos uma das duas situações abaixo: ou Note que a ESS garante que a seleção se oporá a qualquer invasor potencial. O mesmo é verdadeiro para um equilíbrio de Nash estrito, mas não para um esquilíbrio de Nash. Se e E(S_k,S_j)<E(S_j,S_j) então é um equilíbrio de Nash mas a seleção favorecerá a invasão de por . Portanto, faz sentido adicionar uma quarta definição:
A estratégia é ESS contra invasões por meio de seleção (ESS fraco) se temos uma das duas situações ou Logo,
Nash estrito ESS ESS fraco Nash.
Três estratégias: Pedra Papel e Tesoura
Este é um jogo interessante no simplex no qual temos três estratégias (pedra), (papel) e (tesoura). A pedra domina a tesoura que domina o papel, que por sua vez domina a pedra. Este jogo apresenta uma estratégia cíclica de dominação, que pode ser descrita por uma matriz como a apresentada abaixo (ordem das linhas: , e ).
Na matriz acima a ordem das linhas e colunas é a da dominância: . Antes de analisarmos este modelo convém observar que a dinâmica da equação replicante não se altera se adicionarmos uma constante a cada coluna da matriz. Desta forma, podemos simplificar a nossa matriz de payoff, subtraindo o elemento da diagonal de cada coluna para obter: uma matriz de payoff com a diagonal 0.
Vamos simular a dinâmica deste jogo:
Replicante Mutante
Se adicionarmos mutação à equação do replicante acima temos a equação do replicante mutante:
Para uma discussão mais aprofundada sobre este modelo, veja este artigo.