Información

¿Podría una mutación en una parte neutra del genoma volverse perjudicial?


Sé que las mutaciones silenciosas son neutrales porque no afectan la función de la proteína / gen, y una mutación sin sentido sí lo haría. Pero digamos que ambos ocurren en una porción neutral, ¿podría uno u otro volverse perjudicial? Recuerdo que mi profesor dijo que una mutación puede volverse perjudicial si se encuentra en una parte neutra. Simplemente no recuerdo qué podría causar esto.

¡Gracias!


Por supuesto. Hay muchas formas en las que esto podría suceder. Un ejemplo trivial:

CTAcodón codifica leucina.

CTA -> TTAla mutación todavía codificará la leucina.

CTA -> CTTla mutación también todavía codifica la leucina.

Según su definición, cada una de estas mutaciones es "silenciosa" o "neutral" de forma independiente.

Sin embargo, si combina ambas mutaciones, conducen a unaTTTcodón, que codifica la fenilalanina, también conocida como mutación sin sentido.

El nombre elegante para este tipo de interacción genética es "epistasis". Hay muchas otras formas en las que este tipo de mutación teóricamente neutra se vuelve no neutral, pero esto lo ilustra simplemente.


El efecto de la selección de fondo contra mutaciones deletéreas en variantes ligadas débilmente seleccionadas

Este artículo analiza los efectos de la selección contra los alelos deletéreos mantenidos por mutación ("selección de fondo") sobre las tasas de evolución y los niveles de diversidad genética en loci débilmente seleccionados y completamente ligados. Se derivan fórmulas generales para las tasas esperadas de sustitución de genes y diversidad genética, en relación con el caso neutral, en función de los coeficientes de selección y dominancia en los loci en cuestión, y de la frecuencia de gametos que están libres de mutaciones deletéreas con respecto a los loci responsables de la selección de fondo. Como en el caso neutral, la mayoría de los efectos de la selección de fondo se pueden predecir considerando el tamaño efectivo de la población a multiplicar por la frecuencia de gametos libres de mutaciones. Los niveles de diversidad genética pueden reducirse drásticamente mediante la selección de fondo, con el resultado de que los valores de los sitios bajo selección se acercan a los de las variantes neutrales sujetas al mismo régimen de selección de fondo. Las tasas de fijación de mutaciones levemente perjudiciales aumentan mediante la selección de fondo y las tasas de fijación de mutaciones ventajosas se reducen. Se consideran las propiedades de las poblaciones asexuales y autofecundantes ligadas al sexo y autosómicas. Se discuten las implicaciones de estos resultados para la interpretación de estudios de evolución y variación molecular.


Abstracto

Se han utilizado enfoques genómicos comparativos para identificar sitios donde las mutaciones están bajo selección purificadora y de consecuencia funcional mediante la búsqueda de secuencias que se conservan en especies relacionadas lejanamente. Sin embargo, el rendimiento de estos enfoques no se ha evaluado rigurosamente en modelos genéticos de poblaciones. Además, es posible que los elementos funcionales de corta duración no dejen una huella de conservación de secuencias en muchas especies. Usamos simulaciones para estudiar cómo una medida de conservación, la puntuación del perfil de la tasa de evolución genómica (GERP), se relaciona con la fuerza de la selección (nortemis). Mostramos que la puntuación GERP está relacionada con la fuerza de la selección purificadora. Sin embargo, los cambios en los coeficientes de selección o elementos funcionales a lo largo del tiempo (es decir, la rotación funcional) pueden afectar fuertemente la distribución de GERP, lo que lleva a relaciones inesperadas entre GERP y nortemis. Además, mostramos que para los elementos funcionales que tienen una alta tasa de rotación, agregar más especies al análisis no necesariamente aumenta el poder estadístico. Finalmente, utilizamos la distribución de las puntuaciones de GERP en todo el genoma humano para comparar modelos con y sin rotación de sitios donde las mutaciones están bajo selección purificadora. Mostramos que las mutaciones en el 4,51% del genoma humano no codificante están bajo selección purificadora y que la mayor parte de esta secuencia probablemente ha experimentado cambios en los coeficientes de selección a lo largo de la evolución de los mamíferos. Nuestro trabajo revela limitaciones en el uso de enfoques genómicos comparativos para identificar mutaciones deletéreas. Los umbrales de puntuación de GERP comúnmente utilizados pasan por alto más de la mitad de los sitios no codificantes en el genoma humano donde las mutaciones están bajo selección purificadora.


Selección de fondo

Los hallazgos empíricos y teóricos anteriores preparan el escenario para examinar las consecuencias de la entrada continua y la eliminación de mutaciones deletéreas para la evolución en las regiones cercanas del genoma. Es útil pensar en este problema en términos de tres divisiones de un continuo, de acuerdo con la efectividad de la selección contra mutaciones deletéreas relativas a la deriva. En un extremo, los sitios están sujetos a una selección purificadora que es tan fuerte que nortemit & gt & gt 1, y sus frecuencias promedio están cerca de sus frecuencias de equilibrio bajo mutación y selección, como se analizó en la sección anterior [el selección de fondo (BGS) régimen]. (Es importante tener en cuenta que nortemi se toma aquí como el valor en ausencia de efectos de interferencia).

Para algo más pequeño nortemit valores, la mayoría de los sitios permanecen cerca de sus equilibrios, por lo que cualquier mutación inversa de mutante a tipo salvaje puede despreciarse; sin embargo, con muy poca o ninguna recombinación puede haber pérdidas estocásticas repetidas de los genotipos con el menor número de mutaciones deletéreas, lo que lleva a una acumulación gradual de mutaciones deletéreas [Trinquete de Muller (SEÑOR)]. Con una selección aún más débil, la eficacia de la selección se reduce tanto por la interferencia entre los sitios seleccionados que las mutaciones deletéreas pueden derivar a frecuencias intermedias [el selección débil Interferencia de Hill-Robertson (WSHRI) régimen]. Esto es, por supuesto, una división algo arbitraria de un continuo de efectos en categorías discretas, con zonas grises en los límites además, dado que probablemente hay una amplia gama de coeficientes de selección y tasas de recombinación en todo el genoma, diferentes sitios en el el genoma de la misma especie puede caer en diferentes categorías.

En el resto de esta sección, analizo la selección de antecedentes. Los otros dos procesos se consideran, de manera bastante más breve, en la siguiente sección.

Un resultado general para el efecto de BGS en el nivel de variabilidad.

La pregunta más simple que se puede hacer sobre este proceso es: ¿Cuál es el efecto de BGS en el tiempo medio de coalescencia? T2, para un par de alelos muestreados de la población, en un sitio neutral dado? Dado que la diversidad media de sitios de nucleótidos por pares (π) para mutaciones neutrales bajo el modelo de sitios infinitos es directamente proporcional a T2 (Hudson 1990), la respuesta a esta pregunta permite hacer predicciones sobre el efecto de BGS sobre la variabilidad de la secuencia de ADN. Bajo los supuestos estándar de la teoría coalescente para una población panmíctica con tamaño constante, T2 = 2nortemi (Hudson 1990 Charlesworth y Charlesworth 2010, p. 217), de modo que T2 se puede utilizar para proporcionar una medida del efecto de BGS sobre el tamaño efectivo de la población o el nivel de variabilidad neutra en una ubicación determinada del genoma.

En una gran población de apareamiento aleatorio, para sitios con nortemitI & gt & gt 1 que se distribuyen a lo largo de un solo cromosoma o región cromosómica, la siguiente fórmula (Hudson y Kaplan 1995 Nordborg et al. 1996a Nordborg 1997) proporciona una buena aproximación para B para un sitio neutral dado, que se define como la relación de T2 bajo BGS a su valor en ausencia de cualquier efecto de interferencia de la selección, (3) donde rI es la frecuencia de recombinación entre el sitio focal neutral en consideración y el IEn el sitio sujeto a selección depuradora, el resto de variables se definen en el apartado anterior.

Una derivación heurística, utilizando la idea de que la variación en la aptitud asociada con la mutación deletérea vinculada reduce nortemi, se da en el Apéndice. Esto muestra que esta expresión subestima el efecto de BGS cuando existe un vínculo débil entre el sitio focal neutral y los sitios bajo selección, en el caso de diploidía pero no de haploidía (Santiago y Caballero 1998). Hudson y Kaplan (1995), Nordborg (1997) y Charlesworth dan derivaciones alternativas que utilizan el proceso de coalescencia con subdivisión de la población según el genotipo, que se acercan en espíritu al enfoque de menor carga para el caso de recombinación cero. y Charlesworth (2010, págs. 401–402).

Con recombinación libre (rI = 0.5), el siguiente resultado se aplica a los diploides: (4) El término es igual a cuatro veces la varianza aditiva en la aptitud bajo el equilibrio de mutación-selección aportado por los sitios en cuestión (Mukai et al. 1972). Los datos sobre la variabilidad genética en la aptitud sugieren que es poco probable que esta variación sea mucho más que un pequeño porcentaje para el genoma en su conjunto (Charlesworth y Hughes 2000), por lo que los sitios no vinculados hacen solo una contribución relativamente pequeña a BGS en una población de apareamiento aleatorio. , como era de esperar intuitivamente. Sin embargo, debe tenerse en cuenta que un sitio típico en un determinado Drosophila o cromosoma de mamífero tiene un nortemi o T2 que probablemente se reduce al 95% aproximadamente del valor estrictamente neutral por mutación y selección que actúan sobre otros cromosomas. Por lo tanto, las comparaciones que se hacen a continuación deben interpretarse en el sentido de que nortemi o T2 valores para un sitio focal a un valor que incluye los efectos de sitios no vinculados, no a la situación ideal sin ningún efecto BGS.

Especies altamente endogámicas, como Caenorhabditis elegans y Arabidopsis thaliana (actualmente objeto de intensos estudios genéticos de poblaciones), necesitan un tratamiento diferente para la ligadura suelta. En una población con coeficiente de consanguinidad F, la tasa de recombinación efectiva de la población se reduce de r para r(1 – F) (Dye y Williams 1997 Nordborg 1997). Cuando F está cerca de uno, incluso los sitios no vinculados se comportan como si estuvieran estrechamente vinculados, y se deben considerar los efectos combinados de la selección en los sitios de todo el genoma (Nordborg et al. 1996b), de manera similar al caso de baja recombinación en poblaciones de apareamiento aleatorio que se analiza a continuación.

Efectos generales de BGS sobre los niveles de variabilidad

La ecuación 3 se puede utilizar para proporcionar una imagen general del efecto de BGS sobre la variabilidad de un cromosoma o parte de un cromosoma (Nordborg et al. 1996a). El enfoque más simple es asumir que los sitios sujetos a mutación y selección se distribuyen uniformemente a lo largo de un cromosoma, con el mismo coeficiente de selección efectivo. t en cada sitio y una tasa de mutación diploide U para el cromosoma. La longitud del mapa del cromosoma es METRO, y se supone que los cruces dobles son insignificantes en frecuencia, de modo que la recombinación está relacionada linealmente con la distancia del mapa, con una frecuencia constante de recombinación entre sitios adyacentes a lo largo del cromosoma. Una proporcion X del cromosoma se supone que está ubicado a la izquierda del sitio focal y 1 - X A la derecha. La suma de sitios se puede aproximar por integración, dando la siguiente expresión: (5a) (Nordborg et al. 1996a). Para t & lt & lt METRO y cuando el sitio focal no está demasiado cerca del final del cromosoma (ver Nordborg et al. 1996a), tenemos X(1 – X)METRO & gt & gt t, y esta expresión se reduce a (5b) es decir., el efecto de BGS depende sólo de la densidad de mutaciones deletéreas por unidad de longitud del mapa, como lo señalaron por primera vez Hudson y Kaplan (1994) y Barton (1995). (La falta de dependencia de t significa que este resultado también se cumple con una distribución arbitraria de t valores.)

Para un sitio en cualquier extremo del cromosoma, tal que X o (1 - X) = 0, una aproximación similar produce (5c) El efecto de la selección de fondo en este caso es, por tanto, menor que para un sitio focal en la mayor parte del resto del cromosoma, por un factor de exp (-U/2METRO) es decir., B es la raíz cuadrada del valor anterior (Nordborg et al. 1996a).

La BGS en una región de recombinación es, por tanto, más eficaz en el medio de un cromosoma o región cromosómica y menos eficaz en cualquiera de sus extremos, como cabría esperar intuitivamente del hecho de que la densidad de los sitios bajo selección que están cerca del sitio focal es mayor en el centro de la región. Por tanto, las ecuaciones 5b y 5c pueden usarse para predecir hasta qué punto BGS es eficaz para reducir el nivel general de variabilidad neutra o casi neutra en una región genómica definida. Por ejemplo, la longitud del mapa en las mujeres es ∼0.5 M para un brazo de uno de los dos autosomas principales de D. melanogaster (Quemador de cenizas et al. 2005, cap. 10). Dado que no hay cruzamiento en los machos y que un gen autosómico pasa la mitad de su tiempo en cada sexo, la longitud del mapa de población efectiva (METROmi) que se utilizará en las ecuaciones es 0,25, ya que las tasas de recombinación en machos y hembras deben recibir un peso de la mitad en este caso (Charlesworth y Charlesworth 2010, p. 381). Usando una estimación ligeramente conservadora de 1.0 para la tasa de mutación deletérea para D. melanogaster y el hecho de que un brazo cromosómico es en promedio ~ 20% del genoma, el U = 0,20. La ecuación 5b entonces da B = 0,45, una gran reducción por debajo de 1. Incluso con U = 0.5, B = 0.67.

Por el contrario, los seres humanos tienen 23 cromosomas, con una longitud media de mapa por autosoma promediada por sexo de ∼1,57 M (Jensen-Seaman et al. 2004) U para todo el genoma se estima en ∼2.1 (ver arriba), dando un valor de 1.99 para los autosomas, a partir de su contribución a la secuencia del genoma ensamblado en relación con todo el genoma (Jensen-Seaman et al. 2004). Esto produce una estimación de B ≈ 0.94 para un sitio ubicado en el centro de un autosoma típico, un efecto bastante trivial [pero tenga en cuenta que la considerable variación en los tamaños físicos y longitudes de mapas entre los cromosomas (Jensen-Seaman et al. 2004) se ha ignorado aquí]. Esto se corresponde bien con la estimación de que los efectos del autostop han reducido la diversidad neutra promedio en un cromosoma humano en un ∼6%, sobre la base de la relación entre la variabilidad y la proximidad a secuencias funcionalmente importantes (Cai et al. 2009).

X Los cromosomas tienen una exposición a la recombinación diferente a la de los autosomas, ya que pasan dos tercios de su tiempo en las hembras y un tercio en los machos, donde no se recombinan con la mayoría de los Y (lo contrario es cierto para Z cromosomas en especies con heterogamety femenino). En mamíferos y otros grupos con cruzamiento de los autosomas en ambos sexos, esto implica un efecto general más fuerte de BGS en el X cromosoma. Valores de tamaño físico y longitudes de mapas (Jensen-Seaman et al. 2004) permiten la estimación de los U y longitud de mapa de población efectiva para el X, cediendo B ≈ 0,91 para los seres humanos, ∼97% del valor autosómico.

Sin embargo, esto no predice directamente la razón de tiempos de coalescencia por pares o diversidades neutrales para X vs. autosomas, ya que estos también dependen del tamaño efectivo de la población en ausencia de BGS. Si la proporción de sexos es 1: 1 y las variaciones en el número de descendientes son similares para machos y hembras (p.ej., cuando hay poca competencia entre los machos por parejas), el valor neutral de nortemi Para el X es tres cuartas partes de la de los autosomas (Wright 1931 Charlesworth y Charlesworth 2010, p. 224), de modo que la proporción predicha de T2 Los valores para una población humana en equilibrio es (3 × 0,97) / 4 = 0,73. Además, la diferencia entre las tasas de mutación de machos y hembras en mamíferos (Crow 2000) significa que estimaciones de diversidad supuestamente neutrales para X y los autosomas deben dividirse por las estimaciones respectivas de divergencia neutra de una especie exógena para que se pruebe esta predicción.

En general X a autosoma, proporciones de diversidad dentro de la población de 0,73 y 0,61 (después de tales ajustes de divergencia) se obtuvieron a partir de datos de resecuenciación del genoma completo de África y Europa por Gottipatti et al. (2011) valores de & gt0,75 y 0,71 para africanos y europeos fueron obtenidos por Hammer et al. (2010) a partir de conjuntos de datos más pequeños. Las proporciones son significativamente más altas para los sitios cercanos a los genes que para los sitios remotos de los genes, lo que sugiere fuertemente la acción de los efectos de autostop causados ​​por la selección en las secuencias codificadoras o reguladoras, como también se encontró en otro estudio de cuatro poblaciones humanas (Hernández et al. 2011). En africanos, pero no europeos, el X relación de diversidad autosoma es & gt0.85 lejos de los genes (Gottipatti et al. 2011). Estas diferencias entre las poblaciones pueden reflejar una demografía de desequilibrio en las poblaciones europeas y el efecto de una variación excesiva en el éxito del apareamiento de los machos debido a la competencia sexual, lo que infla la X a la relación de diversidad autosómica (Charlesworth y Charlesworth 2010, p. 224).

En Drosophila, la falta de cruzamiento en los machos significa que la X tiene veces la tasa de recombinación autosómica efectiva de la población, para pares de sitios con frecuencias comparables de recombinación en hembras en el X y los autosomas. En D. melanogaster, también tiene un mapa un poco más largo que un brazo autosómico (0,6 M) (Ashburner et al. 2005, cap. 10). Ecuación 5b con U = 0,20 luego cede B ≈ 0,61 para el X cromosoma. los X/ relación autosoma de B Por lo tanto, los valores son 1,36, en marcado contraste con los valores de los mamíferos, y la razón predicha de los valores de diversidad para una población en equilibrio es (3 × 1,36) / 4 = 1,02, en ausencia de efectos de competencia sexual. Hay poca evidencia de diferencias en la tasa de mutación entre X y autosomas en Drosophila (Bauer y Aquadro 1997 Keightley et al. 2009 Zeng y Charlesworth 2010b), por lo que esto implica que debería haber niveles similares o incluso ligeramente superiores de diversidad de sitios silenciosos para el X cromosoma que los autosomas, como de hecho se observa para las poblaciones presuntamente ancestrales de África Oriental de D. melanogaster (Andolfatto 2001 Hutter et al. 2007 Singh et al. 2007). Por el contrario, un cálculo similar para D. pseudoobscura, que tiene longitudes de mapa que son más del doble de las de D. melanogaster (Kulathinal et al. 2008 Stevison y Noor 2010), arroja un pronóstico X a la relación de diversidad autosómica de 0,83. Esto está cerca de los valores obtenidos de las estimaciones de la variabilidad del sitio silencioso en X-loci autosómicos y ligados en D. pseudoobscura y su pariente D. miranda (Haddrill et al. 2010).

Estos cálculos muestran que incluso las especies del mismo grupo taxonómico pueden diferir bastante en el efecto global previsto de BGS en un cromosoma y en los valores relativos de su efecto sobre el X vs. los autosomas. Patrones opuestos de X se esperan relaciones de diversidad a autosoma para los mamíferos y Drosophila. Sin embargo, la suposición de una densidad uniforme de sitios sujetos a selección a lo largo de un cromosoma es obviamente poco realista, ya que estos siempre están agrupados en secuencias codificantes y grupos de secuencias funcionales no codificantes, separados por bloques de secuencia (intrónicos e intergénicos), muchos de los cuales son es probable que se encuentre bajo una selección débil o nula, especialmente en organismos como los mamíferos, donde aparentemente solo una pequeña fracción del genoma está sujeta a una selección purificadora (Keightley 2012). Modelos más realistas de un brazo cromosómico de Drosophila, con secuencias no codificantes y codificantes alternadas débilmente seleccionadas y fuertemente seleccionadas, se han examinado recientemente (B. Charlesworth, resultados no publicados). Estos muestran que la relación de X La diversidad de cromosomas a autosómicos parece ser bastante insensible a la presencia de secuencias intergénicas débilmente seleccionadas.

Tasa de recombinación y BGS

Ahora consideramos la cuestión de cómo afecta la variación en las tasas de recombinación a través del genoma B para regiones locales del genoma. La situación más extrema es una región del genoma sin recombinación en absoluto (o al menos sin cruzamiento), como es el caso de Y y W cromosomas en muchas especies y el cromosoma "punto" de Drosophila. En completa ausencia de recombinación, y asumiendo que el tI sigue una distribución con media armónica th, Las ecuaciones 1b y 3 juntas producen la expresión (6) donde B es el primer término PAG0 de una distribución de Poisson cuya media es igual al número medio de mutaciones por genoma haploide, U /(2th) es decir., es la frecuencia en la población de haplotipos que carecen de mutaciones nocivas. (Esta expresión fue originalmente derivada por Charlesworth et al. 1993, utilizando el argumento esbozado en la Introducción).

Este resultado sugiere que, para predecir la reducción en la variabilidad del sitio de nucleótidos causada por BGS en una región no recombinante del genoma, necesitamos conocer la tasa de mutación deletérea U para esta región y el coeficiente de selección medio armónico para mutaciones deletéreas, th (ver Las propiedades de las mutaciones perjudiciales). El cromosoma de punto pequeño de Drosophila es material clásico para hacer esta pregunta, ya que representa una región aislada del genoma con una falta casi total de cruzamiento en todas las especies que se han estudiado (Ashburner et al. 2005). Con un contenido génico de ~ 80 genes, representa ~ 0,57% de la secuencia codificante del genoma. Utilizando una estimación conservadora de la tasa de mutación deletérea de 0,5 por genoma diploide y un th de 10-3 (sustancialmente más alto que la estimación mencionada anteriormente), PAG0 = exp (–0,25 × 0,057 × 10 3) = exp (–14,2) = 6,8 × 10 −7.

Esto implica que no se debe encontrar ninguna variabilidad en el cromosoma de puntos en un estudio de variabilidad de secuencia de tamaño razonable, incluso teniendo en cuenta la considerable variación estocástica de la diversidad alrededor de su valor esperado que es causada por los caprichos del proceso coalescente (Hudson 1990). De hecho, generalmente se encuentra que el punto tiene ~ 10% de la variabilidad de una región típica del genoma (Betancourt et al. 2009 Argüello et al. 2010). La ecuación 6 así salvajemente predice demasiado el efecto de BGS para el punto como se muestra a continuación, esto se debe a que el estrecho vínculo entre los sitios bajo selección socava la suposición de que todos estos se mantienen cerca de sus equilibrios bajo selección.

Sin embargo, cuando hay una cantidad moderada de recombinación, las simulaciones muestran que la Ecuación 3 debería funcionar bien como una descripción del efecto de BGS para un solo cromosoma, para sitios en los que tInortemi & gt ∼3 (Nordborg et al. 1996a Barton y Etheridge 2004). Por lo tanto, la ecuación 3, o la ecuación relacionada de Hudson y Kaplan (1995), se ha utilizado en varios intentos para probar si BGS puede explicar las relaciones observadas entre la diversidad del sitio de nucleótidos y la ubicación cromosómica de una secuencia o la tasa local de recombinación genética que experimenta.

El primero de estos intentos utilizó con éxito los datos disponibles en ese momento sobre la variación de la secuencia de ADN en D. melanogaster, combinado con estimaciones de las tasas de recombinación local de la Drosophila literatura genética, y tasas de mutación por genoma y coeficientes de selección contra mutaciones deletéreas obtenidas de los experimentos de Mukai (Hudson y Kaplan 1995 Charlesworth 1996) se llevó a cabo un estudio paralelo para el segundo cromosoma de D. pseudoobscura (Hamblin y Aquadro 1999). sin embargo, el D. melanogaster El material disponible en ese momento provenía en gran parte de muestras europeas y norteamericanas, que se sabe que tienen una variabilidad pobre en comparación con las poblaciones ancestrales de África Oriental, probablemente como resultado de cuellos de botella poblacionales asociados con el movimiento a nuevos continentes (Begun y Aquadro 1993 Andolfatto 2001 Haddrill et al. 2005b Hutter et al. 2007). Queda por ver si el uso de las estimaciones más recientes de los parámetros de selección y mutación discutidos anteriormente, junto con los datos de todo el genoma de las poblaciones de África Oriental, produce ajustes igualmente buenos y en qué medida los barridos selectivos también contribuyen a estos patrones.

También se han hecho intentos para investigar el ajuste a los modelos BGS de datos sobre el nivel de diversidad genética humana en el genoma humano (Payseur y Nachman 2002 Reed et al. 2005 Hellmann et al. 2008 Cai et al. 2009 McVicker et al. 2009 Lohmuller et al. 2011). Como se mencionó anteriormente, estos estudios y los de Hammer et al. (2010), Hernández et al. (2011) y Gottipatti et al. (2011), proporcionan evidencia de que la diversidad en sitios supuestamente neutrales o casi neutrales se reduce cuando estos están cerca de secuencias codificantes y no codificantes restringidas selectivamente y que la diversidad se correlaciona significativamente con las tasas de recombinación local. Si bien los modelos BGS generalmente brindan un buen ajuste a los datos, no está claro hasta qué punto brindan una explicación única o si los efectos de los barridos selectivos también contribuyen (Hellmann et al. 2008 Cai et al. 2009 Lohmuller et al. 2011).

Se han hecho algunos intentos para distinguir entre las dos explicaciones utilizando un método propuesto por Innan y Stephan (2003), que se basa en diferencias entre las curvas esperadas que relacionan diversidad y recombinación bajo barridos. vs. BGS cuando las tasas de recombinación son moderadamente bajas, p.ej., Hellmann et al. (2008). Sin embargo, estos deben considerarse con precaución como una forma de rechazar BGS, porque este enfoque utiliza la Ecuación 5b. Esta ecuación es inexacta cuando la tasa de recombinación entre el sitio focal y los sitios seleccionados es de magnitud similar o menor que el coeficiente de selección, como es probable que sea el caso con tasas de recombinación bajas, y también supone que los sitios seleccionados son distribuidos uniformemente por la región en cuestión. Un análisis reciente de datos de resecuenciación del genoma humano completo ha proporcionado poca evidencia de barridos selectivos recientes (Hernandez et al. 2011), lo que sugiere que BGS puede ser el factor principal en humanos.

Aparte de Drosophila y humanos, ha habido pocos estudios de genoma completo sobre la relación entre la tasa de recombinación y las tasas de recombinación local y las densidades de genes. En las especies de nematodos altamente autofecundantes C. briggsae, existe una relación significativa entre la diversidad de sitios de nucleótidos silenciosos y la tasa de recombinación, que se ajusta mal a la expectativa bajo modelos analíticos y de simulación de los efectos de los barridos selectivos recurrentes (Cutter y Choi 2010). Rockman et al. (2010) mostró que los patrones de variación cuantitativa en los niveles de expresión génica en C. elegans en relación con la tasa de recombinación se ajusta bien a un modelo BGS, aunque no se puede descartar una contribución de los barridos. Roselius et al. (2005) encontraron una relación significativa entre los niveles de diversidad y la tasa de recombinación en especies de tomates silvestres. Nordborg et al. (2005) y Kawabe et al. (2008) encontraron una asociación negativa entre la densidad de genes y los niveles de diversidad en A. thaliana y A. lyrata, respectivamente, al igual que Flowers et al. (2012) en arroz dada la correlación positiva entre la tasa de recombinación y la densidad genética, esto tiende a oscurecer cualquier efecto de la tasa de recombinación. También se han informado correlaciones positivas entre la tasa de recombinación y la diversidad supuestamente neutra en levadura en ciernes (Cutter y Moses 2011) y pollos (Rao et al. 2011).

Efectos de BGS sobre las formas de las genealogías de genes

La reducción en el tiempo de coalescencia por pares causada por BGS, como se describe en la Ecuación 3, puede considerarse heurísticamente como equivalente a una reducción en nortemi. Sin embargo, esto es solo una parte de la imagen. Se reconoció desde el comienzo de los estudios teóricos de BGS que también distorsiona la forma de las genealogías de genes, provocando un exceso de ramas terminales en relación con la expectativa neutral de equilibrio y un exceso correspondiente de variantes raras, especialmente cuando la selección es débil (Charlesworth et al. 1993, 1995). El número de sitios neutrales en una muestra que se segregan por variantes polimórficas (S), por lo tanto, no se reduce por BGS en la misma medida que la diversidad por pares, π, lo que da como resultado valores esperados negativos de estadísticas de prueba como Tajima DT (Charlesworth et al. 1993, 1995 Tachida 2000 Gordo et al. 2002 Williamson y Orive 2002 O’Fallon et al. Seger 2010 et al. 2010). Una forma de ver este efecto es observar que, a menos que nortemit & gt & gt 1, el tiempo hasta la pérdida de una mutación deletérea no es muy diferente del tiempo hasta la pérdida de una variante neutra que está destinada a perderse (Kimura y Ohta 1969). Las mutaciones de baja frecuencia que probablemente se pierdan contribuyen más a S que a π, de modo que S se ve menos afectado que π por la eliminación de variantes deletéreas en los sitios enlazados, a menos que nortemit es muy grande.

Aparte de la expresión heurística del valor esperado de S derivado de Santiago y Caballero (1998), la magnitud de este efecto se ha estudiado principalmente mediante cálculos coalescentes estructurados o simulaciones que asumen un coeficiente de selección fijo y sin recombinación. Esto limita su aplicabilidad a los datos sobre la variabilidad natural, pero los resultados proporcionan una guía general de lo que podría estar sucediendo. Pueden ocurrir distorsiones de la genealogía en un genoma no recombinante, de modo que el valor medio de Tajima DT estadística ≈ –0,6, incluso con nortemit tan grande como 30, cuando U/t es tal que B ≈ 0.2 (Gordo et al. 2002). Valores mayores de U/t o valores menores de nortemi conducir a la violación de los supuestos del modelo BGS (ver más abajo) y a distorsiones mucho mayores de la genealogía y los espectros de frecuencia variante (ver más abajo).

La recombinación debería disminuir en gran medida estas distorsiones de la genealogía, pero su efecto ha sido poco estudiado, excepto por Santiago y Caballero (1998). Recientemente se ha desarrollado un procedimiento coalescente estructurado para modelar BGS que incorpora recombinación, que muestra que se produce cierto grado de distorsión incluso con la recombinación (Zeng y Charlesworth 2011). Este enfoque debería permitir pruebas de significación para la concordancia entre los datos y las predicciones de los modelos BGS. para ser desarrollado. Para los parámetros que corresponden razonablemente bien a los de un solo gen de D. melanogaster en una región de recombinación normal, B ∼ 0.90 y 0.85 para sitios en un extremo o en el medio de un gen, respectivamente, la relación entre la longitud esperada de la genealogía del gen representada por las ramas terminales y el tamaño del resto de la genealogía aumenta a ∼1.02 al final del gen y 1.05 en el medio (Zeng y Charlesworth 2011) y, por supuesto, se aleja de los genes. Si bien estos efectos son pequeños, deberían ser detectables en pantallas de variabilidad de resecuenciación de todo el genoma.

El primer intento de probar el papel de BGS en la producción de distorsiones de genealogías neutrales fue realizado por Charlesworth. et al. (1995), utilizando un método bastante limitado D. melanogaster conjunto de datos. Más grande que el promedio negativo DT Posteriormente se han encontrado valores en regiones de baja recombinación en poblaciones africanas (Andolfatto y Przeworski 2001 Sella et al. 2009). Junco et al. (2005) y Stajich y Hahn (2005) encontraron un patrón similar en humanos, al igual que Cutter y Choi (2010) en C. briggsae. Dado que los barridos selectivos también pueden generar este tipo de efecto (Braverman et al. 1995), su interpretación sigue siendo ambigua, aunque Lohmuller et al. (2011) concluyó que la mayor parte del exceso de variantes silenciosas raras en las poblaciones humanas observadas cerca de los genes probablemente sea causado por BGS. Además, un papel causal de los barridos selectivos en la variabilidad reducida en el cromosoma punto de D. americana parece descartado (Betancourt et al. 2009).

Efectos de BGS en la selección en sitios vinculados

La cuestión del efecto de BGS sobre el resultado de la selección en un sitio focal se ha estudiado principalmente determinando la probabilidad de fijación final en la población de una mutación perjudicial o ventajosa en el sitio en cuestión, en relación con su valor en ausencia de BGS. Dado que estas probabilidades de fijación se utilizan ampliamente para interpretar las tasas de evolución molecular (Kimura 1983) y características del genoma como el contenido de GC y el sesgo de uso de codones (Bulmer 1991 Sharp et al. 2010), el conocimiento de los efectos de BGS sobre las probabilidades de fijación es importante para comprender los efectos de los diferentes niveles de recombinación genética sobre la eficacia de la selección. La probabilidad de fijación de una sola copia de una mutación semidominante con coeficiente de selección s cuando es homocigotos es positivo si la mutación es ventajosa y negativo cuando es perjudicial), en relación con el valor de una mutación neutra, viene dado por (7) donde γ = 2nortemis (Fisher 1930a Kimura 1983).

Esta es también la razón de la tasa de sustitución evolutiva de mutaciones con este valor de s, en relación con la tasa neutral, cuando las nuevas mutaciones son la fuente del cambio evolutivo (Kimura 1983). Por tanto, la eficacia de la selección en relación con la deriva genética puede medirse convenientemente mediante γ. Esto sugiere que podríamos predecir el efecto de BGS sobre las probabilidades de fijación de mutaciones a través de su efecto sobre nortemi para variantes neutrales en un sitio focal, simplemente reemplazando γ en la Ecuación 7 por Bγ, donde B está determinada por las ecuaciones descritas anteriormente. Los estudios numéricos y analíticos muestran que una condición suficiente para que esto sea cierto es que el coeficiente de selección en el sitio focal sea menor que los coeficientes de selección en los sitios que causan BGS (Barton 1994, 1995 Charlesworth 1994 Peck 1994 Stephan et al. 1999 Johnson y Barton 2002). Es probable que esto se aplique, por ejemplo, cuando la selección contra mutaciones no sinónimas en secuencias de codificación influye en la selección mucho más débil en el uso de codones en sitios sinónimos en el mismo gen, aunque la imagen aquí se complica por la interferencia entre los sitios sinónimos en sí mismos (ver más abajo). .

Sin embargo, está menos claro qué sucede cuando la selección en el sitio focal es mayor o de fuerza similar a las que causan BGS. Johnson y Barton (2005) examinaron la probabilidad de fijación de una mutación beneficiosa en un genoma no recombinante sujeto a BGS y encontraron un patrón complejo cuando este tiene un coeficiente de selección tan grande como los que causan BGS. Si s para una mutación beneficiosa es & gtU, pero t para las mutaciones deletéreas es & ltU, entonces esencialmente no hay reducción en la probabilidad de fijación como resultado de BGS. Desafortunadamente, actualmente carecemos de estimaciones firmes de la distribución de los coeficientes de selección en mutaciones beneficiosas, aunque algunos trabajos recientes sugieren que una proporción sustancial de mutaciones no sinónimas favorables en Drosophila podría tener valores medios de s tan bajo como 10 −5 (Sella et al. 2009 Sattath et al. 2011 Schneider et al. 2011). Para una región genómica bastante grande, como una nueva evolución Y cromosoma con ≥1000 genes, U probablemente será ≥0.05, y entonces habrá una reducción sustancial en las probabilidades de fijación de mutaciones no codificantes reguladoras o no sinónimas beneficiosas y un aumento en las probabilidades de fijación de mutaciones sinónimas o no codificantes muy débilmente nocivas, incluso para s valores tan altos como 0.01.

La expectativa de una eficiencia relajada de selección en regiones genómicas con bajas frecuencias de recombinación se ha probado en varios Drosophila sistemas, revisado por Charlesworth et al. (2010). Una ausencia virtual de recombinación parece estar asociada con una tasa más alta de sustitución de mutaciones no sinónimas, una proporción más alta de niveles de diversidad no sinónima y silenciosa, una tasa reducida de sustitución de mutaciones no sinónimas adaptativas y una selección reducida para el uso de codones. Estos patrones son consistentes con la acción de BGS y los otros efectos de interferencia de Hill-Robertson discutidos en la siguiente sección (Charlesworth et al. 2010), aunque también puede haber contribuciones de barridos selectivos.

Loewe y Charlesworth (2007) utilizaron la Ecuación 3 para examinar el efecto de BGS debido a la selección purificadora que actúa sobre mutaciones no sinónimas dentro de genes de D. melanogaster, considerado aislado de otros genes. Ellos encontraron que B se reduce en el medio de los genes en comparación con sus extremos y es más bajo para los genes que carecen de intrones en comparación con los genes con intrones [se asumió que estos evolucionaron de manera neutral, pero esto no es necesariamente realista (Haddrill et al. 2005a)] es mayor, cuanto mayor es la contribución de los intrones al tamaño total de un gen y, para abreviar, en comparación con secuencias codificantes largas. Estas conclusiones son paralelas a las observaciones sobre los patrones generales de uso de codones en el D. melanogaster genoma (Comeron y Kreitman 2002 Qin et al. 2004), lo que sugiere que BGS puede desempeñar un papel importante en la generación de estos patrones muy locales al reducir la eficiencia de la selección en mutaciones sinónimas que afectan el uso de codones. Las estimaciones de genética poblacional de dicha selección (Comeron y Guthrie 2005) son consistentes con esta interpretación, aunque la interferencia de Hill-Robertson entre los sitios sinónimos en sí (ver más abajo) también puede contribuir a estos patrones (Comeron y Kreitman 2002 Comeron y Guthrie 2005 Comeron et al. 2008).Los resultados de simulación recientes sugieren, sin embargo, que el efecto de la selección en sitios no sinónimos domina, a excepción de las tasas de recombinación cercanas a cero (Zeng y Charlesworth 2010a).


Discusión

El presente análisis confirma las observaciones anteriores de que los parálogos evolucionan bajo selección purificadora [21], que normalmente actúa con una fuerza similar en ambas copias duplicadas de genes [9, 22]. Sin embargo, además, encontramos que los parálogos evolucionan significativamente más rápido que los genes no duplicados con un nivel similar de divergencia, lo que es compatible con la noción de que las duplicaciones de genes son una fuente de nuevas funciones proteicas.

La inconsistencia de la evidencia empírica con el modelo de Ohno suscita preguntas sobre la validez de algunos de los supuestos subyacentes a este modelo. Una suposición importante, que fue heredada por el modelo de subfuncionalización, es que una copia de un gen es suficiente para realizar la función respectiva, de modo que la duplicación de un gen es redundante y no tiene ningún efecto sobre la aptitud [1,10]. Esta noción ha sido ampliamente aceptada y, a menudo, se convierte en uno de los postulados centrales de los modelos de evolución genética duplicada [3, 7, 26, 27]. Sin embargo, si este fuera el caso, un evento de duplicación solo lograría la fijación en muy raras ocasiones [28,29]. Además, en el caso de que una duplicación sea levemente perjudicial, se evitaría efectivamente que logre la fijación [30].

Aunque la noción de duplicación que produce genes redundantes es fundamental para las teorías actuales sobre la evolución de genes duplicados, los beneficios a corto plazo de las duplicaciones de genes son bien conocidos. Esto se ilustra por las numerosas observaciones de amplificaciones de genes adaptativos en respuesta a antibióticos [31,32,33], tratamientos con fármacos contra el cáncer y exposición a diversas toxinas [34,35,36,37,38,39] o metales pesados ​​[40, 41,42,43,44], limitaciones de nutrientes [32,33,45,46,47,48,49,50], tratamientos con pesticidas [51,52,53], temperaturas extremas [54,55] y simbióticas y parasitarias interacciones [56,57]. Combinando esta información con las observaciones de que genes recientemente duplicados evolucionan bajo selección purificadora ([21] y nuestro trabajo actual), parece razonable suponer que la mayoría de genes duplicados que logran la fijación en una población aumentan la aptitud cuando están presentes en dos o más copias. en un genoma y, por tanto, están sujetos a una selección purificadora desde el momento de la duplicación.

Los parálogos recientemente duplicados parecen ser un grupo no aleatorio enriquecido en genes que codifican proteínas involucradas en diferentes aspectos de la interacción de los organismos con el medio ambiente (ver Archivos de datos adicionales). En particular, una fracción sustancial de estos parálogos codifica (predice) proteínas de membrana o secretadas. Las funciones predominantes de genes duplicados variaron entre diferentes organismos. En las bacterias, la mayoría de estos genes codifican diferentes tipos de moléculas de superficie que, en los patógenos, están involucradas en la interacción con las células sustrato. En la levadura, se hizo hincapié en los transportadores de membrana, así como en los genes implicados en la respuesta al estrés (por ejemplo, choque térmico). En eucariotas multicelulares, predominaron los receptores (por ejemplo, los receptores olfativos) y las moléculas de señalización secretadas (predichas). Las proteínas con un péptido señal predicho fueron más frecuentes en Arabidopsis thaliana (35% de todos los parálogos versus 17% de todos los genes no duplicados del proteoma), Caenorhabditis elegans (41% entre parálogos versus 31% entre genes no duplicados) y Drosophila melanogaster (39% en parálogos versus 23% en ortólogos) y las proteínas de membrana predichas fueron más numerosas en mamíferos (56% en parálogos versus 49% en genes no duplicados). Cada una de estas diferencias en la composición funcional de los conjuntos de parálogos y genes no duplicados fue estadísticamente muy significativa (p & lt 0,0001, prueba de χ 2).

Varios genes para los que se ha demostrado que la amplificación tiene un papel en la adaptación a diversas condiciones se encuentran entre los duplicados recientes en nuestro conjunto de datos. Los ejemplos incluyen genes para el transportador de hexosa de levadura, cuya amplificación ha demostrado aumentar la aptitud en un ambiente con bajo contenido de glucosa [49], el gen de la glicoproteína P del nematodo, el gen eucariótico clásico de resistencia a múltiples fármacos [36] y el cobre de la mosca de la fruta. -Gén de metalotioneína de unión cuya duplicación está implicada en la tolerancia al cobre [40,41]. Se encontró que muchos genes que se sabe que se amplifican en respuesta a la selección, principalmente durante los tratamientos con medicamentos contra el cáncer, también se encuentran presentes en múltiples copias en los genomas de mamíferos, en particular, aminoacil-tRNA sintetasas, glutamina sintetasa y otras enzimas anabólicas, adenosina desaminasa, ornitina descarboxilasa, AMP desaminasa y norte-acetilglucosaminiltransferasa [34,46]. Permeasas, transportadores, sintetasas y diversas enzimas de desintoxicación, que, en general, tienden a amplificarse como respuesta a condiciones estresantes [32,33,34,46,48,51], también mostraron una presencia sustancial entre los genes recientemente duplicados en todos los casos. especies (consulte Archivos de datos adicionales). Se cree que la duplicación de genes que pertenecen a estos grupos funcionales es adaptativa porque el aumento en la producción de las proteínas correspondientes puede aumentar la eficiencia del transporte de un nutriente al interior de la célula o de toxinas fuera de la célula, aumentar la tasa de catabolismo de tóxicos. sustancias, o permiten una mayor velocidad de síntesis de metabolitos, por ejemplo, aminoácidos, que se requieren en cantidades mayores en las condiciones dadas [32,33,34,46,48,51].

Por lo tanto, la observación de que la selección purificadora parece actuar sobre todos los duplicados recientes y el examen de las funciones de genes recientemente duplicados no respalda la noción de que la duplicación de genes da como resultado una verdadera redundancia funcional y las duplicaciones pueden lograr la fijación a pesar de ser redundantes [26]. La hipótesis alternativa - que las duplicaciones de genes se fijan en una población por selección positiva en todos los organismos - está respaldada por una combinación de evidencia de duplicaciones adaptativas de muchos tipos de organismos vivos: procariotas [31,33,45,46,48,50, 55,56], protistas [35,58,59], plantas [39,44], hongos [43,49], invertebrados [40,41,51,52,53], vertebrados no mamíferos [54], como así como tejidos somáticos de mamíferos [34,36,37,38]. Combinando estas observaciones con la sugerencia de que la duplicación de genes puede ser un mecanismo general de adaptación a diversas condiciones de estrés ambiental [32,33,46,48,49,50,52,53,55,60], sugerimos que, en ambos procariotas y eucariotas, la mayoría de los parálogos que se fijan en una población tienen un efecto directo sobre la aptitud desde el momento de la duplicación y ayudan en la adaptación a diversas condiciones ambientales, principalmente a través de un efecto de dosificación de proteínas.

El hecho de que el beneficio a corto plazo de la duplicación de un gen sea un efecto directo sobre la dosificación de proteínas también se deriva de una variedad de observaciones experimentales en varios organismos, procariotas y eucariotas. La duplicación de genes puede ser un mecanismo temporal para aumentar la dosificación de proteínas o ARN, como en el caso de los genes de ARNr en ovocitos de anfibios y macronúcleos ciliados, los genes del corion en algunos dípteros, los genes de actina en pollos y los transportadores de fármacos en tejidos somáticos (ver [ 34,37] para revisiones). Los efectos de la dosificación de proteínas también se han demostrado en varios otros estudios de duplicaciones genéticas adaptativas heredables [32,34,35,43,44,46,49,51,53,61]. Además, hay pruebas del análisis del genoma de la levadura de que los genes duplicados tienden a ser de aquellos conjuntos de funciones que se expresan más altamente [62], lo que respalda un papel general para la selección en la dosis de proteínas en genes duplicados.

Mostramos aquí una aceleración sustancial de la evolución en parálogos divergentes recientemente en comparación con ortólogos con el mismo nivel de divergencia de secuencia sinónima. Esta aceleración puede explicarse por una selección positiva o por una relajación de la selección purificadora o por una combinación de los dos. Se han descrito algunos casos de diferenciación de parálogos impulsada por selección positiva [63,64,65,66], sin embargo, estos casos son notoriamente difíciles de descubrir. Por tanto, aquí no intentamos examinar con mayor detalle las fuerzas selectivas que actúan sobre genes duplicados. En general, sin embargo, sólo una pequeña fracción de sitios en algunos genes parece evolucionar bajo selección positiva [15], y es probable que la relajación de la selección purificadora sea el principal mecanismo detrás de la aceleración de la evolución después de la duplicación.

Nuestra afirmación de la prevalencia del efecto de dosificación de proteínas como la ventaja a corto plazo de los genes duplicados no es incompatible con la posibilidad de una ventaja a largo plazo en términos de nuevas funciones o la observación de que los genes duplicados evolucionan a un ritmo más rápido. De hecho, la evolución de una nueva función beneficiosa en uno de los duplicados, una vez que se alcanza un nivel relativamente alto de divergencia (que será diferente para diferentes genes, dependiendo de la función específica involucrada), parece ser común entre genes duplicados como se demostró para varias familias de genes parálogos [33,52,54,67]. En la medida en que esto suceda, la selección positiva podría contribuir a la aceleración observada de la evolución en genes duplicados.

Sin embargo, asumiendo que las duplicaciones de genes evolucionan principalmente bajo selección purificadora, al menos poco después de la duplicación, la aceleración observada de la evolución puede explicarse por la interacción epistática entre copias de genes. En ausencia de epistasis, una función de aptitud es una función exponencial que depende de una única variable aditiva denominada potencial de aptitud [68,69,70,71]. Suponiendo que la aceleración de la evolución observada en los parálogos se debe principalmente a una relajación de la selección purificadora, la variable de potencial de aptitud que describe la función de aptitud de las copias de genes divergentes puede considerarse como la cantidad efectiva de proteína funcional, que depende tanto de la duplicación de genes como de la mutaciones puntuales. Suponiendo que todas las mutaciones puntuales son igualmente perjudiciales, de modo que se necesitan, por ejemplo, 10 mutaciones puntuales para eliminar el aumento en la cantidad de proteína funcional resultante de una duplicación, pag = D - m / 10, dónde pag es el potencial de aptitud, D es el número de copias de genes y metro es el número de mutaciones puntuales deletéreas. Por definición, en ausencia de epistasis, la selección contra una mutación deletérea es constante para todos los valores del potencial de aptitud.

Sin embargo, si una función de aptitud crece a un ritmo menor que exponencial, se espera una relajación de la selección frente a mutaciones deletéreas [68,69,70,71]. Por ejemplo, considere una función de aptitud lineal f (pag) = 2pag. En este caso, la aptitud de un organismo con una copia genética es f (pag) = 2pag = 2 (1) = 2, y la aptitud del mismo organismo con una mutación puntual es f (pag) = 2pag = 2(D - metro/ 10) = 2 (1 - 1/10) = 1.8, por lo que la mutación redujo la aptitud en un 10% (1 - 1.8 / 2). La aptitud de un organismo con dos copias de genes es f (pag) = 2pag = 2 (2) = 4, la aptitud del mismo organismo con dos copias de genes y una mutación puntual es f (pag) = 2 (2 - 1/10) = 3.8 en este caso, la misma mutación causará solo una reducción del 5% en la aptitud (1-3.8 / 4). Por lo tanto, la aceleración observada de la evolución en los genes parálogos implica que su divergencia ocurre bajo selección positiva o que la función de aptitud para las duplicaciones de genes crece a un ritmo más lento que exponencial.

La evidencia experimental de varios organismos apoya la noción de que el aumento de la aptitud debido a la duplicación de genes está lejos de ser exponencial, más específicamente, en condiciones ambientales estáticas, hay un número óptimo de copias de genes [49,50,53]. Como se sabe que los eventos de duplicación incurren en un costo de aptitud [50,53], la función de aptitud de los genes duplicados probablemente se asemeja a una parábola invertida, de modo que contiene un máximo claramente definido [28,53]. Numerosas observaciones de que las duplicaciones de genes que aumentan la dosis de proteínas pueden ser patogénicas [61,72,73,74,75] apoyan aún más el modelo del número de copias óptimo para cada gen.

Por tanto, parece razonable plantear la hipótesis de que, para cada gen, existe un número óptimo de copias por genoma que puede variar según las condiciones ambientales. Suponiendo que la condición ambiental que determina el número óptimo de genes fluctúe, la selección positiva regularía el número de copias del gen en el genoma en consecuencia. Bajo este modelo, si las condiciones ambientales, y por lo tanto el número de copias de genes, fluctúan con frecuencia, entonces la mayoría de los parálogos estarán estrechamente relacionados, de modo que se encontrará un exceso de genes (casi) idénticos dentro de un genoma, como de hecho se ha observado para muchos genomas ([21] y los datos no se muestran).

La presente observación de que los genes duplicados experimentan una relajación sustancial de la selección en comparación con los genes no duplicados es compatible con la visión tradicional de que las duplicaciones de genes hacen una contribución importante a la evolución de nuevas funciones de genes. Además, el repertorio de funciones de las proteínas entre los duplicados recientes sugiere que muchas duplicaciones de genes contribuyen a la adaptación del organismo a diversas formas de estrés ambiental. Los resultados del presente análisis de duplicaciones recientes sugieren un modelo evolutivo de duplicación de genes en dos etapas: en la primera etapa, inmediatamente después de la duplicación y durante la fase temprana de su evolución, los parálogos se retienen y están sujetos a una selección purificadora debido a la brevedad. Como ventaja a largo plazo de la regulación de la dosificación de proteínas en una etapa posterior de su evolución, es probable que las duplicaciones de genes proporcionen una ventaja a largo plazo al permitir la creación de nuevas funciones.


Métodos

Cepas bacterianas

Las cepas de bacterias utilizadas en este estudio son ambos derivados de E. coli K12. El MG1655 (F- lambda- ilvG- rfb-50, rph-1) la subcepa es la E. coli cepa de referencia (GI: 556503834) y se adquirió de la colección de cultivos DSMZ (Braunsweig, Alemania). La subcepa MDS42 de la serie de deleciones múltiples (MDS) (GI: 471332236) se creó eliminando elementos IS, profagos crípticos y genes degenerados de MG1655 y se ha descrito en detalle en Posfai et al. [6]. Fue comprado de Genómica del escarabajo (Wisconsin, Estados Unidos).

Quimiostatos y condiciones de cultivo

Las cepas se sembraron en estrías sobre placas de agar LB frescas a partir de reservas de glicerol y se cultivaron durante la noche a 37ºC. A continuación, se inoculó una sola colonia en un cultivo de 100 ml de medio M9 mínimo recién preparado [42] suplementado con glucosa 10 mM y casaminoácidos al 0,2% y se cultivó hasta que alcanzó una densidad óptica de 0,1. Se usaron ocho mililitros de este cultivo para inocular un quimiostato controlado por computadora de 500 ml (miniBio® 500 modificado, Applikon Biotechnology, Delft, NL). El cultivo continuo se mantuvo a un volumen de 350 mL con agitación constante a una velocidad de dilución de 0,1 h -1 a una temperatura de 37 ° C y un pH de 7,00 durante 504 h (21 días). Los cultivos de quimiostato se mantuvieron en un medio empobrecido en glucosa, que se preparó complementando un medio M9 mínimo [42], con glucosa 1 mM y casaminoácidos al 0,2%. Se utilizaron aminoácidos como resultado de experimentos de crecimiento de prueba repetidos con ambas cepas en cultivo por lotes (datos no mostrados). Descubrimos que el crecimiento de ambas cepas fue más consistente en todas las pruebas cuando el medio se complementó con aminoácidos. La densidad óptica se controló tanto de forma continua con el monitor de biomasa bugLab ® BE 2100 (Applikon Biotechnology, Delft, NL) como periódicamente, cada 24 h, mediante submuestreo y medición en el lector de microplacas automático Infinite ® m200 Pro (Tecan Group Ltd., Männedorf , Suiza). En estas condiciones, la DO600 alcanzó 0,1 en aproximadamente 20 h (estado estacionario) y permaneció así durante la duración del experimento.

Estimaciones de la fracción mutante y la tasa de mutación

En cada período de muestreo (24, 168, 336 y 504 h)

Se submuestrearon 2-5 mL del licor del reactor usando condiciones y técnicas estériles. De este volumen, se utilizó 1 ml para preparar una solución madre de glicerol, mientras que 1 ml de cada uno se sembró en placas de 5 LB-d-cicloserina (100 µg / ml) y 5 placas de LB-Rifampicina (50 µg / ml). Todos los platos estaban recién preparados. Se diluyó 1 ml adicional y se sembró en placas de agar LB para un recuento de colonias. Todas las placas se incubaron durante la noche a 37 ° C. Se produjeron mutaciones espontáneas y se acumularon en poblaciones de ambas cepas y se puntuaron mediante la resistencia adquirida a la d-cicloserina (cyc R) o rifampicina (rif R). La tasa de mutación (μ) se estimó mediante un modelo de acumulación de mutaciones [33],

dónde norte es el número de celda constante en un quimiostato, y r (t) es el número de mutaciones medidas en el tiempo (t) yt1 & lt t2 son dos puntos de tiempo discretos. El término λ es generaciones por unidad de tiempo (generaciones hr −1) [43], donde

y η es la tasa de crecimiento en el quimiostato de 0,1 h -1, por lo tanto, λ es igual a 0,14 generaciones h -1. El tiempo, en "horas", se elimina de la ecuación. (5), dejando generaciones, que es una medida escalada de tiempo que se usa comúnmente en genética para informar las tasas de mutación. Por lo tanto, usando la ecuación. (5), la tasa de mutación (μ) se expresa como mutaciones por célula por generación (mutaciones célula -1 generación -1).

Condiciones de crecimiento de lotes de monocultivos mutantes

Se cultivaron individualmente por lotes hasta 48 colonias escogidas al azar a 37 ° C durante la noche en medio mínimo suplementado con glucosa 10 mM y casaminoácidos al 0,2%. A continuación, cada cultivo se diluyó 100 veces en M9 reciente suplementado con glucosa 1 mM y casaminoácidos al 0,2%. Luego, los cultivos se hicieron crecer (en modo discontinuo) a 37 ° C y densidad óptica a 600 nanómetros (OD600) se midió cada 20 minutos en el lector de microplacas Infinite® m200 Pro (Tecan Group Ltd., Männedorf, Suiza) durante un período de 17 h. También se obtuvieron y restaron medidas en blanco de la DO.600 en cada momento. La tasa de crecimiento (h −1) se estimó como la pendiente de la porción de línea recta de la gráfica del logaritmo natural de cada DO corregida en blanco.600 medición (Ln [ODt-en blanco]) versus tiempo. El rendimiento fue equivalente a la medición final de DO600 al final (17 h) de cada experimento de cultivo por lotes.


5. Conclusiones

Hemos proporcionado una descripción general de la naturaleza de las mutaciones y las teorías que describen su destino una vez que han entrado en una población. Sin embargo, queda mucho por hacer para integrar más plenamente las teorías existentes y comprender mejor sus implicaciones. Hemos demostrado que este trabajo es importante para cuestiones de interés práctico, como la rapidez con la que las especies pueden adaptarse a nuevos entornos, cómo los factores genéticos pueden contribuir a su extinción y qué consecuencias se derivan de los aumentos en las tasas de mutación provocados por la tecnología creada por el hombre que pueden involuntariamente aumentan las enfermedades genéticas en humanos y amenazan la supervivencia de especies en peligro de extinción. Sin embargo, las mutaciones también proporcionan la materia prima para la mejora de plantas y animales para la producción de alimentos, y necesitamos saber cuál es la mejor manera de utilizarlas. La genética poblacional de las mutaciones es sin duda fundamental para muchas cuestiones teóricas y aplicadas en biología.


Métodos

Compilación de datos de secuencia de ADN. Compilamos secuencias de ADN codificantes y adyacentes no codificantes de loci ortólogos de ratones y ratas mediante muestreo aleatorio de sus respectivos conjuntos de secuencias del genoma completo en GenBank. Usando el genoma del ratón como referencia, seleccionamos al azar los cromosomas en proporción a sus longitudes en Mb, luego seleccionamos al azar posiciones dentro de los cromosomas de una distribución uniforme. Se eligió el locus más cercano a esta posición para el que la evidencia de anotación incluía al menos una secuencia de ARNm completa en ambas especies. Los primeros 200 loci se muestrearon al azar independientemente de sus distancias a las siguientes secuencias de codificación. Para aumentar el tamaño de la muestra de los loci con regiones intergénicas largas, muestreamos 100 loci adicionales para los cuales la anotación tanto en el ratón como en la rata indicó que la secuencia de codificación más cercana estaba a & gt6 kb de distancia. Las secuencias de codificación se alinearon usando clustal (20), y las posiciones de los huecos se examinaron y ajustaron si era necesario. Se extrajeron secuencias de longitudes de hasta 6.000 pb de las regiones 5 'aguas arriba y 3' aguas abajo de las secuencias codificantes, junto con el primer y último intrones y otro intrón seleccionado aleatoriamente. Algunos genes contienen intrones extremadamente largos, particularmente aquellos que se expresan poco (21), por lo que inicialmente enfocamos nuestro análisis de restricción en el primer y último 1,000 bp, si la longitud del intrón excedía los 2,000 bp; de lo contrario, analizamos secuencias intrónicas completas. Posteriormente se extrajo un conjunto de datos adicional de hasta 12.000 pb de los primeros intrones. Sólo se analizaron secuencias intrónicas e intergénicas claramente ortólogas. Usamos una ventana móvil de 40 pb para comprobar el grado de divergencia de secuencia en alineaciones putativas. En algunos casos, observamos bruscos saltos en la divergencia a ~ 60% (la divergencia esperada para la alineación de secuencias de ratón-rata no ortólogas), mientras que la divergencia típica de ratón-rata es ~ 15%. Interpretamos estos como causados ​​por inserciones o eliminaciones largas o errores de ensamblaje de secuencia. Estas regiones obviamente no homólogas fueron excluidas del análisis.

Alineación de secuencia. Las secuencias de ADN no codificantes se alinearon utilizando un procedimiento de alineación de Monte Carlo, mcalign, que busca la alineación de mayor probabilidad basándose en un modelo evolutivo específico de evolución de secuencias de ADN no codificantes (P.D.K. y T. Johnson, trabajo no publicado). Brevemente, los parámetros del modelo son θ, la tasa de indeles en relación con la tasa de sustituciones de nucleótidos y un vector w, la distribución de frecuencia de las longitudes de indel. Estos parámetros se estiman empíricamente a partir de otros datos (ver más abajo). El procedimiento de Monte Carlo realiza una búsqueda cuesta arriba del espacio de parámetros de alineaciones plausibles aceptando o rechazando alineaciones propuestas en función de sus probabilidades relativas. Las nuevas alineaciones de propuestas se generan mediante un conjunto de rutinas de mezcla indel.

Los parámetros para el modelo de alineación (θ y w) se estimaron a partir de 27 secuencias de intrones ortólogos de especies de ratón estrechamente relacionadas Mus domesticus, Mus spretus, y Mus caroli, para las cuales las divergencias de nucleótidos e indel son lo suficientemente bajas como para hacer que las alineaciones por métodos heurísticos sean prácticamente inequívocas. En comparaciones entre M. domesticus y M. spretus (10 loci), θ fue 0,188, y entre M. domesticus y M. caroli (8 loci), θ fue 0,125. Se utilizó una estimación media ponderada de θ = 0,146 para parametrizar el modelo de alineación. La distribución empírica de las longitudes de indel se muestra en la Fig. 1. Para parametrizar el modelo de alineación, un valor para w1 = 0.565 (el valor empírico) se asumió para I & gt 1, valores de wI se estimaron minimizando la suma de cuadrados sobre una función de suavizado, wI = β / α i, donde β es una constante de normalización y α es el parámetro de suavizado. El valor estimado de α fue 1,45. Usamos datos intrónicos para parametrizar el modelo de alineación para el ADN intergénico, que es una aproximación. Sin embargo, los indeles ocurren con una frecuencia más baja en el ADN intergénico que en el intrónico, en promedio, y el uso de esta aproximación dará alineaciones muy cercanas, en promedio, a las alineaciones verdaderas para el grado de divergencia de secuencia entre el ratón y la rata (datos no publicados).

Distribución de frecuencia de la longitud del indel a partir de comparaciones entre especies de especies de ratones estrechamente relacionadas.

Enmascaramiento de repeticiones de microsatélites. Repeticiones de tipo (XY)norte, (XYZ)norte, (XYY)norte, (XYYY)nortey (XXYYY)norte, dónde norte = 5 en regiones intrónicas o intergénicas fueron excluidas del análisis, porque su evolución no está impulsada por sustituciones de un solo nucleótido (22). También se excluyeron las secuencias adyacentes a las regiones de microsatélites perfectas que muestran & gt80% de homología con la repetición específica. Además, se observó con frecuencia que los límites de los microsatélites contenían tramos cortos de nucleótidos obviamente no homólogos, por lo que 5l nucleótidos adyacentes a los microsatélites, donde l es la longitud de la repetición, también se excluyeron.

Cálculo de la restricción evolutiva. Calculamos la restricción en las regiones no codificantes ampliando un método desarrollado previamente para codificar secuencias (6). Usamos tasas de sustitución en los sitios FEI para predecir los números esperados (mi) de sustituciones en secuencias adyacentes no codificantes (es decir, ADN intergénico, sitios de empalme intrónico o primeros intrones), bajo el supuesto de que las tasas de mutación puntual de cada tipo posible son iguales en los sitios FEI y los sitios de ADN no codificantes adyacentes. Calculamos la restricción comparando mi al número de sustituciones observadas (O): 1 Existen diferencias sustanciales en las tasas de sustitución entre diferentes tipos de nucleótidos (23), por lo que necesitábamos tener en cuenta las diferencias en las tasas de sustitución entre los sitios FEI y las regiones adyacentes no codificantes. Para cada posible tipo de sustitución I = 1.6 (A↔T, A↔C, A↔G, T↔C, T↔G, C↔G), sea kI ser la divergencia por pares en el segmento FEI, es decir, 2 donde DI es el número de diferencias de tipo por pares I, y norteI es el número de sitios en los que un cambio de tipo I podría ocurrir en un solo paso (por ejemplo, para cambios A↔T, estos sitios son A / A, T / T y T / A). El número esperado de sustituciones en un segmento adyacente no codificante es 3 donde METROI es el número correspondiente de sitios sin codificación. Este modelo asume tasas de mutación simétricas y una composición de base equivalente en los sitios FEI y la región no codificante de interés. Sin embargo, el análisis en el que se asignó la polaridad de sustitución a través de la probabilidad relativa de ascendencia de cada base dio resultados muy similares (datos no mostrados). El método para calcular la restricción no intenta dar cuenta de múltiples aciertos. Sin embargo, los resultados de la simulación (datos no mostrados) sugieren que el sesgo de estimación es insignificante para la divergencia de nucleótidos muy por encima de la de ratón-rata (15%) y para diferencias sustanciales en el contenido de GC. Errores estándar y límites de confianza para C se calcularon mediante el arranque de los valores específicos de genes de O y mi 10.000 veces.

Cálculo de la tasa de mutaciones deletéreas genómicas. La contribución a la tasa de mutación deletérea de un segmento de ADN se calculó a partir del producto de la tasa de mutación deletérea promedio por sitio (tu) y el número de sitios de nucleótidos (s) en el segmento. Dividimos los sitios en dos clases: (I) sitios precedidos de C o seguidos de G, denominados "susceptibles a CG", o (ii) todos los demás sitios, denominados "no susceptibles a CG". Un promedio ponderado de contribuciones de sitios susceptibles a CG (tasa de mutación = tu1 número de sitios = s1) y sitios no susceptibles a CG (tasa de mutación = tu2 número de sitios = s2) fue tomada. La tasa de mutación deletérea por sitio (tu) se calculó a partir del producto de la restricción en el segmento correspondiente (Eq. 1) y las divergencias de nucleótidos específicas de sitios no susceptibles a CG y susceptibles a CG, calculadas mediante el método de dos parámetros de Kimura (9). La contribución del ADN intergénico o intrónico a la tasa de mutación deletérea genómica por diploide (U) se calculó sumando las contribuciones promedio de los segmentos: 4 donde lI es la longitud de un segmento (200 pb en los análisis realizados aquí), PAGI es la fracción de loci que realmente contiene ADN intergénico o intrónico en el segmento I, y Z es una constante para convertir entre la escala de la tasa de mutación de nucleótidos y la tasa de mutación genómica por generación: Z = 35.000 loci × 0,5 (generaciones por año) / 13 × 10 6 (edad aproximada en años de mus-rattus divergencia ref. 24). La inclusión del término PAGI fue necesario porque las regiones intergénicas y los intrones varían en longitud, y la fracción de loci que contiene un segmento de ADN específico disminuye a medida que aumenta la distancia en pb desde la secuencia codificante hasta el inicio del segmento. Para regiones intergénicas, los valores de PAGI se calcularon a partir de los primeros 200 loci muestreados (que se asumió que eran una muestra aleatoria con respecto a la longitud intergénica) y para los intrones de todos los loci muestreados. Longitudes de regiones intergénicas utilizadas para calcular PAGI se tomaron como la mitad de las longitudes intergénicas reales. Las tasas de mutación en las islas CpG (regiones del genoma, a menudo cercanas al extremo 5 'de los genes, que son inusualmente ricas en dinucleótidos CG) son un orden de magnitud más bajas que la mayoría de los sitios CG (25). En el análisis, asumimos que las tasas de mutación en nucleótidos dentro de sitios susceptibles a CG en islas CpG eran las mismas que las tasas en nucleótidos no susceptibles a CG.

Delimitación de islas CpG. Las ubicaciones de las islas CpG se estimaron utilizando las utilidades CpG Plot / CpG Report disponibles en el Instituto Europeo de Bioinformática (www.ebi.ac.uk/index.html ref 26). Se informó una isla de CpG si la relación observada a esperada de C más G a CpG excedía 0,6, en regiones de contenido de GC & gt50% (27), en una sucesión de ventanas de 10 x 100 pb. Solo se informaron islas de & gt200 bp.


Variantes del SARS-CoV-2, mutaciones de pico y escape inmunológico: una actualización

Una revisión reciente sobre variantes y mutaciones realizada por miembros del consorcio COG-UK proporciona una actualización de nuestro conocimiento más reciente sobre los aspectos de la evolución del SARS-CoV-2 relacionados con el escape inmunológico. También proporcionamos una actualización sobre las últimas mejoras de la herramienta Explorador de mutaciones de COG-UK.

El SARS-CoV-2 ha estado evolucionando en la población humana desde que surgió en 2019. Las mutaciones altamente perjudiciales en el genoma del SARS-CoV-2 se purgan rápidamente, y la mayoría de las mutaciones son neutrales (no tienen ningún efecto en la biología del virus) o levemente deletéreo. Pero más de un año después de la pandemia, nos estamos enfocando cada vez más en mutaciones raras de gran efecto que contribuyen a la adaptación del virus y al cambio antigénico. Esto incluye cambios que conducen a una mayor infectividad, transmisibilidad, capacidad para causar enfermedades graves y escape inmunológico.

Estas mutaciones que mejoran la aptitud del virus no son nuevas en la corta historia de la pandemia de SARS-CoV-2. El primer cambio genético importante se detectó pocos meses después de la infección por SARS-CoV-2 en humanos. Específicamente, D614G, un cambio de aminoácidos de proteína de pico, aumentó rápidamente en frecuencia desde abril de 2020 y emergió varias veces en los datos globales del SARS-CoV-2. Ahora, está presente en al menos el 80% de todas las variantes del SARS-CoV-2 asociadas con la infección humana. Desde entonces, los estudios han demostrado que D614G confiere un aumento moderado de la infectividad y la transmisibilidad. Sin embargo, el virus que porta esta mutación tardó menos tiempo en llegar a todos los rincones del mundo del que nos tomó a nosotros entender por qué ocurrió esto según la biología del virus. En un momento en el que se necesitan respuestas rápidas para informar las respuestas a una pandemia, aún puede llevar tiempo comprender los mecanismos precisos mediante los cuales una variante se vuelve más exitosa. Esto se complica por el papel del azar en términos de qué variantes están asociadas con eventos epidemiológicos.

Este elemento de "lotería" para el éxito variable se ejemplifica en lo que vino después en Europa con el surgimiento asociado con los viajes a España y la posterior difusión europea generalizada del linaje B.1.177. ¿Fue más transmisible? Si es así, ¿hubo mutaciones responsables de esto? La evidencia hasta la fecha sugiere que, aunque B.1.177 se asoció con algunas mutaciones únicas, por ejemplo, S: A222V, esto se propagó de manera muy efectiva por el gran número de personas que viajaron durante el verano de 2020. Esto resultó en numerosas introducciones en la población del Reino Unido en un momento en el que las tasas de infección eran relativamente bajas y, por lo tanto, era probable que cualquier infección posterior se produjera con B.1.177.

Luego vino un período de cambio muy significativo del SARS-CoV-2, esencialmente una segunda fase de la pandemia. Desde aproximadamente octubre de 2020 en adelante, las variantes virales comenzaron a emerger en varias regiones geográficamente distantes del mundo que portaban un número mucho mayor de mutaciones, muchas de las cuales eran iguales, un proceso conocido como evolución convergente. Estas mutaciones surgieron en virus de diferentes linajes (o ramas) del árbol evolutivo del SARS-CoV-2. Es muy probable que se hayan seleccionado estas variantes porque, después de un período de intensa infección global, partes de la población humana se estaban volviendo cada vez más inmunes al virus original o habían evolucionado en el contexto de infecciones crónicas. Estas variantes tuvieron más éxito porque se propagaron más rápidamente y / o tuvieron algún grado de evasión inmunitaria.

A nivel mundial, se han identificado cuatro "Variantes preocupantes": B.1.1.7 (también llamado "Alfa" por la OMS) se detectó por primera vez en Kent y es más transmisible que el virus original de Wuhan B.1.351 ("Beta") y B.1 (“Gamma”) detectados por primera vez en Sudáfrica y Brasil, respectivamente, son más transmisibles que el virus original y tienen cierto grado de evasión inmunitaria. Otra variante, la B.1.617.2 (“Delta”), detectada por primera vez en la India, se está extendiendo ahora en el Reino Unido y en muchos otros países. La transmisibilidad de Delta es un tema de estudio intensivo, pero es probable que sea similar / superior a Alpha. Public Health England ha designado una quinta variante de preocupación para un sublinaje de alfa portador de la mutación S: E484K. También hay numerosas Variantes de interés / Variantes en investigación, que se sospecha que tienen al menos algún cambio en la biología asociado con mutaciones que están presentes en Variantes de interés o asociadas con evidencia experimental de escape inmunológico.

Los países con controles fronterizos estrictos pueden prevenir el ingreso y la infección, pero a escala global, todas las variantes de interés o preocupación han viajado por todo el mundo. Además, es muy difícil predecir con cierto grado de éxito qué mutaciones podrían surgir en el futuro. Las intervenciones de salud pública siguen siendo vitales, porque pueden ralentizar la progresión de la transmisión y, por lo tanto, la mutación, y brindan una ventana de tiempo para mejorar la cobertura de vacunación en las poblaciones en riesgo. La clave fundamental es la vacunación mundial generalizada.

Los datos de secuencia proporcionan una herramienta de salud pública vital para orientar las futuras estrategias de vacunación. Una revisión reciente realizada por miembros del consorcio COG-UK y los desarrollos en curso de nuestro Explorador de mutaciones COG-UK tienen como objetivo proporcionar información a científicos de laboratorio, desarrolladores de pruebas de diagnóstico, fabricantes de vacunas y responsables políticos. Entonces, ¿qué nuevos conocimientos aportan estos?

En la revisión de Harvey, Carabelli y colegas (Ref.1), los autores resumen la literatura sobre mutaciones de la proteína pico del SARS-CoV-2 (el antígeno primario) enfocándose en sus impactos en la antigenicidad y proporcionando contexto en términos de estructura de la proteína. y frecuencias de mutación observadas en conjuntos de datos de secuencia global (Figura 1). Aunque la predicción de las vías mutacionales por las que evolucionará un virus es extremadamente desafiante, esta revisión destaca la importancia de recopilar el conocimiento de la literatura experimental sobre el efecto de las mutaciones de pico del SARS-CoV-2 sobre la antigenicidad (inmunidad mediada por anticuerpos) y otros aspectos de la el virus (por ejemplo, afinidad de unión a ACE-2).

La integración de estos datos y las secuencias emergentes de SARS-COV-2 tiene el potencial de facilitar la detección automatizada de posibles variantes de preocupación a bajas frecuencias. El seguimiento de la aparición de virus marcados como posibles variantes antigénicamente significativas ayudará a guiar la implementación de medidas de control específicas y una mayor caracterización de laboratorio.

Figura 1. Sustituciones de aminoácidos que caracterizan a las variantes de preocupación, su localización en la proteína de pico (en rojo), clases de anticuerpos asociados (cuatro clases de unión al receptor y la clase de dominio N-terminal), frecuencia, accesibilidad de anticuerpos, antigenicidad, el efecto sobre anticuerpos monoclonales (mAb) y sueros convalecientes, y sobre la unión de ACE-2.

Los autores también proporcionan literatura actualizada sobre la eficacia de las vacunas y la terapéutica contra las variantes de preocupación conocidas. Sin embargo, aunque datos recientes muestran que las vacunas son efectivas para prevenir los síntomas más severos de COVID-19, a medida que las Variantes de Preocupación continúan infectando a las personas, acumulan cambios a lo largo del tiempo, generando “variantes de variantes”. En este sentido, es importante vigilar cualquier mutación que pueda tener un papel antigénico y proporcionar al virus un mecanismo para evadir la inmunidad del huésped. Por ejemplo, según lo informado por COG-UK Mutation Explorer, algunas mutaciones ya se están acumulando en Delta (Figura 2). Los estudios epidemiológicos nos permitirán comprobarlo. Los datos sobre otras variantes de preocupación e interés se pueden encontrar en el tablero.

Figura 2. Mutaciones antigénicas en la parte superior de B.1.617.2 que definen mutaciones

La mayoría de las mutaciones en Delta son de baja frecuencia y, por lo tanto, su porcentaje (sobre el recuento total de ese linaje específico) también es bajo (por ejemplo, E484A, N501Y y A831V). Algunas mutaciones parecen haberse establecido más, como en G142D y K417N. Se sabe que este último se encuentra en el borde del dominio de unión al receptor (RBD) y reduce la neutralización por algunos anticuerpos monoclonales (mAb), pero mejora la neutralización por algunos otros mAb en Beta (Ref. 2 y 3). No se sabe si esta mutación confiere una ventaja a Delta, especialmente en el contexto de una población fuertemente vacunada. Los asociados del COG-Reino Unido ya han iniciado experimentos para evaluar el efecto de estas mutaciones en la biología variante.

COVID-19 Genomics Reino Unido (COG-Reino Unido)

La pandemia actual de COVID-19, causada por el SARS-CoV-2, representa una gran amenaza para la salud. El consorcio COVID-19 Genomics UK (COG-UK) se ha creado para ofrecer una secuenciación rápida y a gran escala del virus del genoma completo a los centros locales del NHS y al gobierno del Reino Unido.

Dirigido por la profesora Sharon Peacock de la Universidad de Cambridge, COG-UK está formado por una asociación innovadora de organizaciones del NHS, las cuatro agencias de salud pública del Reino Unido, el Instituto Wellcome Sanger y socios académicos que brindan capacidad de secuenciación y análisis. Puede encontrar una lista completa de colaboradores aquí.La profesora Peacock también se encuentra en comisión de servicio a tiempo parcial en PHE como directora de ciencia, donde se centra en el desarrollo de la secuenciación de patógenos a través de COG-UK.

COG-UK se estableció en abril de 2020 con el apoyo de £ 20 millones de fondos del "fondo de lucha" de respuesta rápida de investigación COVID-19 del Tesoro de Su Majestad (establecido por el profesor Chris Whitty y Sir Patrick Vallance), y administrado por el Instituto Nacional para la Investigación en Salud (NIHR), Investigación e Innovación del Reino Unido (UKRI) y el Instituto Wellcome Sanger. El consorcio también fue respaldado por el Fondo de Innovación de Pruebas del Departamento de Salud y Atención Social el 16 de noviembre de 2020 para facilitar la capacidad de secuenciación del genoma necesaria para satisfacer el creciente número de casos de COVID-19 en el Reino Unido durante el período invernal.

Estar al día


Genoma que se desmorona: el impacto de las mutaciones perjudiciales en los seres humanos

A pesar de todos los elaborados mecanismos que emplea una célula para manejar su ADN con el mayor cuidado, un ser humano recién nacido porta alrededor de 100 nuevas mutaciones, originadas en sus padres, alrededor de 10 de las cuales son deletéreas. Una mutación que reemplace solo uno de los más de tres mil millones de nucleótidos en el genoma humano puede conducir a la síntesis de una proteína disfuncional, y esto puede ser inconsistente con la vida o causar una enfermedad trágica. Varios por ciento, incluso de los jóvenes, padecen enfermedades causadas, exclusiva o principalmente, por mutaciones nuevas y pre9] existentes en sus genomas, que incluyen tanto una amplia variedad de enfermedades mendelianas genéticamente simples como diversas enfermedades complejas como anomalías congénitas, diabetes y otras enfermedades. esquizofrenia. Los efectos negativos más leves, pero aún sustanciales, de las mutaciones son aún más generalizados. Por el momento, no disponemos de ningún medio para reducir la velocidad a la que aparecen espontáneamente las mutaciones. Sin embargo, la reciente avalancha de datos genómicos que fueron posibles gracias a los métodos de secuenciación del ADN de próxima generación, permitió a los científicos explorar los impactos de las mutaciones deletéreas en los seres humanos con una precisión previamente inalcanzable y comenzar a desarrollar enfoques para manejarlos.

Escrito por un investigador líder en el campo de la genética evolutiva, Genoma desmoronado revisa el estado actual del conocimiento sobre las mutaciones deletéreas y sus efectos en los seres humanos para los que se dedican a las ciencias biológicas y la medicina, así como para los lectores que solo tienen conocimientos científicos generales e interés en la genética humana.

  • Proporciona una amplia introducción a los fundamentos de la genética evolutiva con énfasis en la mutación y la selección.
  • Analiza los efectos de las mutaciones nuevas y preexistentes en los genotipos y fenotipos humanos.
  • Proporciona una revisión completa del estado actual del conocimiento en el campo y considera problemas cruciales sin resolver.
  • Explora cuestiones éticas, científicas y sociales clave que probablemente se volverán relevantes en un futuro próximo a medida que la modificación de los genotipos de la línea germinal humana se vuelva técnicamente factible

Genoma desmoronado es lectura obligada para estudiantes y profesionales en genética humana, genómica, bioinformática, biología evolutiva y antropología biológica. Es seguro que tendrá un gran atractivo entre todos aquellos interesados ​​en los vínculos entre la genética y la evolución y cómo es probable que influyan en el futuro de la salud humana, la medicina y la sociedad.

Biografías del autor

Alexey S. Kondrashov, PhD es profesor de Ecología y Biología Evolutiva en la Universidad de Michigan, Ann Arbor. Sus intereses de investigación incluyen la evolución del sexo y la recombinación genética, las propiedades de las mutaciones deletéreas espontáneas y de la selección contra ellas, y la dinámica de la variación genética en poblaciones naturales y artificiales.