traductor

viernes, 1 de octubre de 2021

La secuencia CGGCGG y el coronavirus @labvisor_site-Dr_Pilgrim

  Codon Pair Bias (CPB), que, casualmente, fue el eje central de estudio en mi tesis doctoral. Este concepto se basa en el hecho de que el código genético está degenerado (WHAT)

Varios codones (los grupos de tres letras CGG o UAC) llevan la información para un aminoácido (para formar proteínas). Pero varios codones pueden codificar para el mismo aminoácido. Por ejemplo, para la arginina, puede ser CGG, CGU, CGA...y no todos son igual de frecuentes.

Esto significa que algunos tenderán a aparecer más que otros. Y luego además, que aparezcan seguidos, también será más o menos frecuente según el organismo y disponibilidad en el ambiente celular. Por ello, los virus, por propia evolución y selección, tiran más hacia unos codones
 
En este ensayo, se basan en que en coronavirus, que aparezcan dos argininas seguidas codificadas por CGG es raro o imposible y que solo se puede haber dado por manipulación. Aquí aparece la secuencia:
 
https://twitter.com/Dr_Pilgrim/status/1404009530506330113
 
https://twitter.com/Dr_Pilgrim/status/1404009530506330113/photo/1
 
De algún modo, establecen la teoría de que esta pareja de codones seguidos, dotan de una mayor virulencia o letalidad al virus, y que se ha modificado por gain of function sin dejar rastro (pero sin demostrar cómo).
 
La verdad, es que aunque sea improbable, no es imposible de forma natural. Cualquier virus (sobre todo los coronavirus) sometido a presión selectiva, puede aparecer con ese Codon Pair Bias y seleccionarse de forma natural. Hay algo importante a tener en cuenta aquí 
 
Y es que en coronavirus, cuantos más pases (pasar de un hospedador a otro, ya sea in vitro o in vivo) más posibilidades hay de mutación y adaptación. Pero, ¿en qué me baso para decir esto? Pues en que yo ya había visto esta secuencia antes. En otro coronavirus.
 
Se trata del coronavirus PEDV, que utilicé como uno de los modelos para estudiar la recombinación. En este coronavirus animal, ya se observó esta secuencia "rarísima" en cepas CH/FJND-3/2011 y AJ1102. Este coronavirus surgió en el 78, no es nuevo.
   
https://twitter.com/Dr_Pilgrim/status/1404009539909951489/photo/1
 
Después de circular (y causar epidemias en medio mundo) durante años surgieron cepas con este cambio selectivo. Fueron aislados de ganado porcino. ¿Os parece poca prueba de que no se ha manipulado sino que aparece porque son virus chinos? ALRIGHT.
 
Curiosamente, esta secuencia "rarísima" también aparece en una cepa de este coronavirus en ARANDA DE DUERO (Burgos). ¿Creéis que en Burgos se dedican a crear armas biológicas aparte de hacer quesos? NO. Es presión selectiva y cambio de hospedador y de frecuencia de CPB.  
 
Yo mismo, en mi tesis, pude ver cómo afecta este cambio de frecuencia a la viabilidad y virulencia del virus, pero es completamente aleatorio y no sigue ningún patrón. Y por supuesto, para realizar este cambio bien, deben ser mutaciones SILENCIOSAS. 

 Alex Baggins, PhD

 https://twitter.com/Dr_Pilgrim/status/1404009522620928003 

Crtiica a 

https://www.wsj.com/articles/the-science-suggests-a-wuhan-lab-leak-11622995184



El código genético se compone de codones, es decir, las letras de A, G, C y U (coronavirus), que realizan combinaciones de tres en tres entre ellas para formar códigos de tripletes (codones) que codifican para un aminoácido

Por un lado tenemos el genoma, que son los nucleótidos, y una vez pasan de genoma a ARNm, estos tripletes tienen la información para un aminoácido que será traducido (generado) en ribosomas de la célula.

Una vez formados esos aminoácidos, se van uniendo como una cadena mediante enlaces peptídicos para dar lugar a las proteínas. El ARNm se degrada, ya que solamente era el molde. Aprovecho para decir que NO ENTRA al núcleo ni produce mutaciones.

Este código genético está "degenerado". Qué significa esto? Significa que varios tripletes pueden codificar para el mismo aminoácido. Por ejemplo, para la glicina, pueden codificar GGC, GGU, GGA y GGG.

Evolutivamente, se ha visto, que muchos organismos, como los virus, establecen una "preferencia" por un triplete en vez de los otros, a la hora de codificar un aminoácido. Esto suele venir dado por la abundancia, por la futura estructura de la proteína y otros factores, ¿por qué?

or pura ley del mínimo esfuerzo, es decir, por ahorrar energía. La codificación más óptima siempre va a ser la mejor. Es lo que se llama Codon Pair Bias o CPB. No siempre ocurre así y a veces, al usar un codón en vez de otro, la proteína y la función asociada pueden variar.

https://twitter.com/Dr_Pilgrim/status/1443643764598259712

Basándonos en esto, se ha visto que introducir cambios en esta preferencia o en este CPB, conlleva cambios que bien pueden ser inocuos para el virus, atenuarlo, o incluso aumentar su virulencia. Aquí existen dos estrategias:
1-CPB deoptimization. Es la "deoptimización". Sería variar los codones que suele usar el genoma, por otros que introducimos nuevos para la codificación y que conlleve un "esfuerzo" e intentar atenuar el virus, aunque cambias la secuencia de nucleótidos.
https://pubmed.ncbi.nlm.nih.gov/32348767/
 
2-SAVE(synthetic attenuated virus engineering). En vez de cambiar la secuencia, se intercambian codones que tiene ya la secuencia, con otros que codifican para el mismo aminoácido. Es decir, cambiamos ladrillos similares de sitio, pero la pared es exacta.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2754401/
 
Ésta última es un ajuste mucho más fino, en el que no se modifica la secuencia sino el codon "usage" sin alterar la proteína demasiado, dado que los cambios son silenciosos. Es la que llevé a cabo en mi tesis doctoral con un alfacoronavirus.
 
Cabe destacar, que esto conlleva unos cálculos y análisis bastante arduos y complejos, y que al final puedes tener millones de posibilidades y nunca puedes saber cómo será el resultado hasta que rescates el virus en cultivos y lo pruebes un vivo (en animales). ¿Qué pasó?
Cruzamos los datos del codon usage con la secuencia de nucleótidos de un fragmento de la proteína N de coronavirus, que como sabéis es digamos, la más importante y la que puede establecer que un coronavirus sea viable o no. Tras aplicar los filtros, encontramos 4 posibilidades:
 
N1 y N2: con un codon usage por encima del "normal" de la proteína N nativa. N3 y N4: con un codon usage por debajo del normal. Desarrollamos estas secuencias y las introdujimos en nuestro cDNA de nuestro coronavirus. Y rescatamos esos cuatro mutantes.
Estos cálculos y los filtros nos llevaron bastante tiempo y mucha parte bioinformática. Basamos los filtros sobre todo, en energía libre de Gibbs de la proteína resultante y en el % de abundancia de los pares CG y UA.
Hay que recordar que la proteína N es vital para los coronavirus y cualquier modificación puede hacer que no sean viables. Tiene muchísimas funciones ya sea en el propio virus o en su interacción con el hospedador. Por ello cualquier desbalance podría ser o muy malo o PEOR.
Qué pasó? Pues un montón de cosas. Por un lado, el mutante N1 era similar al nativo. El mutante N2 crecía eficientemente y no parecía cargarse las células. El N3 aumentó su virulencia y el N4 apenas podía mantenerse en pie. Al probarlo en animales vino la sorpresa
El mutante N2 no solo era un virus atenuado, sino que apenas provocaba síntomas y posteriormente demostró que protegía frente a la infección con un virus virulento. Por ello fue candidato a vacuna, entre otros desarrollados en la tesis.
 
Codon Pair Bias (CPB), que, casualmente, fue el eje central de estudio en mi tesis doctoral. Este concepto se basa en el hecho de que el código genético está degenerado (WHAT)
 
https://twitter.com/Dr_Pilgrim/status/1404009522620928003
 
Doctor en Bioquímica, biología molecular y biomedicina. Estudiante de medicina. Tesis doctoral en coronavirus. Cofundador y COO de @labvisor_site

No hay comentarios: