traductor

lunes, 18 de enero de 2021

Así funcionan las vacunas de ARN mensajero -La ciencia que hay detrás de la primera vacuna contra la COVID-19 Por Lluis Montoliu

 

 

Así funcionan las vacunas de ARN mensajero 

La COVID-19 está obligando a toda la sociedad a la adaptación a situaciones inusuales y la ciencia no es una excepción. Las vacunas elaboradas a partir de ARN mensajero son un claro ejemplo de ello, pues se han podido elaborar en tiempo récord y ofrecen posibilidades muy prometedoras de cara al futuro. Así es como funcionan.


Las vacunas elaboradas con ARN mensajero presentan dudas por su novedad, pero también oportunidades tremendamente interesantes.

Las vacunas elaboradas con ARN mensajero presentan dudas por su novedad, pero también oportunidades tremendamente interesantes.

Foto: iStock

Inicia el año con la primera vacuna contra la COVID-19 aprobada, un modelo desarrollado por Pfizer-BioNtech con la tecnología ARN mensajero (ARNm). El nombre técnico de la vacuna es BNT162b2 y el comercial Comirnaty.

La tecnología de estas vacunas basadas en ARN mensajero monocatenario no es nueva, pues se viene empleando en ensayos preclínicos y clínicos desde hace décadas. Se ha demostrado que producen una potente respuesta protectora en modelos animales contra infecciones por ébola, zika, gripe e incluso bacterias como Streptococcus.

En estos últimos años se han hecho ensayos clínicos en humanos de fase I y II contra el VIH, la gripe, la rabia, el zika, etc. Han sido incluso más numerosos los ensayos clínicos de vacunas ARN contra el cáncer de próstata, el de mama, melanoma, gliobastoma, ovarios, páncreas...

En general, estos resultados sugieren que las vacunas de ARNm son seguras y razonablemente bien toleradas.

La mayor preocupación con este tipo de vacunas, más que su seguridad, ha sido su inestabilidad, su baja eficiencia para introducirlas en las células y que expresen el antígeno. También ha preocupado el hecho de que el ARN puede estimular reacciones inmunológicas de tipo inflamatorio, por lo que todos estos factores han limitado en parte su desarrollo. El ARN es una molécula muy inestable que requiere condiciones de mantenimiento extremas (de menos 80℃), se degrada muy fácilmente por enzimas y no se internaliza de forma eficiente.

Ensayos clínicos con vacunas de ARN mensajero contra enfermedades infecciosas.

Ensayos clínicos con vacunas de ARN mensajero contra enfermedades infecciosas.

Foto: NCBI / 'mRNA vaccines — a new era in vaccinology', por N Pardi,M. J. Hogan, F. W. Porter, y D. Weissman

Sin embargo, esta tecnología también tiene ventajas y no son pocas. Es relativamente más barata que otro tipo de vacunas y, sobre todo, permite diseñar una vacuna nueva en un tiempo récord. Una vez que se conoce el genoma del patógeno, en unas semanas se pueden producir los primeros prototipos vacunales, lo que la convierte en una excelente herramienta cuando aparece un patógeno nuevo para el que se necesita una vacuna con urgencia, como en una pandemia. En este caso, la rapidez es un beneficio mayor que el problema de su inestabilidad. Moderna fue capaz de diseñar su vacuna de ARNm contra SARS-CoV-2 tan solo seis semanas después de que el genoma del virus se hiciera público.

Además, el proceso de fabricación no requiere emplear sustancias químicas tóxicas, ni cultivos celulares que se pueden contaminar con otros virus o microorganismos, su fabricación es rápida y fácil, requiere poca manipulación con lo que se minimiza el riesgo de posibles contaminantes.

El ARNm no se integra en el ADN, por lo que las vacunas ARNm se consideran potencialmente muy seguras.

Otra ventaja es que el mismo ARN tiene cierto efecto inmunomodulador, por lo que actúan como adyuvante, estimulando de forma inespecífica el sistema inmune. Pero, ¿son realmente eficaces este tipo de vacunas?

Cómo funciona el ARNm dentro de una célula

La información genética se encuentra codificada en el ADN en el núcleo de la célula, en forma de una secuencia de nucleótidos. En el núcleo, el ADN transfiere esa información a la molécula de ARN en un proceso que se denomina transcripción: la secuencia de ADN se copia en forma de ARN.

El ARN sale del núcleo al citoplasma de la célula donde se encuentra con los ribosomas, que son los encargados de traducir esa información codificada en el ARN en una proteína.

Así, la información genética del ADN acaba en una proteína a través del ARN, que actúa como una molécula intermedia, como mensajero, entre ambos. El ARNm no entra en el núcleo celular, tiene una vida media muy corta y es rápidamente degradado. Por eso, para que la síntesis de proteínas continúe, se debe producir ARNm de forma continua.

¿Cómo es una vacuna de ARNm?

La vacuna de ARNm de Pfizer/BioNtech se basa en el genoma del coronavirus, en concreto en el gen que codifica para la proteína S (la glicoproteína de la envoltura del virus que actúa como la llave que se une al receptor de la célula). Pero esa molécula no es un trozo del ARN del virus cualquiera, esa secuencia se ha modificado para aumentar su estabilidad y facilitar que la célula sea capaz de leerla, traducirla y sintetizar la proteína viral.

Como solo se utiliza un fragmento de ARN, este tipo de vacunas no pueden causar la enfermedad

Entre las modificaciones más importantes están:

  1. La sustitución del nucleósido uridina por el derivado natural metil-pseudouridina. Esta modificación es quizá la más importante, no cambia la información genética (es la misma secuencia), sino la estructura química y hace que la molécula sea mucho menos inmunoreactiva e inflamatoria (menos tóxica).
  2. Se han optimizado los codones (a cada codón le corresponde un aminoácido) para que sean traducidos más fácilmente por las células humanas.
  3. Se han protegido los extremos del fragmento del ARN, añadiendo una estructura CAP en el extremo 5´ y una cola de poliadeninas en el extremo 3´, características de todos los ARNm.
  4. Se han añadido secuencias reguladoras no traducidas (UTR) en ambos extremos.
  5. Se añade un nuevo codón de terminación y otras secuencias que estabilizan la molécula y facilitan la traducción por la maquinaria de síntesis de proteínas de las células humanas.
  6. Se ha incluido un par de mutaciones en la secuencia del gen que codifica para la proteína S, que resultan en el cambio de una lisina por una prolina en la posición 986 de la proteína y de una valina por una prolina en la posición 987. De esta forma se produce un cambio en la conformación de la proteína que proporciona una antigenicidad mejor.

Para facilitar que esta molécula sea transportada al interior de las células, va encapsulada en una nanopartícula lipídica que se fusionará con la membrana de la célula. Algunos de los lípidos que forman estas nanopartículas son derivados del polietilenglicol, fosfolípidos, colesterol y otros.

Algunos de estos componente lipídicos son los que pueden causar una reacción alérgica grave en algunas personas, por lo que no está recomendada la vacunación en ellas.

¿Cómo funciona la vacuna de ARNm?

La vacuna se administra por vía intramuscular, donde las nanopartículas lipídicas se fusionan con la membrana de las células musculares y liberan las cadenas de ARNm en el citoplasma. Estas son reconocidas por los ribosomas y por toda la maquinaria enzimática de la célula y sintetizan la proteína S del virus. Es como si a la célula se le hubiera dado el libro de instrucciones (ARNm) para que ella misma sintetizara la proteína del virus.

La proteína vírica se expondrá en la superficie de la célula y estimulará la respuesta inmune. Se producirá así una potente respuesta de anticuerpos neutralizantes que reaccionan contra varias partes de la proteína S (por eso, la aparición de variantes genéticas con mutaciones puntuales en el gen de la proteína S es probable que no afecten a la eficacia de las vacunas), y una respuesta celular.

Esta ha sido la primera vez que una vacuna de ARNm ha llegado a fase clínica III, por lo que había dudas de que esta tecnología fuera realmente eficaz.

El ensayo clínico incluyó alrededor de 44.000 voluntarios mayores de 16 años, de los que la mitad recibió la vacuna y la otra mitad placebo; en ambos casos desconocían de cuál de las dos opciones se trataba. De todos ellos, 36.523 voluntarios no presentaban signos previos de infección.

Se presentaron 44.000 voluntarios mayores de 16 años al ensayo clínico, donde la vacuna obtuvo una eficacia del 95% contra el virus.

Se presentaron 44.000 voluntarios mayores de 16 años al ensayo clínico, donde la vacuna obtuvo una eficacia del 95% contra el virus.

Foto: iStock

Al cabo de unos meses, 170 presentaron síntomas de COVID-19: 8 de las 18.198 personas que recibieron la vacuna y 162 de las 18.325 que recibieron la inyección de placebo. Esto significa que la vacuna mostró una eficacia del 95% en el ensayo clínico. Una eficacia tan alta ya es espectacular para una vacuna, pero en el caso de esta tecnología ARNm quizá era menos esperada, por lo que fue una noticia tan importante y hay tanta esperanza en este tipo de vacunas.

¿Son seguras estas vacunas?

Según se indica en la ficha técnica de la vacuna, es un medicamento sujeto a un seguimiento adicional. Su aprobación ha sido condicional porque no hay que olvidar la situación de emergencia sanitaria internacional: la pandemia ya costó más de 1.800.000 muertes solo durante el año 2020.

La seguridad se ha evaluado en 21.744 participantes en las fases clínicas que recibieron al menos una dosis. Al igual que todas las vacunas, puede producir efectos adversos leves, aunque no todas las personas los sufran. La mayoría de estos efectos leves son debidos a que la vacuna funciona y estimula el sistema inmune.

  • Efectos adversos leves muy frecuentes (más de 1 de cada 10 personas): dolor e hinchazón en el lugar de inyección, cansancio, dolor de cabeza, muscular, en las articulaciones, escalofríos y fiebre.
  • Efectos frecuentes (hasta 1 de cada 10 personas): enrojecimiento en el lugar de inyección y náuseas.
  • Efectos poco frecuentes (hasta 1 de cada 100 personas): aumento de tamaño de los ganglios linfáticos, malestar, dolor en la extremidad, insomnio, picor en el lugar de inyección.
  • Efectos raros (hasta 1 de cada 1.000 personas): parálisis temporal de un lado de la cara.
  • Frecuencia no conocida: reacción alérgica grave.

Todos los medicamentos tienen efectos secundarios y suponen un riesgo. Sobre todo, sal tener en cuenta que cada uno puede responder de manera distinta (por eso es tan importante la medicina personalizada). Tampoco hay ningún indicio de que estas vacunas supongan un riesgo para la fertilidad. Se han realizado experimentos en animales y no se han observaron efectos relacionados en la fertilidad femenina, la gestación ni el desarrollo embrionario, fetal o de las crías.

¿Pueden modificar nuestro genoma?

Se ha dicho que estas vacunas basadas en ARNm pueden modificar las funciones del genoma humano y causar daños desconocidos e irreparables. Sin embargo, lo cierto es que no hay ningún dato que sugiera que este tipo de vacunas pueda alterar nuestro ADN. La infección natural con coronavirus también produce millones de ARNm y no supone ningún riesgo para el ADN. De hecho, jamás se ha detectado un gen de un coronavirus insertado en nuestro genoma.

La molécula de ARN es muy frágil, el tiempo que permanece en las células es muy corto y desaparece fácilmente.

Además, el ARN no llega a encontrarse con el ADN: el ADN se encuentra en el núcleo de la célula y el ARNm en el citoplasma. El núcleo de la célula está rodeado de una membrana lipídica con poros por donde pueden atravesar algunas moléculas. Es cierto que algunos ARN pueden viajar al núcleo. Por ejemplo, algunos virus como el de la gripe contienen un genoma ARN que viaja hasta el núcleo de la célula, pero para eso deben asociarse a proteínas especificas con unas secuencias de aminoácidos concretas (denominadas secuencias de localización nuclear) que introducen el ARN en el núcleo.

El genoma de los coronavirus o el ARNm de la vacuna no entra de forma espontánea al núcleo, porque no se asocia a estas proteínas transportadoras.

En el caso hipotético de que entrara en el núcleo para integrarse en el ADN, el ARN debería convertirse antes en ADN a través de una enzima denominada retrotranscriptasa. Solo los retrovirus y los hepadnavirus (como el virus de la hepatitis B) tiene este tipo de enzimas y son capaces de hacerlo. Si no tienen esa enzima, no pueden integrarse en el ADN.

Pero existe otra posibilidad: el ADN nuclear contiene un tipo de secuencias genéticas móviles que pueden copiarse a sí mismas y pegarse en otras partes del genoma, denominadas retrotransposones. Estos "genes saltarines" son muy abundantes y alrededor de 42 % del genoma humano está compuesto de este tipo de elementos.

Estos retrotransposones, antes de integrarse en otro sitio del genoma, primero se convierten en ARN y después vuelven a transformarse en ADN mediante la enzima retrotranscriptasa que ellos mismos sintetizan. ¿Podría ser posible que el ARNm de la vacuna viajara al núcleo, se convirtiera en ADN y se integrara en él usando la retrotranscriptasa de estos elementos genéticos endógenos?

Para que actúe la retrotranscriptasa son necesarias unas secuencias específicas que no se encuentran en el ARN de la vacuna. Cualquier ARN que se encuentre con una retrotranscriptasa no va a convertirse en ADN, por lo que la posibilidad de que esto ocurra es prácticamente nula.

Por último, en el hipotético caso de que el ARN de la vacuna se integrara en el genoma de una de nuestras células musculares, el efecto biológico en nuestro organismo probablemente sería nulo.

Las vacunas de ARN no modifican nuestro genoma porque no afectan a nuestras células germinales o gametos.

En resumen, no hay ninguna evidencia científica en base a lo que conocemos sobre biología molecular que indique que el ARNm usado en las vacunas frente a la COVID-19 pueda tener la capacidad de alterar nuestro genoma.

Quedan preguntas pendientes

No se ha evaluado la eficacia, la seguridad ni la inmunogenicidad de la vacuna de ARNm de Pfizer/BioNtech en personas inmunodeprimidas, incluidas aquellas que estén recibiendo tratamiento inmunosupresor, ni en menores de 16 años. Se desconoce la duración de la protección proporcionada por la vacuna.

Como con cualquier vacuna, puede no proteger a todas las personas que la reciban. No se han realizado estudios de interacciones con otros medicamentos o con otras vacunas. La experiencia en mujeres embarazadas es limitada y se desconoce si se excreta en la leche materna. El impacto de la vacunación en la propagación del virus a nivel comunitario se desconoce todavía. No se sabe aún en qué grado las personas vacunadas pueden ser portadoras del virus y propagarlo.

Es verdad que todavía no hay datos de posibles efectos a largo plazo, sencillamente porque no ha dado tiempo. Por todo esto, ahora comienza lo que se denomina la fase IV de farmacovigilancia en la quese sigue evaluando la seguridad (posibles efectos secundarios muy poco frecuentes que es imposible detectar con miles de voluntarios pero que se ponen de manifiesto cuando se prueba en millones de personas) y su efectividad (si realmente funciona en el control de la epidemia).

No sería extraño que, como ocurre con otros medicamentos, alguna vacuna pueda llegar a retirarse del mercado si se detecta que no es segura o efectiva.

Hay que recordar que las agencias evaluadoras valoran también el riesgo-beneficio: el beneficio de la vacuna debe ser razonablemente mayor que el riesgo del coronavirus. Uno debería valorar qué prefiere: más de 74.000 muertos que está dejando el coronavirus en España y sus efectos colaterales o algún posible efecto secundario grave por la vacuna.

La probabilidad de contagio con SARS-CoV-2, desarrollemos la enfermedad y tenga consecuencias graves e incluso mortales, además de contagiar a otros, es mayor que los posibles efectos secundarios que pueda tener la vacuna.

El virus es silencioso y peligroso y la población no está previamente inmunizada, se transmite por el aire vía aerosoles, puede ser transmitido por personas antes de presentar los síntomas e incluso por personas que nunca manifestarán síntomas y cuya dosis infectiva probablemente sea muy baja.

En 2020, este virus ha causado más de 74.000 muertos solo en España, se han cerrado colegios y universidades, ha destrozado miles de empleos y hundido la economía, modificando las costumbres más arraigadas. Miles de personas han perdido a sus seres queridos sin poder siquiera despedirse. Se pueden esperar varios años mientras se sigan ensayando las vacunas y analizando su efecto a muy largo plazo, pero no parece lo más razonable.

La tecnología de ARNm, una nueva revolución en biomedicina

Si durante los próximas meses se confirma la seguridad a largo plazo y la efectividad de las vacunas ARNm para controlar la pandemia, es posible augurar una nueva revolución en la biomedicina. Se podrán diseñar y optimizar nuevas vacunas en un ordenador, fabricarlas bajo demanda en un tiempo récord y a bajo coste.

Se podrán diseñar vacunas múltiples contra varios patógenos al mismo tiempo, en una sola preparación. De este modo, la preparación ante una posible nueva pandemia sería mucho mejor y más rápida y se podrá avanzar hacia tratamientos personalizados contra otras enfermedades como el cáncer. Es una tecnología que puede cambiar la medicina actual, un mensaje de esperanza.

Guía para desmentir 24 bulos sobre la vacuna de COVID-19

Más información

Guía para desmentir 24 bulos sobre la vacuna de COVID-19

*Ignacio López-Goñi es Catedrático de Microbiología en la Universidad de Navarra. Esta nota apareció originalmente en The Conversation y se publica aquí bajo una licencia de Creative Commons.


Así funcionan las vacunas de ARN mensajero 

https://www.nationalgeographic.com.es/ciencia/asi-funcionan-vacunas-arn-mensajero_1622

La ciencia que hay detrás de la primera vacuna contra la COVID-19

Por Lluis Montoliu

 

La vacuna COVID-19 desarrollada por las empresas Pfizer/BioNtech tiene el nombre genérico de Tozinameran (en la International Nonproprietary Names for Pharmaceutical Substances, INN), el nombre comercial de Comirnaty, y el nombre técnico de BNT162b2.

El haber conseguido desarrollar, evaluar y aprobar la vacuna COVID-19 en menos de un año es un triunfo rotundo de la ciencia. Se trata de la primera vacuna autorizada que usa una tecnología distinta: basada en ARN. Y el éxito que vemos ahora es producto tanto de la ciencia básica que lleva investigando sobre vacunas basadas en ARN desde hace muchos años, como de la ciencia aplicada, cuando se invierten recursos formidables, nunca antes movilizados, para reducir el tiempo de evaluación de los ensayos clínicos, aumentando el número de voluntarios involucrados.

La proteína S (de la espícula, en rojo) decora toda la corona del virus SARS-CoV-2 y es la que se ha usado (en forma de ARN) en la primera vacuna aprobada contra la COVID-19 desarrollada por las empresas Pfizer/BioNtech.

El funcionamiento de estas vacunas, basadas en ARN es simple, pero efectivo. El ARN (ácido ribonucleico) es la molécula intermediaria que transporta la información genética entre el ADN (ácido desoxirribonucleico), que está en el núcleo de la célula, y la síntesis de proteínas, que ocurre fuera del núcleo, en el citoplasma de la célula. Se trata de una molécula de ARN mensajero (mRNA) que porta la información codificada para fabricar una de las proteínas del coronavirus SARS-CoV-2, la glicoproteína S (del inglés spike, de la espícula de la corona del virus). Combinada con una mezcla de lípidos se autoorganiza como una nanogota de grasa que envuelve a la molécula de ARN y que es capaz de penetrar en el interior de las células y, una vez en el citoplasma, la información genética que transporta se traduce en forma de la proteína S codificada, usando la maquinaria ribosomal de síntesis de proteínas que tenemos en todas nuestras células. Esa proteína S así fabricada, y fragmentos de la misma, procesados por las enzimas proteasas celulares, son los que acaban exponiéndose en la superficie de la célula vacunada e inducen la respuesta de nuestro sistema inmunitario, que reconoce a estas proteínas como extrañas, no propias, y desata la producción de anticuerpos y de linfocitos contra ella. Se trata de una respuesta policlonal, contra diferentes partes de la proteína S, lo cual garantiza que aunque aparezcan nuevas mutaciones en esta proteína S siempre habrá otras partes de la misma que seguirán siendo diana de la respuesta inmunitaria. Una vez activado el sistema inmunitario por la vacuna COVID-19 la próxima vez que la persona vacunada se vea expuesta al coronavirus SARS-CoV-2 nuestro sistema inmunitario reconocerá la proteína S de su superficie, recordará que tiene anticuerpos y linfocitos contra ella, aumentará la producción de todos ellos y conseguirá inactivar al coronavirus, impidiendo que la infección progrese. Simple pero efectivo. Las estupendas infografías preparadas por los periódicos The New York Times y Materia/El País ilustran perfectamente todo este proceso.

Hasta aquí lo que generalmente sabemos y leemos sobre esta primera vacuna contra la COVID-19. Pero:

  • ¿Qué sabemos de la ciencia que hay detrás de ella?
  • ¿Cuál es la secuencia genética de ARN que se utiliza exactamente?
  • ¿Tiene alguna modificación en relación a la secuencia conocida del coronavirus SARS-CoV-2?
  • ¿Cómo garantizar que el mRNA llegue al interior de las células y se traduzca eficazmente?
  • ¿Cuáles son los lípidos que se usan para mezclarlos con el ARN para constituir la vacuna?

Veamos a continuación todos estos detalles, principalmente los relacionados con la genética de esta primera vacuna contra la COVID-19.

Según el informe de evaluación realizado por la EMA el ARN de la vacuna Comirnaty (Pfizer/BioNtech) se ha preparado a partir de la secuencia de ARN del genoma original del coronavirus SARS-CoV-2, aislado de Wuhan-Hu-1, cuya secuencia completa de 29,903 ribonucleótidos de ARN de cadena sencilla se depositó en GenBank (MN908947.3) y cuya secuencia de aminoácidos codificados de la glicoproteína S corresponde a QHD43416.1.

Mapa del genoma ARN del coronavirus SARS-CoV-2 convertido a ADN, tal y como está almacenado en la base de datos GenBank referencia: MN908947.3. Se indica (en verde) la posición relativa de la secuencia que codifica la glicoproteína S y distintos enzimas de retricción. Mapa obtenido con SnapGene.

A continuación muestro la secuencia original de 3822 ribonucleótidos de ARN de cadena sencilla (ssRNA) que corresponde a la secuencia codificada para la glicoproteína S, en las coordenadas 21563 a 25384, de la secuencia de referencia MN908947.3. Al tratarse de ARN las cuatro bases nitrogenadas son la A, C, G y la U (uracilo), que substituye a la T del ADN.

RNA sequence encoding surface glycoprotein "S" (3,822 ssRNA) Coordinates: 21563..25384
AUGUUUGUUUUUCUUGUUUUAUUGCCACUAGUCUCUAGUCAGUGUGUUAAUCUUACAACCAGAACUCAAUUACCCCCUGCAUACACUAAUUCUUUCACA
CGUGGUGUUUAUUACCCUGACAAAGUUUUCAGAUCCUCAGUUUUACAUUCAACUCAGGACUUGUUCUUACCUUUCUUUUCCAAUGUUACUUGGUUCCAU
GCUAUACAUGUCUCUGGGACCAAUGGUACUAAGAGGUUUGAUAACCCUGUCCUACCAUUUAAUGAUGGUGUUUAUUUUGCUUCCACUGAGAAGUCUAAC
AUAAUAAGAGGCUGGAUUUUUGGUACUACUUUAGAUUCGAAGACCCAGUCCCUACUUAUUGUUAAUAACGCUACUAAUGUUGUUAUUAAAGUCUGUGAA
UUUCAAUUUUGUAAUGAUCCAUUUUUGGGUGUUUAUUACCACAAAAACAACAAAAGUUGGAUGGAAAGUGAGUUCAGAGUUUAUUCUAGUGCGAAUAAU
UGCACUUUUGAAUAUGUCUCUCAGCCUUUUCUUAUGGACCUUGAAGGAAAACAGGGUAAUUUCAAAAAUCUUAGGGAAUUUGUGUUUAAGAAUAUUGAU
GGUUAUUUUAAAAUAUAUUCUAAGCACACGCCUAUUAAUUUAGUGCGUGAUCUCCCUCAGGGUUUUUCGGCUUUAGAACCAUUGGUAGAUUUGCCAAUA
GGUAUUAACAUCACUAGGUUUCAAACUUUACUUGCUUUACAUAGAAGUUAUUUGACUCCUGGUGAUUCUUCUUCAGGUUGGACAGCUGGUGCUGCAGCU
UAUUAUGUGGGUUAUCUUCAACCUAGGACUUUUCUAUUAAAAUAUAAUGAAAAUGGAACCAUUACAGAUGCUGUAGACUGUGCACUUGACCCUCUCUCA
GAAACAAAGUGUACGUUGAAAUCCUUCACUGUAGAAAAAGGAAUCUAUCAAACUUCUAACUUUAGAGUCCAACCAACAGAAUCUAUUGUUAGAUUUCCU
AAUAUUACAAACUUGUGCCCUUUUGGUGAAGUUUUUAACGCCACCAGAUUUGCAUCUGUUUAUGCUUGGAACAGGAAGAGAAUCAGCAACUGUGUUGCU
GAUUAUUCUGUCCUAUAUAAUUCCGCAUCAUUUUCCACUUUUAAGUGUUAUGGAGUGUCUCCUACUAAAUUAAAUGAUCUCUGCUUUACUAAUGUCUAU
GCAGAUUCAUUUGUAAUUAGAGGUGAUGAAGUCAGACAAAUCGCUCCAGGGCAAACUGGAAAGAUUGCUGAUUAUAAUUAUAAAUUACCAGAUGAUUUU
ACAGGCUGCGUUAUAGCUUGGAAUUCUAACAAUCUUGAUUCUAAGGUUGGUGGUAAUUAUAAUUACCUGUAUAGAUUGUUUAGGAAGUCUAAUCUCAAA
CCUUUUGAGAGAGAUAUUUCAACUGAAAUCUAUCAGGCCGGUAGCACACCUUGUAAUGGUGUUGAAGGUUUUAAUUGUUACUUUCCUUUACAAUCAUAU
GGUUUCCAACCCACUAAUGGUGUUGGUUACCAACCAUACAGAGUAGUAGUACUUUCUUUUGAACUUCUACAUGCACCAGCAACUGUUUGUGGACCUAAA
AAGUCUACUAAUUUGGUUAAAAACAAAUGUGUCAAUUUCAACUUCAAUGGUUUAACAGGCACAGGUGUUCUUACUGAGUCUAACAAAAAGUUUCUGCCU
UUCCAACAAUUUGGCAGAGACAUUGCUGACACUACUGAUGCUGUCCGUGAUCCACAGACACUUGAGAUUCUUGACAUUACACCAUGUUCUUUUGGUGGU
GUCAGUGUUAUAACACCAGGAACAAAUACUUCUAACCAGGUUGCUGUUCUUUAUCAGGAUGUUAACUGCACAGAAGUCCCUGUUGCUAUUCAUGCAGAU
CAACUUACUCCUACUUGGCGUGUUUAUUCUACAGGUUCUAAUGUUUUUCAAACACGUGCAGGCUGUUUAAUAGGGGCUGAACAUGUCAACAACUCAUAU
GAGUGUGACAUACCCAUUGGUGCAGGUAUAUGCGCUAGUUAUCAGACUCAGACUAAUUCUCCUCGGCGGGCACGUAGUGUAGCUAGUCAAUCCAUCAUU
GCCUACACUAUGUCACUUGGUGCAGAAAAUUCAGUUGCUUACUCUAAUAACUCUAUUGCCAUACCCACAAAUUUUACUAUUAGUGUUACCACAGAAAUU
CUACCAGUGUCUAUGACCAAGACAUCAGUAGAUUGUACAAUGUACAUUUGUGGUGAUUCAACUGAAUGCAGCAAUCUUUUGUUGCAAUAUGGCAGUUUU
UGUACACAAUUAAACCGUGCUUUAACUGGAAUAGCUGUUGAACAAGACAAAAACACCCAAGAAGUUUUUGCACAAGUCAAACAAAUUUACAAAACACCA
CCAAUUAAAGAUUUUGGUGGUUUUAAUUUUUCACAAAUAUUACCAGAUCCAUCAAAACCAAGCAAGAGGUCAUUUAUUGAAGAUCUACUUUUCAACAAA
GUGACACUUGCAGAUGCUGGCUUCAUCAAACAAUAUGGUGAUUGCCUUGGUGAUAUUGCUGCUAGAGACCUCAUUUGUGCACAAAAGUUUAACGGCCUU
ACUGUUUUGCCACCUUUGCUCACAGAUGAAAUGAUUGCUCAAUACACUUCUGCACUGUUAGCGGGUACAAUCACUUCUGGUUGGACCUUUGGUGCAGGU
GCUGCAUUACAAAUACCAUUUGCUAUGCAAAUGGCUUAUAGGUUUAAUGGUAUUGGAGUUACACAGAAUGUUCUCUAUGAGAACCAAAAAUUGAUUGCC
AACCAAUUUAAUAGUGCUAUUGGCAAAAUUCAAGACUCACUUUCUUCCACAGCAAGUGCACUUGGAAAACUUCAAGAUGUGGUCAACCAAAAUGCACAA
GCUUUAAACACGCUUGUUAAACAACUUAGCUCCAAUUUUGGUGCAAUUUCAAGUGUUUUAAAUGAUAUCCUUUCACGUCUUGACAAAGUUGAGGCUGAA
GUGCAAAUUGAUAGGUUGAUCACAGGCAGACUUCAAAGUUUGCAGACAUAUGUGACUCAACAAUUAAUUAGAGCUGCAGAAAUCAGAGCUUCUGCUAAU
CUUGCUGCUACUAAAAUGUCAGAGUGUGUACUUGGACAAUCAAAAAGAGUUGAUUUUUGUGGAAAGGGCUAUCAUCUUAUGUCCUUCCCUCAGUCAGCA
CCUCAUGGUGUAGUCUUCUUGCAUGUGACUUAUGUCCCUGCACAAGAAAAGAACUUCACAACUGCUCCUGCCAUUUGUCAUGAUGGAAAAGCACACUUU
CCUCGUGAAGGUGUCUUUGUUUCAAAUGGCACACACUGGUUUGUAACACAAAGGAAUUUUUAUGAACCACAAAUCAUUACUACAGACAACACAUUUGUG
UCUGGUAACUGUGAUGUUGUAAUAGGAAUUGUCAACAACACAGUUUAUGAUCCUUUGCAACCUGAAUUAGACUCAUUCAAGGAGGAGUUAGAUAAAUAU
UUUAAGAAUCAUACAUCACCAGAUGUUGAUUUAGGUGACAUCUCUGGCAUUAAUGCUUCAGUUGUAAACAUUCAAAAAGAAAUUGACCGCCUCAAUGAG
GUUGCCAAGAAUUUAAAUGAAUCUCUCAUCGAUCUCCAAGAACUUGGAAAGUAUGAGCAGUAUAUAAAAUGGCCAUGGUACAUUUGGCUAGGUUUUAUA
GCUGGCUUGAUUGCCAUAGUAAUGGUGACAAUUAUGCUUUGCUGUAUGACCAGUUGCUGUAGUUGUCUCAAGGGCUGUUGUUCUUGUGGAUCCUGCUGC
AAAUUUGAUGAAGACGACUCUGAGCCAGUGCUCAAAGGAGUCAAAUUACAUUACACAUAA

A continuación muestro la secuencia original de 1273 aminoácidos codificados para la glicoproteína S de la secuencia de referencia QHD43416.1. Los aminoácidos K (lisina) y V (valina) en las posiciones 986 y 987 están resaltados en azul e indican las dos posiciones que se mutaron a P (prolina) en la secuencia final del mRNA utilizado, para bloquear la conformación de la proteína S en el estado prefusión con el receptor, con una antigenicidad óptima, de acuerdo a los estudios estructurales realizados por Wrapp y col. (2020).

>QHD43416.1 surface glycoprotein [Severe acute respiratory syndrome coronavirus 2] 1273 aminoacides
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSN
IIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNID
GYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLS
ETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVY
ADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSY
GFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGG
VSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSII
AYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTP
PIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAG
AALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAE
VQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHF
PREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNE
VAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT

En principio alguien podría pensar que ya estaría. Se sintetiza esa molécula de ARN y ya se puede mezclar con los lípidos para generar la vacuna. En realidad no es así. Hacen falta todavía muchas modificaciones para que un fragmento de ARN de la secuencia original que codifica la glicoproteína S se convierta en la vacuna Comirnaty desarrollada por Pfizer/BioNtech y aprobada por la FDA y la EMA.

Para empezar, si usáramos esa molécula de ARN tal cual induciríamos una respuesta celular inmunogénica innata (la célula interpretaría ese ARN como un ARN foráneo) mediada por los receptores de membrana Toll-like TLR3, TLR7 y TLR8 y por los receptores citoplasmáticos inducibles por ácido retinoico RIA, que incrementa los niveles circulantes de Interferón-alfa y que montarían una respuesta inmune contra ese ARN, lo cual sería peligroso y tornaría a la estrategia en inútil para usarla como vacuna. Afortunadamente, la investigación básica realizada anteriormente por Kariko y col. (2008) y por Durbin y col. (2016), entre otros trabajos, demostraron que el uso de nucleósidos modificados existentes en la naturaleza como la pseudouridina o la 1-metil-3′-pseudouridina no inducen esa respuesta inmunogénica contra el ARN. Posteriormente también se comprobó que la 1-metil-3′-pseudouridina, además de todo lo anterior, también aumentaba la capacidad de traducción, gracias a el trabajo de Svitkin et al. (2017), en el que también colaboraron investigadores de la empresa Moderna Therapeutics, la otra empresa que también ha desarrollado otra vacuna COVID-19 basada en ARN, y que también ya ha sido autorizada por la FDA. Por esta razón los investigadores de BioNtech decidieron cambiar todas las uridinas (U) del ARN por 1-metil-3′-pseudouridina (Ψ). Por lo tanto la secuencia original de ARN que codifica la glicoproteína S se convierte en principio a la siguiente:

RNA sequence encoding surface glycoprotein "S" using ᴪ instead of U
AΨGΨΨΨGΨΨΨΨΨCΨΨGΨΨΨΨAΨΨGCCACΨAGΨCΨCΨAGΨCAGΨGΨGΨΨAAΨCΨΨACAACCAGAACΨCAAΨΨACCCCCΨGCAΨACACΨAAΨΨCΨΨΨCACA
CGΨGGΨGΨΨΨAΨΨACCCΨGACAAAGΨΨΨΨCAGAΨCCΨCAGΨΨΨΨACAΨΨCAACΨCAGGACΨΨGΨΨCΨΨACCΨΨΨCΨΨΨΨCCAAΨGΨΨACΨΨGGΨΨCCAΨ
GCΨAΨACAΨGΨCΨCΨGGGACCAAΨGGΨACΨAAGAGGΨΨΨGAΨAACCCΨGΨCCΨACCAΨΨΨAAΨGAΨGGΨGΨΨΨAΨΨΨΨGCΨΨCCACΨGAGAAGΨCΨAAC
AΨAAΨAAGAGGCΨGGAΨΨΨΨΨGGΨACΨACΨΨΨAGAΨΨCGAAGACCCAGΨCCCΨACΨΨAΨΨGΨΨAAΨAACGCΨACΨAAΨGΨΨGΨΨAΨΨAAAGΨCΨGΨGAA
ΨΨΨCAAΨΨΨΨGΨAAΨGAΨCCAΨΨΨΨΨGGGΨGΨΨΨAΨΨACCACAAAAACAACAAAAGΨΨGGAΨGGAAAGΨGAGΨΨCAGAGΨΨΨAΨΨCΨAGΨGCGAAΨAAΨ
ΨGCACΨΨΨΨGAAΨAΨGΨCΨCΨCAGCCΨΨΨΨCΨΨAΨGGACCΨΨGAAGGAAAACAGGGΨAAΨΨΨCAAAAAΨCΨΨAGGGAAΨΨΨGΨGΨΨΨAAGAAΨAΨΨGAΨ
GGΨΨAΨΨΨΨAAAAΨAΨAΨΨCΨAAGCACACGCCΨAΨΨAAΨΨΨAGΨGCGΨGAΨCΨCCCΨCAGGGΨΨΨΨΨCGGCΨΨΨAGAACCAΨΨGGΨAGAΨΨΨGCCAAΨA
GGΨAΨΨAACAΨCACΨAGGΨΨΨCAAACΨΨΨACΨΨGCΨΨΨACAΨAGAAGΨΨAΨΨΨGACΨCCΨGGΨGAΨΨCΨΨCΨΨCAGGΨΨGGACAGCΨGGΨGCΨGCAGCΨ
ΨAΨΨAΨGΨGGGΨΨAΨCΨΨCAACCΨAGGACΨΨΨΨCΨAΨΨAAAAΨAΨAAΨGAAAAΨGGAACCAΨΨACAGAΨGCΨGΨAGACΨGΨGCACΨΨGACCCΨCΨCΨCA
GAAACAAAGΨGΨACGΨΨGAAAΨCCΨΨCACΨGΨAGAAAAAGGAAΨCΨAΨCAAACΨΨCΨAACΨΨΨAGAGΨCCAACCAACAGAAΨCΨAΨΨGΨΨAGAΨΨΨCCΨ
AAΨAΨΨACAAACΨΨGΨGCCCΨΨΨΨGGΨGAAGΨΨΨΨΨAACGCCACCAGAΨΨΨGCAΨCΨGΨΨΨAΨGCΨΨGGAACAGGAAGAGAAΨCAGCAACΨGΨGΨΨGCΨ
GAΨΨAΨΨCΨGΨCCΨAΨAΨAAΨΨCCGCAΨCAΨΨΨΨCCACΨΨΨΨAAGΨGΨΨAΨGGAGΨGΨCΨCCΨACΨAAAΨΨAAAΨGAΨCΨCΨGCΨΨΨACΨAAΨGΨCΨAΨ
GCAGAΨΨCAΨΨΨGΨAAΨΨAGAGGΨGAΨGAAGΨCAGACAAAΨCGCΨCCAGGGCAAACΨGGAAAGAΨΨGCΨGAΨΨAΨAAΨΨAΨAAAΨΨACCAGAΨGAΨΨΨΨ
ACAGGCΨGCGΨΨAΨAGCΨΨGGAAΨΨCΨAACAAΨCΨΨGAΨΨCΨAAGGΨΨGGΨGGΨAAΨΨAΨAAΨΨACCΨGΨAΨAGAΨΨGΨΨΨAGGAAGΨCΨAAΨCΨCAAA
CCΨΨΨΨGAGAGAGAΨAΨΨΨCAACΨGAAAΨCΨAΨCAGGCCGGΨAGCACACCΨΨGΨAAΨGGΨGΨΨGAAGGΨΨΨΨAAΨΨGΨΨACΨΨΨCCΨΨΨACAAΨCAΨAΨ
GGΨΨΨCCAACCCACΨAAΨGGΨGΨΨGGΨΨACCAACCAΨACAGAGΨAGΨAGΨACΨΨΨCΨΨΨΨGAACΨΨCΨACAΨGCACCAGCAACΨGΨΨΨGΨGGACCΨAAA
AAGΨCΨACΨAAΨΨΨGGΨΨAAAAACAAAΨGΨGΨCAAΨΨΨCAACΨΨCAAΨGGΨΨΨAACAGGCACAGGΨGΨΨCΨΨACΨGAGΨCΨAACAAAAAGΨΨΨCΨGCCΨ
ΨΨCCAACAAΨΨΨGGCAGAGACAΨΨGCΨGACACΨACΨGAΨGCΨGΨCCGΨGAΨCCACAGACACΨΨGAGAΨΨCΨΨGACAΨΨACACCAΨGΨΨCΨΨΨΨGGΨGGΨ
GΨCAGΨGΨΨAΨAACACCAGGAACAAAΨACΨΨCΨAACCAGGΨΨGCΨGΨΨCΨΨΨAΨCAGGAΨGΨΨAACΨGCACAGAAGΨCCCΨGΨΨGCΨAΨΨCAΨGCAGAΨ
CAACΨΨACΨCCΨACΨΨGGCGΨGΨΨΨAΨΨCΨACAGGΨΨCΨAAΨGΨΨΨΨΨCAAACACGΨGCAGGCΨGΨΨΨAAΨAGGGGCΨGAACAΨGΨCAACAACΨCAΨAΨ
GAGΨGΨGACAΨACCCAΨΨGGΨGCAGGΨAΨAΨGCGCΨAGΨΨAΨCAGACΨCAGACΨAAΨΨCΨCCΨCGGCGGGCACGΨAGΨGΨAGCΨAGΨCAAΨCCAΨCAΨΨ
GCCΨACACΨAΨGΨCACΨΨGGΨGCAGAAAAΨΨCAGΨΨGCΨΨACΨCΨAAΨAACΨCΨAΨΨGCCAΨACCCACAAAΨΨΨΨACΨAΨΨAGΨGΨΨACCACAGAAAΨΨ
CΨACCAGΨGΨCΨAΨGACCAAGACAΨCAGΨAGAΨΨGΨACAAΨGΨACAΨΨΨGΨGGΨGAΨΨCAACΨGAAΨGCAGCAAΨCΨΨΨΨGΨΨGCAAΨAΨGGCAGΨΨΨΨ
ΨGΨACACAAΨΨAAACCGΨGCΨΨΨAACΨGGAAΨAGCΨGΨΨGAACAAGACAAAAACACCCAAGAAGΨΨΨΨΨGCACAAGΨCAAACAAAΨΨΨACAAAACACCA
CCAAΨΨAAAGAΨΨΨΨGGΨGGΨΨΨΨAAΨΨΨΨΨCACAAAΨAΨΨACCAGAΨCCAΨCAAAACCAAGCAAGAGGΨCAΨΨΨAΨΨGAAGAΨCΨACΨΨΨΨCAACAAA
GΨGACACΨΨGCAGAΨGCΨGGCΨΨCAΨCAAACAAΨAΨGGΨGAΨΨGCCΨΨGGΨGAΨAΨΨGCΨGCΨAGAGACCΨCAΨΨΨGΨGCACAAAAGΨΨΨAACGGCCΨΨ
ACΨGΨΨΨΨGCCACCΨΨΨGCΨCACAGAΨGAAAΨGAΨΨGCΨCAAΨACACΨΨCΨGCACΨGΨΨAGCGGGΨACAAΨCACΨΨCΨGGΨΨGGACCΨΨΨGGΨGCAGGΨ
GCΨGCAΨΨACAAAΨACCAΨΨΨGCΨAΨGCAAAΨGGCΨΨAΨAGGΨΨΨAAΨGGΨAΨΨGGAGΨΨACACAGAAΨGΨΨCΨCΨAΨGAGAACCAAAAAΨΨGAΨΨGCC
AACCAAΨΨΨAAΨAGΨGCΨAΨΨGGCAAAAΨΨCAAGACΨCACΨΨΨCΨΨCCACAGCAAGΨGCACΨΨGGAAAACΨΨCAAGAΨGΨGGΨCAACCAAAAΨGCACAA
GCΨΨΨAAACACGCΨΨGΨΨAAACAACΨΨAGCΨCCAAΨΨΨΨGGΨGCAAΨΨΨCAAGΨGΨΨΨΨAAAΨGAΨAΨCCΨΨΨCACGΨCΨΨGACAAAGΨΨGAGGCΨGAA
GΨGCAAAΨΨGAΨAGGΨΨGAΨCACAGGCAGACΨΨCAAAGΨΨΨGCAGACAΨAΨGΨGACΨCAACAAΨΨAAΨΨAGAGCΨGCAGAAAΨCAGAGCΨΨCΨGCΨAAΨ
CΨΨGCΨGCΨACΨAAAAΨGΨCAGAGΨGΨGΨACΨΨGGACAAΨCAAAAAGAGΨΨGAΨΨΨΨΨGΨGGAAAGGGCΨAΨCAΨCΨΨAΨGΨCCΨΨCCCΨCAGΨCAGCA
CCΨCAΨGGΨGΨAGΨCΨΨCΨΨGCAΨGΨGACΨΨAΨGΨCCCΨGCACAAGAAAAGAACΨΨCACAACΨGCΨCCΨGCCAΨΨΨGΨCAΨGAΨGGAAAAGCACACΨΨΨ
CCΨCGΨGAAGGΨGΨCΨΨΨGΨΨΨCAAAΨGGCACACACΨGGΨΨΨGΨAACACAAAGGAAΨΨΨΨΨAΨGAACCACAAAΨCAΨΨACΨACAGACAACACAΨΨΨGΨG
ΨCΨGGΨAACΨGΨGAΨGΨΨGΨAAΨAGGAAΨΨGΨCAACAACACAGΨΨΨAΨGAΨCCΨΨΨGCAACCΨGAAΨΨAGACΨCAΨΨCAAGGAGGAGΨΨAGAΨAAAΨAΨ
ΨΨΨAAGAAΨCAΨACAΨCACCAGAΨGΨΨGAΨΨΨAGGΨGACAΨCΨCΨGGCAΨΨAAΨGCΨΨCAGΨΨGΨAAACAΨΨCAAAAAGAAAΨΨGACCGCCΨCAAΨGAG
GΨΨGCCAAGAAΨΨΨAAAΨGAAΨCΨCΨCAΨCGAΨCΨCCAAGAACΨΨGGAAAGΨAΨGAGCAGΨAΨAΨAAAAΨGGCCAΨGGΨACAΨΨΨGGCΨAGGΨΨΨΨAΨA
GCΨGGCΨΨGAΨΨGCCAΨAGΨAAΨGGΨGACAAΨΨAΨGCΨΨΨGCΨGΨAΨGACCAGΨΨGCΨGΨAGΨΨGΨCΨCAAGGGCΨGΨΨGΨΨCΨΨGΨGGAΨCCΨGCΨGC
AAAΨΨΨGAΨGAAGACGACΨCΨGAGCCAGΨGCΨCAAAGGAGΨCAAAΨΨACAΨΨACACAΨAA

Pero todavía no es suficiente. Esta molécula de ARN, a pesar de tener pseudouridinas en lugar de uridinas, todavía sería muy poco estable y hay que añadirle señales de protección en el extremo 5′ (estructura CAP, característica de todos los mRNAs) y una cola de poliadeninas en el extremo 3′, además de otras señales de estabilización y de optimización de la traducción (como el uso de codones optimizados para las células humanas). Hay 20 aminoácidos y 64 posibles combinaciones de 3 letras-ribonucleótidos en el código genético, (incluidas tres señales de paro de traducción), por lo tanto varios codones de ARN codifican para el mismo aminoácido y no todos se usan con igual frecuencia en todas las especies, probablemente relacionado con la abundancia relativa de los t-RNA correspondientes, de ahí la frecuente «optimización» de los codones a la especie que va a traducir el ARN, una aproximación habitual pero no exenta de problemas.

Veamos en esta mapa (obtenido de la WHO-INN) las señales que se le añaden al ARN modificado.

Esquema del mRNA usado por Pfizer/BioNtech para construir la vacuna Comirnaty, basada en ARN. Se indica la estructura CAP añadida en el extremo 5′ y la estructura del análogo de nucleosido usado (1-metil-3′-pseudouridina, Ψ), además de la posición de otras señales de estabilización (5′-UTR, sig., 3′-UTR y polyA). Fuente: WHO/INN

Las señales que se le añaden en el extremo 5′ (izquierda) de la molécula de ARN son:

  • 5′-CAP: Estructura CAP modificada. 5’-cap1 (m7G+m3′-5′-ppp-5′-Am), posiciones 1-2
  • 5′-UTR: Región no traducida en 5′ derivada del ARN del gen de la alfa-globina humana con una secuencia Kozak (de inicio de traducción) optimizada, posiciones 3-54
  • sig: Secuencia que codifica el péptido señal de la glicoproteína S (secuencia extendida de la región líder/inicial) encargada de guiar la traslocación del polipéptido sintetizado hacia el retículo endoplasmático (para que finalmente llegue a exponerse en la membrana citoplasmática de la célula a través de los sistemas membranosos endocelulares: retículo endoplasmático, aparato de golgi y membrana exterior). Esta secuencia ya está originalmente en la glicoproteína S codificada en el genoma del coronavirus, posiciones 55-102
  • S protein_mut: Secuencia de ARN (con codones optimizados, para su mejor capacidad de traducción, de acuerdo a las frecuencias de codones habitualmente usados en células humanas) que codifica la glicoproteína S mutada, con cambios en las posiciones codificadas K986P y V987P, y con dos codones de STOP al final, posiciones 103-3879
  • 3′-UTR: Región no traducida en 3′ que comprende dos secuencias derivadas del mRNA del amino-terminal enhancer of  split (AES) y del RNA 12S ribosomal mitocondrial, que confieren estabilidad al ARN y un aumento en la cantidad total de proteína traducida, posiciones 3880-4174
  • poly(A): Secuencia de 110 ribonucleótidos que conforma la cola poli-A y que consiste en una ristra de 30 residuos de adenosina (A), seguido de una secuencia de unión de 10 ribonucleótidos y de 70 residuos de adenosina (A) adicionales, posiciones 4175-4284

Con todas esas modificaciones incorporadas la secuencia del mRNA final de la vacuna COVID-19 Comirnaty desarrollada por Pfizer/BioNtech (que es bastante distinta al ARN original mostrado anteriormente) corresponde a la siguiente secuencia. En verde se destacan las secuencias 5′-UTR y 3′-UTR. En rojo se destaca la secuencia que codifica el péptido señal que manda la proteína al retículo endoplasmático. Aparecen subrayados dos codones stop ΨGAΨGA. El resto corresponde a la versión optimizada que codifica para la glicoproteína S mutada (con los cambios K986P y V987P, cuya secuencia en el mRNA se destaca en azul).

GAGAAΨAAAC ΨAGΨAΨΨCΨΨ CΨGGΨCCCCA CAGACΨCAGA GAGAACCCGC   50
CACCAΨGΨΨC GΨGΨΨCCΨGG ΨGCΨGCΨGCC ΨCΨGGΨGΨCC AGCCAGΨGΨG  100
ΨGAACCΨGAC CACCAGAACA CAGCΨGCCΨC CAGCCΨACAC CAACAGCΨΨΨ  150
ACCAGAGGCG ΨGΨACΨACCC CGACAAGGΨG ΨΨCAGAΨCCA GCGΨGCΨGCA  200
CΨCΨACCCAG GACCΨGΨΨCC ΨGCCΨΨΨCΨΨ CAGCAACGΨG ACCΨGGΨΨCC  250
ACGCCAΨCCA CGΨGΨCCGGC ACCAAΨGGCA CCAAGAGAΨΨ CGACAACCCC  300
GΨGCΨGCCCΨ ΨCAACGACGG GGΨGΨACΨΨΨ GCCAGCACCG AGAAGΨCCAA  350
CAΨCAΨCAGA GGCΨGGAΨCΨ ΨCGGCACCAC ACΨGGACAGC AAGACCCAGA  400
GCCΨGCΨGAΨ CGΨGAACAAC GCCACCAACG ΨGGΨCAΨCAA AGΨGΨGCGAG  450
ΨΨCCAGΨΨCΨ GCAACGACCC CΨΨCCΨGGGC GΨCΨACΨACC ACAAGAACAA  500
CAAGAGCΨGG AΨGGAAAGCG AGΨΨCCGGGΨ GΨACAGCAGC GCCAACAACΨ  550
GCACCΨΨCGA GΨACGΨGΨCC CAGCCΨΨΨCC ΨGAΨGGACCΨ GGAAGGCAAG  600
CAGGGCAACΨ ΨCAAGAACCΨ GCGCGAGΨΨC GΨGΨΨΨAAGA ACAΨCGACGG  650
CΨACΨΨCAAG AΨCΨACAGCA AGCACACCCC ΨAΨCAACCΨC GΨGCGGGAΨC  700
ΨGCCΨCAGGG CΨΨCΨCΨGCΨ CΨGGAACCCC ΨGGΨGGAΨCΨ GCCCAΨCGGC  750
AΨCAACAΨCA CCCGGΨΨΨCA GACACΨGCΨG GCCCΨGCACA GAAGCΨACCΨ  800
GACACCΨGGC GAΨAGCAGCA GCGGAΨGGAC AGCΨGGΨGCC GCCGCΨΨACΨ  850
AΨGΨGGGCΨA CCΨGCAGCCΨ AGAACCΨΨCC ΨGCΨGAAGΨA CAACGAGAAC  900
GGCACCAΨCA CCGACGCCGΨ GGAΨΨGΨGCΨ CΨGGAΨCCΨC ΨGAGCGAGAC  950
AAAGΨGCACC CΨGAAGΨCCΨ ΨCACCGΨGGA AAAGGGCAΨC ΨACCAGACCA 1000
GCAACΨΨCCG GGΨGCAGCCC ACCGAAΨCCA ΨCGΨGCGGΨΨ CCCCAAΨAΨC 1050
ACCAAΨCΨGΨ GCCCCΨΨCGG CGAGGΨGΨΨC AAΨGCCACCA GAΨΨCGCCΨC 1100
ΨGΨGΨACGCC ΨGGAACCGGA AGCGGAΨCAG CAAΨΨGCGΨG GCCGACΨACΨ 1150
CCGΨGCΨGΨA CAACΨCCGCC AGCΨΨCAGCA CCΨΨCAAGΨG CΨACGGCGΨG 1200
ΨCCCCΨACCA AGCΨGAACGA CCΨGΨGCΨΨC ACAAACGΨGΨ ACGCCGACAG 1250
CΨΨCGΨGAΨC CGGGGAGAΨG AAGΨGCGGCA GAΨΨGCCCCΨ GGACAGACAG 1300
GCAAGAΨCGC CGACΨACAAC ΨACAAGCΨGC CCGACGACΨΨ CACCGGCΨGΨ 1350
GΨGAΨΨGCCΨ GGAACAGCAA CAACCΨGGAC ΨCCAAAGΨCG GCGGCAACΨA 1400
CAAΨΨACCΨG ΨACCGGCΨGΨ ΨCCGGAAGΨC CAAΨCΨGAAG CCCΨΨCGAGC 1450
GGGACAΨCΨC CACCGAGAΨC ΨAΨCAGGCCG GCAGCACCCC ΨΨGΨAACGGC 1500
GΨGGAAGGCΨ ΨCAACΨGCΨA CΨΨCCCACΨG CAGΨCCΨACG GCΨΨΨCAGCC 1550
CACAAAΨGGC GΨGGGCΨAΨC AGCCCΨACAG AGΨGGΨGGΨG CΨGAGCΨΨCG 1600
AACΨGCΨGCA ΨGCCCCΨGCC ACAGΨGΨGCG GCCCΨAAGAA AAGCACCAAΨ 1650
CΨCGΨGAAGA ACAAAΨGCGΨ GAACΨΨCAAC ΨΨCAACGGCC ΨGACCGGCAC 1700
CGGCGΨGCΨG ACAGAGAGCA ACAAGAAGΨΨ CCΨGCCAΨΨC CAGCAGΨΨΨG 1750
GCCGGGAΨAΨ CGCCGAΨACC ACAGACGCCG ΨΨAGAGAΨCC CCAGACACΨG 1800
GAAAΨCCΨGG ACAΨCACCCC ΨΨGCAGCΨΨC GGCGGAGΨGΨ CΨGΨGAΨCAC 1850
CCCΨGGCACC AACACCAGCA AΨCAGGΨGGC AGΨGCΨGΨAC CAGGACGΨGA 1900
ACΨGΨACCGA AGΨGCCCGΨG GCCAΨΨCACG CCGAΨCAGCΨ GACACCΨACA 1950
ΨGGCGGGΨGΨ ACΨCCACCGG CAGCAAΨGΨG ΨΨΨCAGACCA GAGCCGGCΨG 2000
ΨCΨGAΨCGGA GCCGAGCACG ΨGAACAAΨAG CΨACGAGΨGC GACAΨCCCCA 2050
ΨCGGCGCΨGG AAΨCΨGCGCC AGCΨACCAGA CACAGACAAA CAGCCCΨCGG 2100
AGAGCCAGAA GCGΨGGCCAG CCAGAGCAΨC AΨΨGCCΨACA CAAΨGΨCΨCΨ 2150
GGGCGCCGAG AACAGCGΨGG CCΨACΨCCAA CAACΨCΨAΨC GCΨAΨCCCCA 2200
CCAACΨΨCAC CAΨCAGCGΨG ACCACAGAGA ΨCCΨGCCΨGΨ GΨCCAΨGACC 2250
AAGACCAGCG ΨGGACΨGCAC CAΨGΨACAΨC ΨGCGGCGAΨΨ CCACCGAGΨG 2300
CΨCCAACCΨG CΨGCΨGCAGΨ ACGGCAGCΨΨ CΨGCACCCAG CΨGAAΨAGAG 2350
CCCΨGACAGG GAΨCGCCGΨG GAACAGGACA AGAACACCCA AGAGGΨGΨΨC 2400
GCCCAAGΨGA AGCAGAΨCΨA CAAGACCCCΨ CCΨAΨCAAGG ACΨΨCGGCGG 2450
CΨΨCAAΨΨΨC AGCCAGAΨΨC ΨGCCCGAΨCC ΨAGCAAGCCC AGCAAGCGGA 2500
GCΨΨCAΨCGA GGACCΨGCΨG ΨΨCAACAAAG ΨGACACΨGGC CGACGCCGGC 2550
ΨΨCAΨCAAGC AGΨAΨGGCGA ΨΨGΨCΨGGGC GACAΨΨGCCG CCAGGGAΨCΨ 2600
GAΨΨΨGCGCC CAGAAGΨΨΨA ACGGACΨGAC AGΨGCΨGCCΨ CCΨCΨGCΨGA 2650
CCGAΨGAGAΨ GAΨCGCCCAG ΨACACAΨCΨG CCCΨGCΨGGC CGGCACAAΨC 2700
ACAAGCGGCΨ GGACAΨΨΨGG AGCAGGCGCC GCΨCΨGCAGA ΨCCCCΨΨΨGC 2750
ΨAΨGCAGAΨG GCCΨACCGGΨ ΨCAACGGCAΨ CGGAGΨGACC CAGAAΨGΨGC 2800
ΨGΨACGAGAA CCAGAAGCΨG AΨCGCCAACC AGΨΨCAACAG CGCCAΨCGGC 2850
AAGAΨCCAGG ACAGCCΨGAG CAGCACAGCA AGCGCCCΨGG GAAAGCΨGCA 2900
GGACGΨGGΨC AACCAGAAΨG CCCAGGCACΨ GAACACCCΨG GΨCAAGCAGC 2950
ΨGΨCCΨCCAA CΨΨCGGCGCC AΨCAGCΨCΨG ΨGCΨGAACGA ΨAΨCCΨGAGC 3000
AGACΨGGACC CΨCCΨGAGGC CGAGGΨGCAG AΨCGACAGAC ΨGAΨCACAGG 3050
CAGACΨGCAG AGCCΨCCAGA CAΨACGΨGAC CCAGCAGCΨG AΨCAGAGCCG 3100
CCGAGAΨΨAG AGCCΨCΨGCC AAΨCΨGGCCG CCACCAAGAΨ GΨCΨGAGΨGΨ 3150
GΨGCΨGGGCC AGAGCAAGAG AGΨGGACΨΨΨ ΨGCGGCAAGG GCΨACCACCΨ 3200
GAΨGAGCΨΨC CCΨCAGΨCΨG CCCCΨCACGG CGΨGGΨGΨΨΨ CΨGCACGΨGA 3250
CAΨAΨGΨGCC CGCΨCAAGAG AAGAAΨΨΨCA CCACCGCΨCC AGCCAΨCΨGC 3300
CACGACGGCA AAGCCCACΨΨ ΨCCΨAGAGAA GGCGΨGΨΨCG ΨGΨCCAACGG 3350
CACCCAΨΨGG ΨΨCGΨGACAC AGCGGAACΨΨ CΨACGAGCCC CAGAΨCAΨCA 3400
CCACCGACAA CACCΨΨCGΨG ΨCΨGGCAACΨ GCGACGΨCGΨ GAΨCGGCAΨΨ 3450
GΨGAACAAΨA CCGΨGΨACGA CCCΨCΨGCAG CCCGAGCΨGG ACAGCΨΨCAA 3500
AGAGGAACΨG GACAAGΨACΨ ΨΨAAGAACCA CACAAGCCCC GACGΨGGACC 3550
ΨGGGCGAΨAΨ CAGCGGAAΨC AAΨGCCAGCG ΨCGΨGAACAΨ CCAGAAAGAG 3600
AΨCGACCGGC ΨGAACGAGGΨ GGCCAAGAAΨ CΨGAACGAGA GCCΨGAΨCGA 3650
CCΨGCAAGAA CΨGGGGAAGΨ ACGAGCAGΨA CAΨCAAGΨGG CCCΨGGΨACA 3700
ΨCΨGGCΨGGG CΨΨΨAΨCGCC GGACΨGAΨΨG CCAΨCGΨGAΨ GGΨCACAAΨC 3750
AΨGCΨGΨGΨΨ GCAΨGACCAG CΨGCΨGΨAGC ΨGCCΨGAAGG GCΨGΨΨGΨAG 3800
CΨGΨGGCAGC ΨGCΨGCAAGΨ ΨCGACGAGGA CGAΨΨCΨGAG CCCGΨGCΨGA 3850
AGGGCGΨGAA ACΨGCACΨAC ACAΨGAΨGAC ΨCGAGCΨGGΨ ACΨGCAΨGCA 3900
CGCAAΨGCΨA GCΨGCCCCΨΨ ΨCCCGΨCCΨG GGΨACCCCGA GΨCΨCCCCCG 3950
ACCΨCGGGΨC CCAGGΨAΨGC ΨCCCACCΨCC ACCΨGCCCCA CΨCACCACCΨ 4000
CΨGCΨAGΨΨC CAGACACCΨC CCAAGCACGC AGCAAΨGCAG CΨCAAAACGC 4050
ΨΨAGCCΨAGC CACACCCCCA CGGGAAACAG CAGΨGAΨΨAA CCΨΨΨAGCAA 4100
ΨAAACGAAAG ΨΨΨAACΨAAG CΨAΨACΨAAC CCCAGGGΨΨG GΨCAAΨΨΨCG 4150
ΨGCCAGCCAC ACCCΨGGAGC ΨAGCAAAAAA AAAAAAAAAA AAAAAAAAAA 4200
AAAAGCAΨAΨ GACΨAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 4250
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA                  4284

¿Hay muchas diferencias entre la secuencia de ARN original codificada en el genoma del coronavirus SARS-CoV-2 y la secuencia del mRNA usada en la fabricación de la vacuna contra la COVID-19 Cominarty, desarrollada por Pfizer/BioNtech? Pues sí, hay muchas diferencias, más de 1000 letras cambiadas (exactamente 1061 ribonucleótidos substituidos). Veamos una comparación y alineamiento entre las secuencias del ARN ORIGINAL (en el genoma ARN del coronavirus SARS-CoV-2) y la de mRNA FINAL (en la vacuna COVID-19 Cominarty) realizada con ayuda de la herramienta bioinformática Clustal Omega, de EMBL-EBI. Cada asterisco denota homología (la misma) secuencia. Los espacios resaltan las diferencias, además de las secuencias nuevas añadidas en las regiones 5′ (al principio) y 3′ (al final). El porcentaje de identidad entre las dos moléculas de ARN, original y final, es del 72,24%.

 

ORIGINAL      ------------------------------------------------------AΨGΨΨΨ	6
FINAL         GAGAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACCAΨGΨΨC	60
                                                                    ***** 
ORIGINAL      GΨΨΨΨΨCΨΨGΨΨΨΨAΨΨGCCACΨAGΨCΨCΨAGΨCAGΨGΨGΨΨAAΨCΨΨACAACCAGAACΨ	66
FINAL         GΨGΨΨCCΨGGΨGCΨGCΨGCCΨCΨGGΨGΨCCAGCCAGΨGΨGΨGAACCΨGACCACCAGAACA	120
              ** ** ** **  *  **** ** ** ** ** ******** ** ** ** ******** 
ORIGINAL      CAAΨΨACCCCCΨGCAΨACACΨAAΨΨCΨΨΨCACACGΨGGΨGΨΨΨAΨΨACCCΨGACAAAGΨΨ	126
FINAL         CAGCΨGCCΨCCAGCCΨACACCAACAGCΨΨΨACCAGAGGCGΨGΨACΨACCCCGACAAGGΨG	180
              **  * ** ** ** ***** **    ** **  * ** ** ** ***** ***** ** 
ORIGINAL      ΨΨCAGAΨCCΨCAGΨΨΨΨACAΨΨCAACΨCAGGACΨΨGΨΨCΨΨACCΨΨΨCΨΨΨΨCCAAΨGΨΨ	186
FINAL         ΨΨCAGAΨCCAGCGΨGCΨGCACΨCΨACCCAGGACCΨGΨΨCCΨGCCΨΨΨCΨΨCAGCAACGΨG	240
              *********   **  * ** ** ** ****** ***** * ********   *** ** 
ORIGINAL      ACΨΨGGΨΨCCAΨGCΨAΨACAΨGΨCΨCΨGGGACCAAΨGGΨACΨAAGAGGΨΨΨGAΨAACCCΨ	246
FINAL         ACCΨGGΨΨCCACGCCAΨCCACGΨGΨCCGGCACCAAΨGGCACCAAGAGAΨΨCGACAACCCC	300
              ** ******** ** ** ** ** ** ** ******** ** ***** ** ** ***** 
ORIGINAL      GΨCCΨACCAΨΨΨAAΨGAΨGGΨGΨΨΨAΨΨΨΨGCΨΨCCACΨGAGAAGΨCΨAACAΨAAΨAAGA	306
FINAL         GΨGCΨGCCCΨΨCAACGACGGGGΨGΨACΨΨΨGCCAGCACCGAGAAGΨCCAACAΨCAΨCAGA	360
              ** ** ** ** ** ** ** ** ** *****   *** ******** ***** ** ***
ORIGINAL      GGCΨGGAΨΨΨΨΨGGΨACΨACΨΨΨAGAΨΨCGAAGACCCAGΨCCCΨACΨΨAΨΨGΨΨAAΨAAC	366
FINAL         GGCΨGGAΨCΨΨCGGCACCACACΨGGACAGCAAGACCCAGAGCCΨGCΨGAΨCGΨGAACAAC	420
              ******** ** ** ** **  * **    *********  *** ** ** ** ** ***
ORIGINAL      GCΨACΨAAΨGΨΨGΨΨAΨΨAAAGΨCΨGΨGAAΨΨΨCAAΨΨΨΨGΨAAΨGAΨCCAΨΨΨΨΨGGGΨ	426
FINAL         GCCACCAACGΨGGΨCAΨCAAAGΨGΨGCGAGΨΨCCAGΨΨCΨGCAACGACCCCΨΨCCΨGGGC	480
              ** ** ** ** ** ** ***** ** ** ** ** ** ** ** ** ** **  **** 
ORIGINAL      GΨΨΨAΨΨACCACAAAAACAACAAAAGΨΨGGAΨGGAAAGΨGAGΨΨCAGAGΨΨΨAΨΨCΨAGΨ	486
FINAL         GΨCΨACΨACCACAAGAACAACAAGAGCΨGGAΨGGAAAGCGAGΨΨCCGGGΨGΨACAGCAGC	540
              ** ** ******** ******** ** *********** ****** * ** **    ** 
ORIGINAL      GCGAAΨAAΨΨGCACΨΨΨΨGAAΨAΨGΨCΨCΨCAGCCΨΨΨΨCΨΨAΨGGACCΨΨGAAGGAAAA	546
FINAL         GCCAACAACΨGCACCΨΨCGAGΨACGΨGΨCCCAGCCΨΨΨCCΨGAΨGGACCΨGGAAGGCAAG	600
              ** ** ** ***** ** ** ** ** ** ******** ** ******** ***** ** 
ORIGINAL      CAGGGΨAAΨΨΨCAAAAAΨCΨΨAGGGAAΨΨΨGΨGΨΨΨAAGAAΨAΨΨGAΨGGΨΨAΨΨΨΨAAA	606
FINAL         CAGGGCAACΨΨCAAGAACCΨGCGCGAGΨΨCGΨGΨΨΨAAGAACAΨCGACGGCΨACΨΨCAAG	660
              ***** ** ***** ** **  * ** ** *********** ** ** ** ** ** ** 
ORIGINAL      AΨAΨAΨΨCΨAAGCACACGCCΨAΨΨAAΨΨΨAGΨGCGΨGAΨCΨCCCΨCAGGGΨΨΨΨΨCGGCΨ	666
FINAL         AΨCΨACAGCAAGCACACCCCΨAΨCAACCΨCGΨGCGGGAΨCΨGCCΨCAGGGCΨΨCΨCΨGCΨ	720
              ** **    ******** ***** **  * ***** ***** ******** ** ** ***
ORIGINAL      ΨΨAGAACCAΨΨGGΨAGAΨΨΨGCCAAΨAGGΨAΨΨAACAΨCACΨAGGΨΨΨCAAACΨΨΨACΨΨ	726
FINAL         CΨGGAACCCCΨGGΨGGAΨCΨGCCCAΨCGGCAΨCAACAΨCACCCGGΨΨΨCAGACACΨGCΨG	780
               * *****  **** *** **** ** ** ** ********  ******* **  * ** 
ORIGINAL      GCΨΨΨACAΨAGAAGΨΨAΨΨΨGACΨCCΨGGΨGAΨΨCΨΨCΨΨCAGGΨΨGGACAGCΨGGΨGCΨ	786
FINAL         GCCCΨGCACAGAAGCΨACCΨGACACCΨGGCGAΨAGCAGCAGCGGAΨGGACAGCΨGGΨGCC	840
              **  * ** ***** **  **** ***** ***         ** ************** 
ORIGINAL      GCAGCΨΨAΨΨAΨGΨGGGΨΨAΨCΨΨCAACCΨAGGACΨΨΨΨCΨAΨΨAAAAΨAΨAAΨGAAAAΨ	846
FINAL         GCCGCΨΨACΨAΨGΨGGGCΨACCΨGCAGCCΨAGAACCΨΨCCΨGCΨGAAGΨACAACGAGAAC	900
              ** ***** ******** ** ** ** ***** ** ** **  * ** ** ** ** ** 
ORIGINAL      GGAACCAΨΨACAGAΨGCΨGΨAGACΨGΨGCACΨΨGACCCΨCΨCΨCAGAAACAAAGΨGΨACG	906
FINAL         GGCACCAΨCACCGACGCCGΨGGAΨΨGΨGCΨCΨGGAΨCCΨCΨGAGCGAGACAAAGΨGCACC	960
              ** ***** ** ** ** ** ** ***** ** ** *****    ** ******** ** 
ORIGINAL      ΨΨGAAAΨCCΨΨCACΨGΨAGAAAAAGGAAΨCΨAΨCAAACΨΨCΨAACΨΨΨAGAGΨCCAACCA	966
FINAL         CΨGAAGΨCCΨΨCACCGΨGGAAAAGGGCAΨCΨACCAGACCAGCAACΨΨCCGGGΨGCAGCCC	1020
               **** ******** ** ***** ** ***** ** **    *****  * ** ** ** 
ORIGINAL      ACAGAAΨCΨAΨΨGΨΨAGAΨΨΨCCΨAAΨAΨΨACAAACΨΨGΨGCCCΨΨΨΨGGΨGAAGΨΨΨΨΨ	1026
FINAL         ACCGAAΨCCAΨCGΨGCGGΨΨCCCCAAΨAΨCACCAAΨCΨGΨGCCCCΨΨCGGCGAGGΨGΨΨC	1080
              ** ***** ** **  * ** ** ***** ** **  ******* ** ** ** ** ** 
ORIGINAL      AACGCCACCAGAΨΨΨGCAΨCΨGΨΨΨAΨGCΨΨGGAACAGGAAGAGAAΨCAGCAACΨGΨGΨΨ	1086
FINAL         AAΨGCCACCAGAΨΨCGCCΨCΨGΨGΨACGCCΨGGAACCGGAAGCGGAΨCAGCAAΨΨGCGΨG	1140
              ** *********** ** ***** ** ** ****** ***** * ******** ** ** 
ORIGINAL      GCΨGAΨΨAΨΨCΨGΨCCΨAΨAΨAAΨΨCCGCAΨCAΨΨΨΨCCACΨΨΨΨAAGΨGΨΨAΨGGAGΨG	1146
FINAL         GCCGACΨACΨCCGΨGCΨGΨACAACΨCCGCCAGCΨΨCAGCACCΨΨCAAGΨGCΨACGGCGΨG	1200
              ** ** ** ** ** ** ** ** *****    **   *** ** ***** ** ** ***
ORIGINAL      ΨCΨCCΨACΨAAAΨΨAAAΨGAΨCΨCΨGCΨΨΨACΨAAΨGΨCΨAΨGCAGAΨΨCAΨΨΨGΨAAΨΨ	1206
FINAL         ΨCCCCΨACCAAGCΨGAACGACCΨGΨGCΨΨCACAAACGΨGΨACGCCGACAGCΨΨCGΨGAΨC	1260
              ** ***** **  * ** ** ** ***** ** ** ** ** ** **    ** ** ** 
ORIGINAL      AGAGGΨGAΨGAAGΨCAGACAAAΨCGCΨCCAGGGCAAACΨGGAAAGAΨΨGCΨGAΨΨAΨAAΨ	1266
FINAL         CGGGGAGAΨGAAGΨGCGGCAGAΨΨGCCCCΨGGACAGACAGGCAAGAΨCGCCGACΨACAAC	1320
               * ** ********  * ** ** ** ** ** ** ** ** ***** ** ** ** ** 
ORIGINAL      ΨAΨAAAΨΨACCAGAΨGAΨΨΨΨACAGGCΨGCGΨΨAΨAGCΨΨGGAAΨΨCΨAACAAΨCΨΨGAΨ	1326
FINAL         ΨACAAGCΨGCCCGACGACΨΨCACCGGCΨGΨGΨGAΨΨGCCΨGGAACAGCAACAACCΨGGAC	1380
              ** **  * ** ** ** ** ** ***** ** ** ** *****    ***** ** ** 
ORIGINAL      ΨCΨAAGGΨΨGGΨGGΨAAΨΨAΨAAΨΨACCΨGΨAΨAGAΨΨGΨΨΨAGGAAGΨCΨAAΨCΨCAAA	1386
FINAL         ΨCCAAAGΨCGGCGGCAACΨACAAΨΨACCΨGΨACCGGCΨGΨΨCCGGAAGΨCCAAΨCΨGAAG	1440
              ** ** ** ** ** ** ** ***********  *  ****  ******* ***** ** 
ORIGINAL      CCΨΨΨΨGAGAGAGAΨAΨΨΨCAACΨGAAAΨCΨAΨCAGGCCGGΨAGCACACCΨΨGΨAAΨGGΨ	1446
FINAL         CCCΨΨCGAGCGGGACAΨCΨCCACCGAGAΨCΨAΨCAGGCCGGCAGCACCCCΨΨGΨAACGGC	1500
              ** ** *** * ** ** ** ** ** ************** ***** ******** ** 
ORIGINAL      GΨΨGAAGGΨΨΨΨAAΨΨGΨΨACΨΨΨCCΨΨΨACAAΨCAΨAΨGGΨΨΨCCAACCCACΨAAΨGGΨ	1506
FINAL         GΨGGAAGGCΨΨCAACΨGCΨACΨΨCCCACΨGCAGΨCCΨACGGCΨΨΨCAGCCCACAAAΨGGC	1560
              ** ***** ** ** ** ***** **  * ** ** ** ** ** ** ***** ***** 
ORIGINAL      GΨΨGGΨΨACCAACCAΨACAGAGΨAGΨAGΨACΨΨΨCΨΨΨΨGAACΨΨCΨACAΨGCACCAGCA	1566
FINAL         GΨGGGCΨAΨCAGCCCΨACAGAGΨGGΨGGΨGCΨGAGCΨΨCGAACΨGCΨGCAΨGCCCCΨGCC	1620
              ** ** ** ** ** ******** ** ** **    ** ***** ** ***** ** ** 
ORIGINAL      ACΨGΨΨΨGΨGGACCΨAAAAAGΨCΨACΨAAΨΨΨGGΨΨAAAAACAAAΨGΨGΨCAAΨΨΨCAAC	1626
FINAL         ACAGΨGΨGCGGCCCΨAAGAAAAGCACCAAΨCΨCGΨGAAGAACAAAΨGCGΨGAACΨΨCAAC	1680
              ** ** ** ** ***** **    ** *** * ** ** ******** ** ** ******
ORIGINAL      ΨΨCAAΨGGΨΨΨAACAGGCACAGGΨGΨΨCΨΨACΨGAGΨCΨAACAAAAAGΨΨΨCΨGCCΨΨΨC	1686
FINAL         ΨΨCAACGGCCΨGACCGGCACCGGCGΨGCΨGACAGAGAGCAACAAGAAGΨΨCCΨGCCAΨΨC	1740
              ***** **  * ** ***** ** ** ** ** ***   ***** ***** ***** ***
ORIGINAL      CAACAAΨΨΨGGCAGAGACAΨΨGCΨGACACΨACΨGAΨGCΨGΨCCGΨGAΨCCACAGACACΨΨ	1746
FINAL         CAGCAGΨΨΨGGCCGGGAΨAΨCGCCGAΨACCACAGACGCCGΨΨAGAGAΨCCCCAGACACΨG	1800
              ** ** ****** * ** ** ** ** ** ** ** ** **  * ***** ******** 
ORIGINAL      GAGAΨΨCΨΨGACAΨΨACACCAΨGΨΨCΨΨΨΨGGΨGGΨGΨCAGΨGΨΨAΨAACACCAGGAACA	1806
FINAL         GAAAΨCCΨGGACAΨCACCCCΨΨGCAGCΨΨCGGCGGAGΨGΨCΨGΨGAΨCACCCCΨGGCACC	1860
              ** ** ** ***** ** ** **    ** ** ** **   *** ** ** ** ** ** 
ORIGINAL      AAΨACΨΨCΨAACCAGGΨΨGCΨGΨΨCΨΨΨAΨCAGGAΨGΨΨAACΨGCACAGAAGΨCCCΨGΨΨ	1866
FINAL         AACACCAGCAAΨCAGGΨGGCAGΨGCΨGΨACCAGGACGΨGAACΨGΨACCGAAGΨGCCCGΨG	1920
              ** **    ** ***** ** ** ** ** ***** ** ***** ** ***** ** ** 
ORIGINAL      GCΨAΨΨCAΨGCAGAΨCAACΨΨACΨCCΨACΨΨGGCGΨGΨΨΨAΨΨCΨACAGGΨΨCΨAAΨGΨΨ	1926
FINAL         GCCAΨΨCACGCCGAΨCAGCΨGACACCΨACAΨGGCGGGΨGΨACΨCCACCGGCAGCAAΨGΨG	1980
              ** ***** ** ***** ** ** ***** ***** ** ** ** ** **    ***** 
ORIGINAL      ΨΨΨCAAACACGΨGCAGGCΨGΨΨΨAAΨAGGGGCΨGAACAΨGΨCAACAACΨCAΨAΨGAGΨGΨ	1986
FINAL         ΨΨΨCAGACCAGAGCCGGCΨGΨCΨGAΨCGGAGCCGAGCACGΨGAACAAΨAGCΨACGAGΨGC	2040
              ***** **  * ** ****** * ** ** ** ** ** ** *****    ** ***** 
ORIGINAL      GACAΨACCCAΨΨGGΨGCAGGΨAΨAΨGCGCΨAGΨΨAΨCAGACΨCAGACΨAAΨΨCΨCCΨCGG	2046
FINAL         GACAΨCCCCAΨCGGCGCΨGGAAΨCΨGCGCCAGCΨACCAGACACAGACAAACAGCCCΨCGG	2100
              ***** ***** ** ** ** ** ***** ** ** ***** ***** **    ******
ORIGINAL      CGGGCACGΨAGΨGΨAGCΨAGΨCAAΨCCAΨCAΨΨGCCΨACACΨAΨGΨCACΨΨGGΨGCAGAA	2106
FINAL         AGAGCCAGAAGCGΨGGCCAGCCAGAGCAΨCAΨΨGCCΨACACAAΨGΨCΨCΨGGGCGCCGAG	2160
               * **  * ** ** ** ** **   *************** ***** ** ** ** ** 
ORIGINAL      AAΨΨCAGΨΨGCΨΨACΨCΨAAΨAACΨCΨAΨΨGCCAΨACCCACAAAΨΨΨΨACΨAΨΨAGΨGΨΨ	2166
FINAL         AACAGCGΨGGCCΨACΨCCAACAACΨCΨAΨCGCΨAΨCCCCACCAACΨΨCACCAΨCAGCGΨG	2220
              **    ** ** ***** ** ******** ** ** ***** ** ** ** ** ** ** 
ORIGINAL      ACCACAGAAAΨΨCΨACCAGΨGΨCΨAΨGACCAAGACAΨCAGΨAGAΨΨGΨACAAΨGΨACAΨΨ	2226
FINAL         ACCACAGAGAΨCCΨGCCΨGΨGΨCCAΨGACCAAGACCAGCGΨGGACΨGCACCAΨGΨACAΨC	2280
              ******** ** ** ** ***** ***********    ** ** ** ** ******** 
ORIGINAL      ΨGΨGGΨGAΨΨCAACΨGAAΨGCAGCAAΨCΨΨΨΨGΨΨGCAAΨAΨGGCAGΨΨΨΨΨGΨACACAA	2286
FINAL         ΨGCGGCGAΨΨCCACCGAGΨGCΨCCAACCΨGCΨGCΨGCAGΨACGGCAGCΨΨCΨGCACCCAG	2340
              ** ** ***** ** ** ***  *** **  ** **** ** ***** ** ** ** ** 
ORIGINAL      ΨΨAAACCGΨGCΨΨΨAACΨGGAAΨAGCΨGΨΨGAACAAGACAAAAACACCCAAGAAGΨΨΨΨΨ	2346
FINAL         CΨGAAΨAGAGCCCΨGACAGGGAΨCGCCGΨGGAACAGGACAAGAACACCCAAGAGGΨGΨΨC	2400
               * **  * **  * ** ** ** ** ** ***** ***** *********** ** ** 
ORIGINAL      GCACAAGΨCAAACAAAΨΨΨACAAAACACCACCAAΨΨAAAGAΨΨΨΨGGΨGGΨΨΨΨAAΨΨΨΨ	2406
FINAL         GCCCAAGΨGAAGCAGAΨCΨACAAGACCCCΨCCΨAΨCAAGGACΨΨCGGCGGCΨΨCAAΨΨΨC	2460
              ** ***** ** ** ** ***** ** ** ** ** ** ** ** ** ** ** ***** 
ORIGINAL      ΨCACAAAΨAΨΨACCAGAΨCCAΨCAAAACCAAGCAAGAGGΨCAΨΨΨAΨΨGAAGAΨCΨACΨΨ	2466
FINAL         AGCCAGAΨΨCΨGCCCGAΨCCΨAGCAAGCCCAGCAAGCGGAGCΨΨCAΨCGAGGACCΨGCΨG	2520
                 ** **  * ** *****    ** ** ****** **   ** ** ** ** ** ** 
ORIGINAL      ΨΨCAACAAAGΨGACACΨΨGCAGAΨGCΨGGCΨΨCAΨCAAACAAΨAΨGGΨGAΨΨGCCΨΨGGΨ	2526
FINAL         ΨΨCAACAAAGΨGACACΨGGCCGACGCCGGCΨΨCAΨCAAGCAGΨAΨGGCGAΨΨGΨCΨGGGC	2580
              ***************** ** ** ** *********** ** ***** ***** ** ** 
ORIGINAL      GAΨAΨΨGCΨGCΨAGAGACCΨCAΨΨΨGΨGCACAAAAGΨΨΨAACGGCCΨΨACΨGΨΨΨΨGCCA	2586
FINAL         GACAΨΨGCCGCCAGGGAΨCΨGAΨΨΨGCGCCCAGAAGΨΨΨAACGGACΨGACAGΨGCΨGCCΨ	2640
              ** ***** ** ** ** ** ***** ** ** *********** ** ** **  **** 
ORIGINAL      CCΨΨΨGCΨCACAGAΨGAAAΨGAΨΨGCΨCAAΨACACΨΨCΨGCACΨGΨΨAGCGGGΨACAAΨC	2646
FINAL         CCΨCΨGCΨGACCGAΨGAGAΨGAΨCGCCCAGΨACACAΨCΨGCCCΨGCΨGGCCGGCACAAΨC	2700
              *** **** ** ***** ***** ** ** ***** ***** *** * ** ** ******
ORIGINAL      ACΨΨCΨGGΨΨGGACCΨΨΨGGΨGCAGGΨGCΨGCAΨΨACAAAΨACCAΨΨΨGCΨAΨGCAAAΨG	2706
FINAL         ACAAGCGGCΨGGACAΨΨΨGGAGCAGGCGCCGCΨCΨGCAGAΨCCCCΨΨΨGCΨAΨGCAGAΨG	2760
              **    ** ***** ***** ***** ** **  * ** ** ** *********** ***
ORIGINAL      GCΨΨAΨAGGΨΨΨAAΨGGΨAΨΨGGAGΨΨACACAGAAΨGΨΨCΨCΨAΨGAGAACCAAAAAΨΨG	2766
FINAL         GCCΨACCGGΨΨCAACGGCAΨCGGAGΨGACCCAGAAΨGΨGCΨGΨACGAGAACCAGAAGCΨG	2820
              ** **  **** ** ** ** ***** ** ******** ** ** ******** **  **
ORIGINAL      AΨΨGCCAACCAAΨΨΨAAΨAGΨGCΨAΨΨGGCAAAAΨΨCAAGACΨCACΨΨΨCΨΨCCACAGCA	2826
FINAL         AΨCGCCAACCAGΨΨCAACAGCGCCAΨCGGCAAGAΨCCAGGACAGCCΨGAGCAGCACAGCA	2880
              ** ******** ** ** ** ** ** ***** ** ** ***   **      *******
ORIGINAL      AGΨGCACΨΨGGAAAACΨΨCAAGAΨGΨGGΨCAACCAAAAΨGCACAAGCΨΨΨAAACACGCΨΨ	2886
FINAL         AGCGCCCΨGGGAAAGCΨGCAGGACGΨGGΨCAACCAGAAΨGCCCAGGCACΨGAACACCCΨG	2940
              ** ** ** ***** ** ** ** *********** ***** ** **  * ***** ** 
ORIGINAL      GΨΨAAACAACΨΨAGCΨCCAAΨΨΨΨGGΨGCAAΨΨΨCAAGΨGΨΨΨΨAAAΨGAΨAΨCCΨΨΨCA	2946
FINAL         GΨCAAGCAGCΨGΨCCΨCCAACΨΨCGGCGCCAΨCAGCΨCΨGΨGCΨGAACGAΨAΨCCΨGAGC	3000
              ** ** ** **   ****** ** ** ** **      ***  * ** ********    
ORIGINAL      CGΨCΨΨGACAAAGΨΨGAGGCΨGAAGΨGCAAAΨΨGAΨAGGΨΨGAΨCACAGGCAGACΨΨCAA	3006
FINAL         AGACΨGGACCCΨCCΨGAGGCCGAGGΨGCAGAΨCGACAGACΨGAΨCACAGGCAGACΨGCAG	3060
               * ** ***     ****** ** ***** ** ** **  **************** ** 
ORIGINAL      AGΨΨΨGCAGACAΨAΨGΨGACΨCAACAAΨΨAAΨΨAGAGCΨGCAGAAAΨCAGAGCΨΨCΨGCΨ	3066
FINAL         AGCCΨCCAGACAΨACGΨGACCCAGCAGCΨGAΨCAGAGCCGCCGAGAΨΨAGAGCCΨCΨGCC	3120
              **  * ******** ***** ** **  * ** ***** ** ** ** ***** ***** 
ORIGINAL      AAΨCΨΨGCΨGCΨACΨAAAAΨGΨCAGAGΨGΨGΨACΨΨGGACAAΨCAAAAAGAGΨΨGAΨΨΨΨ	3126
FINAL         AAΨCΨGGCCGCCACCAAGAΨGΨCΨGAGΨGΨGΨGCΨGGGCCAGAGCAAGAGAGΨGGACΨΨΨ	3180
              ***** ** ** ** ** ***** ******** ** ** **    ** ***** ** ***
ORIGINAL      ΨGΨGGAAAGGGCΨAΨCAΨCΨΨAΨGΨCCΨΨCCCΨCAGΨCAGCACCΨCAΨGGΨGΨAGΨCΨΨC	3186
FINAL         ΨGCGGCAAGGGCΨACCACCΨGAΨGAGCΨΨCCCΨCAGΨCΨGCCCCΨCACGGCGΨGGΨGΨΨΨ	3240
              ** ** ******** ** ** ***  ************ ** ***** ** ** ** ** 
ORIGINAL      ΨΨGCAΨGΨGACΨΨAΨGΨCCCΨGCACAAGAAAAGAACΨΨCACAACΨGCΨCCΨGCCAΨΨΨGΨ	3246
FINAL         CΨGCACGΨGACAΨAΨGΨGCCCGCΨCAAGAGAAGAAΨΨΨCACCACCGCΨCCAGCCAΨCΨGC	3300
               **** ***** ***** ** ** ***** ***** ***** ** ***** ***** ** 
ORIGINAL      CAΨGAΨGGAAAAGCACACΨΨΨCCΨCGΨGAAGGΨGΨCΨΨΨGΨΨΨCAAAΨGGCACACACΨGG	3306
FINAL         CACGACGGCAAAGCCCACΨΨΨCCΨAGAGAAGGCGΨGΨΨCGΨGΨCCAACGGCACCCAΨΨGG	3360
              ** ** ** ***** ********* * ***** ** ** ** ** ** ***** ** ***
ORIGINAL      ΨΨΨGΨAACACAAAGGAAΨΨΨΨΨAΨGAACCACAAAΨCAΨΨACΨACAGACAACACAΨΨΨGΨG	3366
FINAL         ΨΨCGΨGACACAGCGGAACΨΨCΨACGAGCCCCAGAΨCAΨCACCACCGACAACACCΨΨCGΨG	3420
              ** ** *****  **** ** ** ** ** ** ***** ** ** ******** ** ***
ORIGINAL      ΨCΨGGΨAACΨGΨGAΨGΨΨGΨAAΨAGGAAΨΨGΨCAACAACACAGΨΨΨAΨGAΨCCΨΨΨGCAA	3426
FINAL         ΨCΨGGCAACΨGCGACGΨCGΨGAΨCGGCAΨΨGΨGAACAAΨACCGΨGΨACGACCCΨCΨGCAG	3480
              ***** ***** ** ** ** ** ** ***** ***** ** ** ** ** *** **** 
ORIGINAL      CCΨGAAΨΨAGACΨCAΨΨCAAGGAGGAGΨΨAGAΨAAAΨAΨΨΨΨAAGAAΨCAΨACAΨCACCA	3486
FINAL         CCCGAGCΨGGACAGCΨΨCAAAGAGGAACΨGGACAAGΨACΨΨΨAAGAACCACACAAGCCCC	3540
              ** **  * ***   ***** *****  * ** ** ** ******** ** ***   ** 
ORIGINAL      GAΨGΨΨGAΨΨΨAGGΨGACAΨCΨCΨGGCAΨΨAAΨGCΨΨCAGΨΨGΨAAACAΨΨCAAAAAGAA	3546
FINAL         GACGΨGGACCΨGGGCGAΨAΨCAGCGGAAΨCAAΨGCCAGCGΨCGΨGAACAΨCCAGAAAGAG	3600
              ** ** **  * ** ** ***   ** ** *****    ** ** ***** ** ***** 
ORIGINAL      AΨΨGACCGCCΨCAAΨGAGGΨΨGCCAAGAAΨΨΨAAAΨGAAΨCΨCΨCAΨCGAΨCΨCCAAGAA	3606
FINAL         AΨCGACCGGCΨGAACGAGGΨGGCCAAGAAΨCΨGAACGAGAGCCΨGAΨCGACCΨGCAAGAA	3660
              ** ***** ** ** ***** ********* * ** **    ** ***** ** ******
ORIGINAL      CΨΨGGAAAGΨAΨGAGCAGΨAΨAΨAAAAΨGGCCAΨGGΨACAΨΨΨGGCΨAGGΨΨΨΨAΨAGCΨ	3666
FINAL         CΨGGGGAAGΨACGAGCAGΨACAΨCAAGΨGGCCCΨGGΨACAΨCΨGGCΨGGGCΨΨΨAΨCGCC	3720
              ** ** ***** ******** ** ** ***** ******** ***** ** ***** ** 
ORIGINAL      GGCΨΨGAΨΨGCCAΨAGΨAAΨGGΨGACAAΨΨAΨGCΨΨΨGCΨGΨAΨGACCAGΨΨGCΨGΨAGΨ	3726
FINAL         GGACΨGAΨΨGCCAΨCGΨGAΨGGΨCACAAΨCAΨGCΨGΨGΨΨGCAΨGACCAGCΨGCΨGΨAGC	3780
              **  ********** ** ***** ***** ***** ** ** ******** ******** 
ORIGINAL      ΨGΨCΨCAAGGGCΨGΨΨGΨΨCΨΨGΨGGAΨCCΨGCΨGCAAAΨΨΨGAΨGAAGACGACΨCΨGAG	3786
FINAL         ΨGCCΨGAAGGGCΨGΨΨGΨAGCΨGΨGGCAGCΨGCΨGCAAGΨΨCGACGAGGACGAΨΨCΨGAG	3840
              ** ** ************   *****   ********* ** ** ** ***** ******
ORIGINAL      CCAGΨGCΨCAAAGGAGΨCAAAΨΨACAΨΨACACAΨAA------------------------	3822
FINAL         CCCGΨGCΨGAAGGGCGΨGAAACΨGCACΨACACAΨGAΨGACΨCGAGCΨGGΨACΨGCAΨGCA	3900
              ** ***** ** ** ** *** * ** ******* *                        
ORIGINAL      ------------------------------------------------------------	3822
FINAL         CGCAAΨGCΨAGCΨGCCCCΨΨΨCCCGΨCCΨGGGΨACCCCGAGΨCΨCCCCCGACCΨCGGGΨC	3960                                                                         

ORIGINAL      ------------------------------------------------------------	3822
FINAL         CCAGGΨAΨGCΨCCCACCΨCCACCΨGCCCCACΨCACCACCΨCΨGCΨAGΨΨCCAGACACCΨC	4020
                                                                          
ORIGINAL      ------------------------------------------------------------	3822
FINAL         CCAAGCACGCAGCAAΨGCAGCΨCAAAACGCΨΨAGCCΨAGCCACACCCCCACGGGAAACAG	4080                                                                          

ORIGINAL      ------------------------------------------------------------	3822
FINAL         CAGΨGAΨΨAACCΨΨΨAGCAAΨAAACGAAAGΨΨΨAACΨAAGCΨAΨACΨAACCCCAGGGΨΨG	4140                                                                         

ORIGINAL      ------------------------------------------------------------	3822
FINAL         GΨCAAΨΨΨCGΨGCCAGCCACACCCΨGGAGCΨAGCAAAAAAAAAAAAAAAAAAAAAAAAAA	4200                                                                       

ORIGINAL      ------------------------------------------------------------	3822
FINAL         AAAAGCAΨAΨGACΨAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA	4260
                                                                          
ORIGINAL      ------------------------	3822
FINAL         AAAAAAAAAAAAAAAAAAAAAAAA	4284

A pesar de la gran cantidad de cambios para estabilizar y optimizar la secuencia del ARN mensajero (mRNA) en cuanto a la proteína codificada solamente hay dos cambios, los indicados K986P y V987P. El resto de cambios son silenciosos, se cambia el codón por uno más optimizado para su traducción en células humanas pero el aminoácido codificado sigue siendo el mismo. Todos los demás aminoácidos codificados son los mismos que los que porta el genoma original del coronavirus, como se puede ver en este alineamiento también realizado con Clustal Omega, de EMBL-EBI, entre la glicoproteína S ORIGINAL y la glicoproteína S FINAL (los asteriscos indican que se mantiene la misma secuencia, los espacios indican diferencias entras las secuencias, solamente aparecen las dos Prolinas -PP- casi al final de la proteína final como diferencias). Utilizo el mismo código de colores descrito anteriormente. Las dos proteínas tienen un porcentaje de identidad del 99.84%.

 

ORIGINAL      MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFS	60
FINAL         MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFS	60
              ************************************************************
ORIGINAL      NVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIV	120
FINAL         NVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIV	120
              ************************************************************
ORIGINAL      NNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLE	180
FINAL         NNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLE	180
              ************************************************************
ORIGINAL      GKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQT	240
FINAL         GKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQT	240
              ************************************************************
ORIGINAL      LLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETK	300
FINAL         LLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETK	300
              ************************************************************
ORIGINAL      CTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISN	360
FINAL         CTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISN	360
              ************************************************************
ORIGINAL      CVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIAD	420
FINAL         CVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIAD	420
              ************************************************************
ORIGINAL      YNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPC	480
FINAL         YNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPC	480
              ************************************************************
ORIGINAL      NGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVN	540
FINAL         NGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVN	540
              ************************************************************
ORIGINAL      FNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITP	600
FINAL         FNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITP	600
              ************************************************************
ORIGINAL      GTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSY	660
FINAL         GTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSY	660
              ************************************************************
ORIGINAL      ECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTI	720
FINAL         ECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTI	720
              ************************************************************
ORIGINAL      SVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQE	780
FINAL         SVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQE	780
              ************************************************************
ORIGINAL      VFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDC	840
FINAL         VFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDC	840
              ************************************************************
ORIGINAL      LGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAM	900
FINAL         LGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAM	900
              ************************************************************
ORIGINAL      QMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALN	960
FINAL         QMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALN	960
              ************************************************************
ORIGINAL      TLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRA	1020
FINAL         TLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRA	1020
              *************************  *********************************
ORIGINAL      SANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPA	1080
FINAL         SANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPA	1080
              ************************************************************
ORIGINAL      ICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDP	1140
FINAL         ICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDP	1140
              ************************************************************
ORIGINAL      LQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDL	1200
FINAL         LQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDL	1200
              ************************************************************
ORIGINAL      QELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDD	1260
FINAL         QELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDD	1260
              ************************************************************
ORIGINAL      SEPVLKGVKLHYT	1273
FINAL         SEPVLKGVKLHYT	1273
              *************

En este otro artículo, publicado hace dos días, también se analiza la secuencia de ARN de la vacuna COVID-19 Cominarty.

Esquema de una LNP (nanopartícula lipídica) tipo, similar a la usada en el desarrollo de la vacuna COVID-19 por Pfizer/BioNtech. La molécula de ARN mensajero está aquí representado por las bolitas azules del interior de la nanopartícula. Fuente: ATA

Solamente nos queda comentar la mezcla de lípidos que conforman la nanogota que envuelve la molécula de ARN mensajero modificado. El fabricante (Pfizer/BioNtech) habla de LNPs (lipid nanoparticles), nanopartículas lipídicas. Estas LNPs permiten fusionarse con las membranas citoplasmáticas y, a través de la vía endosomal, verter su contenido al interior de la célula, donde el mRNA podrá ser traducido y convertido a la proteína S-mutada (con las dos Prolinas) cuya información genética porta modificada.

Según consta en el Informe de Evaluación de la EMA los componentes lipídicos de estas LNPs son:

  • ALC-0315 (4-hydroxybutyl)azanediyl)bis(hexane-6,1-diyl)bis(2-hexyldecanoate)
  • ALC-0159 (2-[(polyethylene glycol)-2000]-N,N-ditetradecylacetamide)
  • 1,2-Distearoyl-sn-glycero-3-phosphocholine (DSPC)
  • colesterol

y, además, la vacuna final contiene las siguientes sales y componentes básicos:  cloruro potásico, fosfato dihidrógeno de potasio, cloruro sódico, fosfato disodio dihidrato, sacarosa y agua, todo ello equilibrado a un pH entre 6.9 y 7.9. Algunos de esos ingredientes lipídicos pueden producir alergia en algunas personas, y por lo tanto, para ellas no estaría indicada la vacunación, como se indica en esta página resumen, a partir de las recomendaciones de la FDA.

Estas LNPs ya habían sido analizadas en estudios pre-clinicos, en animales, y se había verificado que eran adecuadas para administrar y llevar las moléculas de ARN mensajeros con nucleósidos modificados, como describieron Pardi y col. (2015).

Según consta en el Informe de evaluación de la EMA cada persona recibirá una dosis equivalente a 30 microgramos de ARN, encapsuladas en las LNPs en un volumen final inyectable de 0.3 ml por cada una de las dosis. Hay también que recordar que son necesarias dos dosis para llegar al 95% de protección. La segunda dosis se debe administrar 21 días (tres semanas) después de la primera, de acuerdo al informe de la EMA, o como también indican las recomendaciones de la FDA.

Esta vacuna COVID-19 de Pfizer/BioNtech BNT162b2/Cominarty tiene una eficacia del 95% para prevenir la COVID-19 (intervalo de confianza entre 90.3-97.6%). Los ensayos clínicos de fase II/III realizados sobre 36,523 participantes (entre vacunados y placebos) dieron como resultado 8 casos de COVID-19 entre los vacunados y 162 entre los que recibieron placebo, tal y como apareció publicado en la revista NEJM. Inicialmente estas empresas lanzaron dos prototipos de vacunas: BNT162b1 y BNT162b2, con moléculas de ARN mensajero distintas (el primer prototipo portaba informacion genética para un trímero secretable del dominio de unión al receptor, RBD). Sin embargo, tras un estudio piloto, y tras completar los estudios de fase I/II con el primer prototipo BNT162b1, y al observar que las reacciones en personas mayores se observaban en menor cantidad con la segunda versión, se optó por lanzar el ensayo clínico de fase II y fase III solamente con este segundo prototipo; BNT162b2, que finalmente es la que resultó aprobada y es la que será administrada a la población.

Espero que este artículo ayude a comprender la vacuna COVID-19 que nos administrarán durante las próximas semanas o meses. Se trata de una vacuna producto de la ciencia, de mucha ciencia básica (inicialmente desarrollada por muchos grupos, incluidos los investigadores de BioNtech, y luego escalada a nivel global en colaboración con Pfizer) y muchos estudios previos que finalmente en 2020 han servido para completar con rapidez unos ensayos pre-clínicos y clínicos que han demostrado la seguridad y la eficacia de la misma. Por lo tanto, a no ser que pertenezcamos a alguno de los grupos en los cuales la vacunación no está recomendada (p.e. niños menores de 16 años, ser alérgico a alguno de sus componentes, …), lo recomendable, responsable y solidario es vacunarse. Cuando nos toque.

Nota: he grabado un vídeo de divulgación científica de la serie BIOTENTE en el que explico como és la molécula de ARN de esta primera vacuna COVID-19 aprobada en Europa. También referido en una entrada en este blog.

https://montoliu.naukas.com/2020/12/27/la-ciencia-que-hay-detras-de-la-primera-vacuna-contra-la-covid-19/

Soy biólogo e investigador del CSIC en el Centro Nacional de Biotecnología. Me interesa la genética y los aspectos éticos de la investigación científica. Empecé en plantas para saltar luego a ratones y a humanos, donde sigo actualmente. Utilizo modelos animales para entender cómo se establecen las enfermedades raras y qué podemos hacer para curarlas. La edición genética con las herramientas CRISPR nos ha cambiado la vida. Todo lo que podemos hacer, ¿lo deberíamos hacer? Probablemente no. Existen límites éticos en toda investigación. En este blog combino todos estos temas junto a mi pasión divulgadora. Un poco de "gen" y un poco de "ética". Bienvenidos a mi blog sobre "Gen-ética".

Este es el undécimo vídeo de divulgación de la lista BIOTENTE en la que he ido describiendo, de forma sencilla, diferentes conceptos de la genética para poner esta disciplina al alcance de todo el mundo.

https://montoliu.naukas.com/2020/12/30/como-explicar-la-molecula-de-arn-que-contiene-la-primera-vacuna-covid-19-con-piezas-de-tente/

https://www.youtube.com/watch?v=0mKKTLvcETc

 

 

 

No hay comentarios: