Un nuevo algoritmo encuentra muchas enzimas de edición de genes en el ADN ambiental
CRISPR (repeticiones palindrómicas cortas agrupadas regularmente interespaciadas) es la respuesta del mundo microbiano a la inmunidad adaptativa. Las bacterias no generan anticuerpos cuando son invadidas por un patógeno y luego mantienen esos anticuerpos en suspenso si se encuentran nuevamente con el mismo patógeno, como lo hacemos nosotros. En cambio, incorporan parte del ADN del patógeno en su propio genoma y lo unen a una enzima que puede usarlo para reconocer esa secuencia de ADN patógeno y cortarlo en pedazos si el patógeno aparece nuevamente.
La enzima que realiza el corte se llama Cas, por asociado a CRISPR. Aunque el sistema CRISPR-Cas evolucionó como un mecanismo de defensa bacteriano, los investigadores lo han aprovechado y adaptado como una poderosa herramienta para la manipulación genética en estudios de laboratorio. También ha demostrado usos agrícolas, y la primera terapia basada en CRISPR acaba de ser aprobada en el Reino Unido para tratar la anemia falciforme y la beta-talasemia dependiente de transfusiones.
Ahora, los investigadores han desarrollado una nueva forma de buscar genomas de sistemas similares a CRISPR-Cas. Y descubrieron que podemos tener muchas herramientas adicionales con las que trabajar.
Modificando el ADN
Hasta la fecha, se han identificado seis tipos de sistemas CRISPR-Cas en varios microbios. Aunque difieren en los detalles, todos tienen el mismo atractivo: suministran proteínas a una secuencia determinada de material genético con un grado de especificidad que hasta ahora ha sido técnicamente difícil, costoso y lento de lograr. Cualquier secuencia de ADN de interés puede programarse en el sistema y dirigirse a ella.
Los sistemas nativos que se encuentran en los microbios a menudo incorporan una nucleasa (una enzima que escinde el ADN) en la secuencia para fragmentar el material genético de un patógeno. Esta capacidad de cortar cualquier secuencia de ADN elegida se puede utilizar para la edición de genes; junto con otras enzimas y/o secuencias de ADN, se puede utilizar para insertar o eliminar secuencias cortas adicionales, corrigiendo genes mutantes. Algunos sistemas CRISPR-Cas escinden moléculas de ARN específicas en lugar de ADN. Estos se pueden utilizar para eliminar ARN patógenos, como los genomas de algunos virus, de la misma forma que se eliminan en sus bacterias nativas. Esto también se puede utilizar para rescatar defectos en el procesamiento del ARN.
Pero hay muchas formas adicionales de modificar los ácidos nucleicos que pueden resultar útiles. Y sigue siendo una cuestión abierta si han evolucionado enzimas que llevan a cabo modificaciones adicionales. Entonces, algunos investigadores decidieron buscarlos.
Investigadores del MIT han desarrollado una nueva herramienta para detectar matrices CRISPR variables y la han aplicado a 8,8 tera (1012) pares de bases de información genómica procariótica. Muchos de los sistemas encontrados son raros y solo han aparecido en el conjunto de datos en los últimos 10 años, lo que resalta la importancia de continuar agregando muestras ambientales que antes eran difíciles de obtener a estos repositorios de datos.
La nueva herramienta era necesaria porque las bases de datos de secuencias de proteínas y ácidos nucleicos se están expandiendo a un ritmo ridículo, por lo que las técnicas para analizar todos esos datos deben mantenerse al día. Algunos algoritmos utilizados para analizarlos intentan comparar cada secuencia entre sí, lo que obviamente es insostenible cuando se trata de miles de millones de genes. Otros se basan en la agrupación, pero sólo encuentran genes que son muy similares, por lo que no pueden aclarar realmente las relaciones evolutivas entre proteínas distantes. Pero la agrupación rápida basada en hashtags y sensible a la localidad (“flash cluster”) funciona agrupando miles de millones de proteínas en menos grupos de secuencias más grandes que difieren ligeramente para identificar parientes nuevos y raros.
La investigación que utiliza FLSHclust ha eliminado con éxito 188 nuevos sistemas CRISPR-Cas.
Mucha CRISPyness
Algunos temas surgieron del trabajo. Una es que algunos de los sistemas CRISPR identificados recientemente utilizan enzimas Cas con dominios nunca antes vistos, o parecen ser fusiones con genes conocidos. Los científicos caracterizaron además algunas de ellas y descubrieron que una es más específica que las enzimas CRISPR actualmente en uso, y otra que corta el ARN que proponen es estructuralmente lo suficientemente distinta como para comprender un séptimo tipo completamente nuevo de sistema CRISPR-Cas.
Un corolario de este tema es la conexión de enzimas con diferentes funcionalidades, no solo nucleasas (enzimas que cortan ADN y ARN), con matrices CRISPR. Los científicos han aprovechado la notable capacidad de CRISPR para seleccionar genes vinculándolo a otros tipos de enzimas y moléculas, como los tintes fluorescentes. Pero obviamente la evolución fue lo primero.
Como ejemplo, FLSHclust identificó algo llamado transposasa asociado con dos tipos diferentes de sistemas CRISPR. Una transposasa es una enzima que ayuda a que un tramo específico de ADN salte a otra parte del genoma. La transposición guiada por ARN CRISPR se ha visto antes, pero este es otro ejemplo de ello. Se han encontrado varias proteínas con funciones variables, como proteínas con dominios transmembrana y moléculas de señalización, vinculadas a matrices CRISPR, lo que destaca la naturaleza de combinación y combinación de la evolución de estos sistemas. Incluso encontraron una proteína expresada por un virus que se une a las matrices CRISPR y las inactiva; esencialmente, el virus inactiva el sistema CRISPR que evolucionó para proteger contra los virus.
Los investigadores no solo encontraron nuevas proteínas asociadas con las matrices CRISPR, sino que también encontraron otras matrices repetidas regularmente interespaciadas que no estaban asociadas con ninguna enzima cas, similar a CRISPR pero no CRISPR. No están seguros de cuál podría ser la funcionalidad de estos sistemas guiados por ARN, pero especulan que están involucrados en la defensa, al igual que CRISPR.
Los autores se propusieron encontrar «un catálogo de proteínas guiadas por ARN que amplíe nuestra comprensión de la biología y evolución de estos sistemas y proporcione un punto de partida para el desarrollo de nuevas biotecnologías». Este trabajo revela una flexibilidad y modularidad organizativa y funcional sin precedentes de los sistemas CRISPR», escriben. Concluyen: «Esto representa sólo una pequeña fracción de los sistemas descubiertos, pero ilumina la inmensidad y el potencial sin explotar de la biodiversidad de la Tierra, y los candidatos restantes servirán como recurso para futuras exploraciones”.
Artículo del DOI: 10.1126/ciencia.adi1910