Fundamentos de la Biotecnología Genómica

Citation preview

FUNDAMENTOS DE LA BIOTECNOLOGÍA GENÓMICA

FUNDAMENTOS DE LA BIOTECNOLOGÍA GENÓMICA

ERRNVPHGLFRVRUJ r

Miguel Ángel Reyes-López (Coordinador y editor) José Luis Hernández-Mendoza Netzahualcóyotl Mayek-Pérez (Editores)

}

Primera edición: noviembre 2010 Diagramación: Varia Visual, Marisol Solis Corrección: Ángel Fosado Responsabilidad del Contenido: El contenido científico del presente libro es responsabilidad exclusiva de los autores correspondientes. FUNDAMENTOS DE LA BIOTECNOLOGÍA GENÓMICA Miguel Ángel Reyes-López José Luis Hernández-Mendoza Netzahualcóyotl Mayek-Pérez © Miguel Ángel Reyes-López, José Luis Hernández-Mendoza, Netzahualcóyotl Mayek-Pérez © Centro de Biotecnología Genómica © Instituto Politécnico Nacional © Consejo Tamaulipeco de Ciencia y Tecnología (Cotacyt) © Fondo Mixto de Fomento a la Investigación Científica y Tecnológica Conacyt - Gobierno del estado de Tamaulipas. © Plaza y Valdés, S.A. de C.V. Centro de Biotecnología Genómica Blvd. Del Maestro s/n esquina Elias Pina, Colonia Narciso Mendoza, C.P. 88710, Reynosa, Tamaulipas, México, Tel./Fax (+52 01899 9243627) Instituto Politécnico Nacional Unidad Profesional "Adolfo López Mateos", Zacatenco, Del. Gustavo A. Madero, C.P. 07738, México, D.F., Tels.: 5729 60 00, 5729 63 00, 5624 20 00 Consejo Tamaulipeco de Ciencia y Tecnología y Fondo Mixto de Fomento a la Investigación Científica y Tecnológica, Calle Fermín Legorreta #112 (21 Hidalgo y Juárez), Cd. Victoria, Tamaulipas, C.P. 87000, Tel.: 834 312 6400, 834 312 2461, 834 312 8255, 834 312 3241, 01 800 221 7777 Plaza y Valdés, S.A. de C.V. Manuel María Contreras 73, Colonia San Rafael México, D.F. 06470. Teléfono: 5097 20 70 [email protected] Plaza y Valdés Editores Calle Murcia, 2. Colonia de los Ángeles Pozuelo de Alarcón 28223, Madrid, España Teléfono: 91 862 52 89 [email protected] www.plazayvaldes.es ISBN: 978-607-402-319-0 Impreso en México / Printed in México

Agradecimientos Los editores y autores de esta obra agradecen el apoyo económico para su publicación a las siguientes instituciones: Centro de Biotecnología Genómica del Instituto Politécnico Nacional Consejo Tamaulipeco de Ciencia y Tecnología (Cotacyt) Fondo Mixto de Fomento a la Investigación Científica y Tecnológica Conacyt - Gobierno del estado de Tamaulipas

índice Prólogo Hugo A. Barrera-Saldaña

11

Capítulo I Los ácidos nucleicos y su cuantificación José A. Narváez-Zapata, Claudia P. Larralde- Corona e Isabel C. Rodríguez-Luna

13

Capítulo II Enzimas de restricción Ana M. Sifuentes-Rincón y Xóchitl F. De la Rosa-Reyna

47

Capítulo III Aplicaciones de la tecnología del ADN recombinante Juan M. González-Prieto, Sanjuana Hernández-Delgado, Krystal Lira-Méndez y Netzahualcóyotl Mayek-Pérez

Capítulo IV Reacción en Cadena de la Polimerasa (PCR) Mario A. Rodríguez-Pérez

;

61

95

Capítulo V Secuenciación Elma L. Salazar-Marroquín, Víctor R. Moreno-Medina y Miguel A. Reyes-López

123

Capítulo VI Expresión génica Ninfa Rosas-García, Alejandro Sánchez-Várela y José L. Hernández-Mendoza

149

Capítulo VII Caracterización de la expresión génica Netzahualcóyotl Mayek-Pérez, Sanjuana Hernández-Delgado, Krystal Lira-Méndez y Juan M. González-Prieto

173

Capítulo VIII Bioinformática Aldo Segura-Cabrera y Maurilio González-Paz

221

Capítulo IX Proteómica Xianwu Guo-Zhou y Miguel A. Reyes-López

253

Resumen del libro de fundamentos de la biotecnología genómica

275

Autores

277

Prólogo

U

na de las razones por la que este Centro de Biotecnología Genómica (CBG) nació en 1999, fue para que algún día llegase a convertirse en el referente por excelencia de la mejor investigación y aplicación de la biotecnología moderna. Para ello se sustentó su fundación en sólidos grupos de investigación, una infraestructura sin parangón en la región y un programa de formación de recursos humanos original, nacido como se debe, con buenos maestros, magníficos laboratorios y un regla de oro: retar a los alumnos a superar a sus maestros. Varias han sido las estrategias que se han seguido para alcanzar esta visión. Este documento representa un testimonio más del quehacer, conocimiento y compromiso por divulgar para compartir, de los magníficos investigadores que apasionadamente llevan hoy la antorcha que no hace mucho nosotros portábamos. Es un tratado de biología molecular y sus aplicaciones, que fundamenta y bautiza como moderna y ahora genómica, a la en realidad milenaria biotecnología. Son nueve capítulos que van desde cómo aislar y cuantificar los ácidos nucleicos, hasta cómo arrancarles sus secretos mediante el análisis teórico soportado por programas de cómputo, gracias a los cuales hoy es posible manejar las masivas cantidades de información que los proyectos genómicos vierten día con día a los bancos de datos. Les complementan a estos, sendos capítulos que resaltan la utilidad de valiosas herramientas moleculares como las enzimas de restricción, la recombinación del ADN, la amplificación millonaria in vitro de genes, el desciframiento de la estructura primaria del ADN, así como sobre nuestro entendimiento de la expresión génica y de las técnicas que echamos mano para estudiarla. Éstos se ilustran con didácticas figuras, en algunos casos incluyen recuentos históricos, en otros incorporan "recetas de laboratorio" y rematan con valiosas citas bibliográficas. Y aunque ha sido inevitable repetir conceptos en varios capítulos, sirva ello para beneficiar la comprensión de los mismos, sobre todo a la luz de los escasos textos sobre el tema a disposición de nuestros jóvenes aspirantes a incursionar en esta especialidad de espectaculares progresos, de la que en mi humilde opinión aún no vemos lo mejor. 11

FUNDAMENTOS DE LA BIOTECNOLOGÍA GENÓMICA

Fue sin duda gracias al increíble apoyo solidario de muchos líderes y colaboradores que desde su gestación, y sobre todo en los primeros cuatro años de vida del proyecto, se selló el futuro brillante de este magnífico Centro. Hoy es gracias a los autores de cada capítulo y al esfuerzo de sus editores, que la saga continúa. Mi agradecimiento por su leal compromiso, mis mejores augurios de satisfacción para los lectores que sabrán usar este manual para sumarse a la cruzada para traducir el conocimiento genómico en más y mejores técnicas para apoyar la modernización y competitividad del campo mexicano, y en buena hora por nuestra alma mater adoptiva, el IPN, pilar de la modernización de la técnica al servicio de la patria.

Hugo A. Barrera Saldaña Profesor Titular. Facultad de Medicina de la Universidad Autónoma de Nuevo León. Monterrey, Nuevo León, México Fundador y Primer Director del CBG-IPN

12

Capítulo I Los ácidos nucleicos y su cuantificación José A. Narváez-Zapata Claudia P. Larralde- Corona Isabel C. Rodríguez-Luna

Introducción

L

os ácidos nucleicos son biopolímeros que existen tanto en el núcleo de las células, así como en células bacterianas que no tienen núcleo y en los virus. Estas moléculas tienen primordial importancia porque determinan la síntesis de las proteínas y son el factor genético que determina las características hereditarias de todos los organismos vivos (información genética). En los ácidos nucleicos el grado de polimerización puede llegar a ser extremadamente alto, con moléculas constituidas por centenares de millones de nucleótidos en una sola estructura covalente. De la misma manera que las proteínas son polímeros lineales aperiódicos de aminoácidos, los ácidos nucleicos lo son de nucleótidos. La aperiodicidad de la secuencia de nucleótidos implica la existencia de información. De hecho, los ácidos nucleicos constituyen el depósito de información de todas las secuencias de aminoácidos de todas las proteínas de la célula. Existe una correlación entre ambas secuencias, lo que se expresa diciendo que ácidos nucleicos y proteínas son colineales; la descripción de esta correlación es lo que llamamos Código Genético, establecido de forma que a una secuencia de tres nucleótidos en un ácido nucleico corresponde un aminoácido en una proteína. La función de los ácidos nucleicos no se reduce, por otra parte, a contener la información necesaria para la síntesis de las proteínas celulares. Hay secuencias regulatorias que controlan la expresión de las diferentes unidades genéticas, por sí mismas o a su vez controladas por otras moléculas (hormonas, factores 13

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

de crecimiento, señales químicas en general); asimismo existen ácidos nucleicos implicados en la transmisión y procesado de la información genética, así como con funciones catalíticas (ribozimas).

Estructura y características fisicoquímicas de los ácidos nucleicos Los ácidos nucleicos tienen una estructura polimérica lineal. Son polinucleótidos formados por condensación de sus monómeros (los nucleótidos, unidad de repetición). Cada nucleótido está formados por tres moléculas funcionales: 1) ácido fosfórico, 2) un azúcar de cinco carbonos, la cual puede ser la ribosa ó la desoxirribosa (véase Figura 1); y 3) una base nitrogenada, perteneciente a la familia de las purinas ó a la de las pirimidinas (véase Figura 2). Estos tres componentes están unidos de manera similar en dos tipos de nucleótidos principales, los cuales se distinguen por el tipo de azúcar que contienen. En el caso del ácido ribonucleico (ARN), contiene a la ribosa, mientras que en el ácido desoxirribonucleico (ADN) encontramos a la desoxirribosa.

β D RIBOSA

β D DESOXIRRIBOSA

Figura 1. Azúcares presentes en los ácidos nucleicos.

ADENINA

CITOCINA

GUANINA

TIMINA

Figura 2. Bases nitrogenadas pirimídicas y púricas presentes en los ácidos nucleicos. 14

URACILO

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

En cuanto a las bases nitrogenadas, existen cinco tipos, y tres de ellas son comunes en ambos ácidos nucleicos: adenina (A), guanina (G) y citosina (C), mientras que timina (T) solo se encuentra en el ADN y el uracilo (U) solamente en el ARN (véase Figura 2). Una característica química común que comparten el ADN y el ARN es que son ácidos fuertes debido a la presencia de grupos fosfato en su estructura. Tanto en el ARN como en el ADN SUS nucleótidos están conectados mediante los carbonos 3' y 5' de sus azúcares, por lo que la cadena resultante tiene polaridad (dirección) en la cual un extremo tiene un carbono 5' libre, y el otro extremo un carbono 3' libre (véase Figura 3). Por convención una cadena de nucleótidos se describe en la dirección 5' a 3'. La secuencia de bases en las cadenas de ambos ácidos nucleicos es esencial para su capacidad de transferencia de información genética. El ARN típicamente es de cadena sencilla, sin embargo, debido a la posibilidad de apareamiento de bases intra e intermoleculares, se presentan estructuras secundarias que juegan un papel muy importante en su funcionalidad, como se explica más adelante. La estructura de una molécula de ADN consiste en dos cadenas de polinucleótidos enrolladas en una doble hélice. El esqueleto principal de cada cadena lo constituyen unidades de desoxirribosa (azúcar) fosfatada. En el interior de la doble hélice se encuentran las bases púricas y pirimídicas y la secuencia de éstas cuatro bases son las que llevan la información genética. Una base nitrogenada en una posición de la cadena principal se aparea con una base de la cadena complementaria de una manera precisa: la adenina con la timina, y la citosina con la guanina, presentándose además la formación reversible de puentes de hidrógeno, formándose 2 puentes entre el par A-T, y 3 puentes en el par C-G (véase Figura 4), y resultando en una gran similitud geométrica, la cual es necesaria para la correcta conformación y estabilidad de la molécula de ADN (véase Figura 5). Una de las características más importantes que le da la especificidad del apareamiento de bases es su naturaleza complementaria (véase Figura 5), lo cual significa que a partir de la secuencia de una de las cadenas se puede conocer la secuencia de la otra, es decir, una cadena es molde de la otra y viceversa. Puestas juntas, esta polaridad y complementaridad determinan el proceso de replicación, durante la cual se crea una molécula hija de ADN a partir de la molécula original (molde). La estructura del ADN se mantiene gracias a los enlaces de hidrógeno establecidos entre las bases, por una parte, y a una interacción de naturaleza hidrofóbica que se da entre pares de bases contiguos, la interacción de apilamiento (stacking), en donde los pares de bases sucesivos se apilan unos sobre otros como una pila de monedas, y una vuelta completa de la hebra contiene 10 pares de bases, lo cual resulta en una longitud axial de 34 Á. El ADN puede presentar variaciones en su conformación tridimensional. Por ejemplo, la forma B es la que aparece con un grado importante de hidratación 15

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Figura 3. Formación direccional de enlaces fosfodiéster en una cadena de polinucleótidos. 16

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

Figura 4. Direccionalidad y formación de puentes de hidrógeno entre las bases nitrogenadas de las dos cadenas complementarias del ADN.

Figura 5. Esquematización de la duplicación fiel (replicación) de la secuencia de nucleótidos de una molécula de ADN a partir de su naturaleza complementaria.

17

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

y es la que presenta el ADN in vivo. Fue propuesta por Watson y Crick en su trabajo original de 1953, y se caracteriza por ser dos cadenas de polinucleótidos enrolladas una en torno a la otra, constituyendo una doble hélice dextrógira de tipo plectonémico (lo cual quiere decir que para separar una de otra es preciso desenrollar previamente la hélice). Las bases están en planos aproximadamente perpendiculares al eje mayor de la doble hélice y dirigidas hacia dentro de la estructura, mientras que el continuo desoxirribosa-fosfato se dirige hacia el exterior. Otras características estructurales del ADN-B son las siguientes: la forma del anillo furanósico de la pentosa es la llamada endo-2' lo cual quiere decir que el carbono 2' está claramente fuera del plano que aproximadamente marcan los carbonos 1', 3', 4' y el oxígeno hemiacetálico; y por otra parte, que la situación de la base respecto a la pentosa es anti-, es decir, base y pentosa se sitúan hacia lados opuestos del enlace glicosídico. La conformación A del ADN aparece en cristales de baja hidratación y menor grado de polimerización que el ADN-B. Asimismo, es la conformación favorecida en el ARN de doble hélice y en los híbridos ADN-ARN. Se trata de una estructura más ancha y corta que el ADN-B, que consta, al igual que éste, de una doble hélice dextrógira formada por dos polinucleótidos enrollados plectonémicamente que cursan asimismo con polaridades opuestas. El ADN-A muestra el mismo patrón de apareamiento de bases que el ADN-B (A-T y G-C) pero a diferencia de éste, los planos de los pares de bases están situados oblicuamente respecto al eje mayor de la doble hélice. En el DNA-A los surcos tienen aproximadamente la misma anchura y las bases púricas se sitúan en anti-, como en el DNA-B. A diferencia de éste, la disposición del anillo furanósico de la pentosa es endo-3'. La conformación Z del ADN se presenta en zonas ricas en el par G-C; se trata también de un doble polinucleótido en enrollamiento plectonémico, con polaridades opuestas, y en el que el patrón de apareamiento de bases es el mismo. No obstante, hay algunas diferencias importantes entre la conformación Z y las otras dos. En primer lugar, las hélices son levógiras a diferencia de las conformaciones A y B. El conjunto es una doble hélice más estrecha y alargada que el ADN-B; una diferencia notable es que las purinas están en conformación syn-, es decir, la base y la pentosa están situados del mismo lado que el enlace glicosídico. Otra diferencia estructural es que en el ADN-Z desaparece por completo el surco ancho mientras que el surco estrecho se hace aún más estrecho y profundo. El hecho de que las dos cadenas del ADN estén unidas por puentes de hidrógeno le da la característica de que pueden ser separadas al calentar la solución donde se encuentren disueltas. Regiones de ADN ricas en el par A-T requerirán menor temperatura de calentamiento para separarse que regiones abundantes en el par G-T, debido al mayor número de puentes de hidrógeno que se encuentran en este último caso. El proceso de disociación (melting) de la molécula de ADN se monitorea cuantificando la absorbancia de la solución a 260 nanómetros, y dado que una cadena 18

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

i

de polinucleótidos tiene un mayor poder de absorbancia que cuando se encuentra apareada, la disociación del ADN se mide como un incremento en la absorbancia global de la solución. La temperatura de disociación (Tm) nos indicará entonces la temperatura a la cual el valor de la absorbancia está a la mitad de los valores límite que se obtienen cuando la solución está completamente como doble hélice y cuando está completamente disociada. Por consiguiente, el valor de Tm está correlacionado con el contenido del par G-C de la muestra de ADN. Por ejemplo, la bacteria Escherichia coli, con un 50% de contenido G-C tienen una Tm de 69°C, mientras que el contenido de G-C del 68% que tiene Pseudomonas aeruginosa resulta en una Tm de 76°C. Esta diferencia de composición de bases de hecho es utilizada como una herramienta de caracterización de especies. El rango de contenido G-C que se ha cuantificado para diferentes organismos varía entre el 23% al 75%. Una de las virtudes de la estructura de la molécula de ADN es que, una vez que la temperatura de la solución baja, las cadenas complementarias pueden aparearse nuevamente para volver a formar la doble hélice, proceso que se denomina hibridación, y la cual constituye también una herramienta muy importante en la tecnología del ADN recombinante y en análisis en el área de la medicina y la ecología.

Importancia biológica del Ácido Desoxirribonucleico (ADN) El ácido desoxirribonucleico (ADN) es un biopolímero cargado de toda la información hereditaria de la célula. Cuando una célula se divide, cada célula hija recibe al menos una copia completa del ADN de su progenitor, lo cual resulta que ellas tengan un gran parecido en forma y función a la célula madre. La manera en que se guarda la información en este larguísimo biopolímero es a través de la secuencia de sus monómeros (nucleótidos). La función primaria del ADN es entonces guardar las instrucciones para la síntesis de moléculas de ARN de secuencia y longitud específicas, y algunas de las cuales a su vez son utilizadas para la síntesis de proteínas específicas. Un segmento de ADN que codifica la secuencia de una molécula de ARN es llamado gen y el producto resultante (ARN funcional ó una proteína) será entonces la expresión bioquímica tangible de la información contenida en el ADN. La expresión de parte o de toda la información genética primaria o fenotipo de una célula eucariótica, que en concreto se encuentra localizada dentro del núcleo celular y está codificada en el ADN, adopta la forma de polipéptidos, que se sintetizan en el citoplasma. Dado que el ADN genómico no es un contenido citoplasmático normal, las células necesitan mecanismos para llevar a cabo la transferencia de la información necesaria desde el núcleo a la maquinaria citoplasmática sintetizadora de proteínas. En resumen, la información genética transcrita en el ADN puede ser duplicada en más ADN, durante la replicación, o bien traducida a proteínas. 19

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Importancia biológica del Ácido Ribonucleico (ARN) La expresión de los genes conduce a la síntesis de moléculas de ARN a partir de un molde de ADN, un proceso conocido como transcripción. El ARN se fabrica sólo a partir de una de las cadenas de la hélice de ADN de doble cadena. La transcripción está catalizada por una enzima, la polimerasa de ARN, y sigue reglas similares a las de la replicación. El ARN presenta similitudes con el ADN, aunque en el ARN el azúcar presente es la ribosa y el uracilo reemplaza a la timina. La extracción del ARN de una célula produce varios tipos moleculares básicos: ARN ribosomal, de transferencia y mensajero, más una cantidad limitada de otras moléculas de ARN pequeñas. La función global de estos tres tipos de ARN es la de leer e implementar las instrucciones genéticas contenidas en el ADN. El ARN mensajero (ARNm) es complementario a la secuencia de un gen específico en el ADN, y su función es llevar la información del ADN a otra parte de la célula (ribosomas), donde se lleva a cabo la traducción de esa información. Dado que la longitud de un gen puede ser muy variable, también lo puede ser su ARNm, aunque típicamente se encuentran en el rango de 103 a 104 nucleótidos. La traducción de la información que lleva el ARNm se lleva a cabo en un conjunto de proteínas específicas en los ribosomas, las máquinas encargadas de la síntesis de las proteínas, el cual está formado en hasta un 65% por ARN ribosomal (AROT) el cual puede ser de varios tamaños según su coeficiente de sedimentación (s), típicamente 5s, 16s y 23s en procariontes, y 5s, 7s, 18s y 28s en eucariontes. Finalmente el ARN de transferencia (ARNÍ) comprende un grupo de moléculas de ARN, más bien pequeñas, cada una con especificidad de unión a un aminoácido concreto; se encargan de acarrear los aminoácidos a los ribosomas, donde se incorporan al polipéptido en formación, participando en el proceso de traducción en el ribosoma. Las moléculas de ARN mensajero (ARNm), fabricadas sobre el ADN molde, contienen la información que será traducida a proteínas. La secuencia de bases del ARNm determina la secuencia de aminoácidos.

Extracción y aislamiento de los ácidos nucleicos El uso de ADN para su análisis o manipulación requiere que éste sea aislado y purificado para la obtención de resultados confiables. Se han establecido una gran diversidad de protocolos para la obtención de ADN de una gran variedad de muestras, sin embargo, todos poseen etapas en común, las cuales serán descritas a continuación. 20

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

Extracción de ADN. El ADN es obtenido de células a través de métodos que rompen las paredes celulares y disuelven las membranas. Sin embargo, paralelamente, esta etapa debe prevenir la fragmentación del ADN por tratamientos mecánicos y la degradación del mismo por procesos enzimáticos. En general, cuando una célula es expuesta a condiciones traumáticas (tales como los métodos de extracción de ADN) se liberan al medio grandes cantidades de enzimas ADNasas, las cuales se encargan de destruir el ADN expuesto para prevenir posibles errores en sus secuencias (mutaciones) ó para impedir su transferencia a otras células (Ausubel y otros, 2002). En general para la primera etapa en la extracción del ADN se emplean soluciones amortiguadoras de extracción, los cuales mantienen el pH entre 7 y 8, lo que incrementa la vida media y viabilidad del ADN, por lo que se utilizan también algunas sales como el EDTA (véase Cuadro 1) que funcionan como agentes quelantes de los cofactores de las enzimas ADNasas, algunos detergentes muy concentrados para solubilizar las membranas como el SDS, agentes biológicos, como las enzimas pectinasas para disolver las paredes celulares y agentes inhibidores de proteínas como el DTT y P-mercaptoetanol los cuales desestabilizan algunas ADNasas. El empleo y la concentración de los diversos reactivos varía de acuerdo a las características de la fuente de extracción del ADN. A pesar de lo anterior, la cantidad de ADNasas liberadas durante el proceso de extracción es muy alfa, por lo que hay que asegurar la estabilidad del ADN controlando la temperatura del proceso, ya que temperaturas extremas muy frías o muy calientes inhiben a las enzimas ADNasas. Lo anterior se logra al emplear nitrógeno líquido para asegurar temperaturas muy bajas y el baño María para asegurar temperaturas muy altas. Adicionalmente, se puede incrementar la velocidad de extracción para impedir una mayor exposición del ADN a los agentes

Cuadro 1. Principales reactivos empleados para la extracción y concentración de los ácidos nucleicos (Sambrook y Rusell, 2001)

Extracción de ácidos nucleicos

Reactivo Isotiocianato de Guanidina EDTA CTAB SDS

Concentración de los ácidos nucleicos

Acetato de Amonio Cloruro de Litio Cloruro de Sodio Acetato de Sodio 21

Solución Stock

Concentración Final

10 M 0.5 M 0.1 M 10%

3M lmM lmM 0.5%

10.0 M 8.0 M 5.0 M 3.0 M

2.0-2.5 M 0.8 M 0.2 M 0.3 M

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

degradadores. La velocidad de extracción se puede incrementar usando morteros, vortex y homogenizadores. Lo anterior exige adicionalmente un cuidado mayor del proceso para impedir la fragmentación del ADN (Sambrook y Russell, 2001). Limpieza del ADN. Una vez liberado el ADN durante el proceso de extracción se hace necesaria la purificación del mismo para aislarlo de los agentes degradadores. Adicionalmente, los agentes contaminantes conducen a que el ADN no sea viable para posteriores aplicaciones moleculares. Los agentes contaminantes pueden degradar el ADN a largo plazo, e inhibir algunas reacciones enzimáticas tales como la acción de las polimerasas, las cuales son usadas para amplificar o secuenciar el ADN. Se utilizan una gran variedad de formas para purificar el ADN, una de las más usadas es el empleo del detergente catiónico CTAB, el cual en condiciones de baja fuerza iónica precipita preferentemente ADN y en condiciones de alta fuerza iónica forma complejos con proteínas y polisacáridos ácidos. De esta forma, es posible purificar el ADN cambiando la concentración de sal en el amortiguador de extracción. Otros reactivos ampliamente empleados para la purificación de los ácidos nucleicos son las sales caotrópicas, las cuales tienen la capacidad de desnaturalizar las proteínas interfiriendo con sus estructura terciaria, por lo que son muy empleadas para inactivar ADNasas y ARNasas. En el caso particular de las ARNasas, los agentes caotrópicos poseen un papel muy importante debido a que las ARNasas están constituidas de ARN y, por lo tanto, son inmunes a la mayoría de los agentes químicos con actividad proteolítica. Entre las sales caotrópicas más empleadas se encuentran el isotiocianato de guanidina y el cloruro de guanidina. En general es posible eliminar proteínas y metabolitos secundarios del ADN al emplear lavados con solventes orgánicos. Los solventes que más se emplean son el cloroformo para separar proteínas y el fenol para separar polisacáridos. En la mayoría de los casos se utilizan diversas etapas de purificación y limpieza del ADN de acuerdo a las características de la muestra (Sambrook y Russell, 2001). Concentración del ADN. Una vez liberado el ADN durante el proceso de extracción el siguiente paso consiste en la concentración del mismo para su uso posterior en las diversas aplicaciones moleculares. De entre los diversos métodos que hay en la literatura el más usado es la precipitación con alcohol. El alcohol elimina el agua alrededor de los ácidos nucleicos y expone a los grupos fosfatos cargados negativamente. Los iones positivos de las sales disueltas se unen a estos grupos fosfatos y reducen las fuerzas repulsivas entre las diferentes cadenas de polinucleótidos, conduciendo a que estos formen complejos muy densos que finalmente precipitan. Se usan diversas sales para lograr este propósito. Entre las sales más comunes se encuentran el acetato de amonio, que tiene la ventaja de reducir la precipitación de polímeros contaminantes, tales como oligonucleótidos y polisacáridos. Sin embargo, 22

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

los iones amonio inhiben algunas enzimas usadas en las reacciones posteriores en el ADN, por lo que a veces no se recomienda su uso. Otras sales ampliamente usadas son el cloruro de litio recomendada para precipitar selectivamente ARN, el cloruro de sodio que se recomienda cuando el amortiguador de extracción contiene SDS y el acetato de sodio, el cual es el más utilizado en las precipitaciones preparativas. La elección de la sal a usar durante el proceso de extracción depende de las características particulares de la muestra (Ausubel y otros, 2002). Por otra parte, es posible purificar el ADN empleando técnicas bioquímicas convencionales como la cromatografía de afinidad, usando columnas de hidroxiapatita. En esta técnica los grupos fosfatos de los ácidos nucleicos se unen con el calcio presente en la columna; posteriormente éstos son eluidos con amortiguadores de fosfato. Este método es particularmente útil para la concentración de ADN con alto peso molecular independientemente si se encuentra en hebra simple ó doble. Existen otros tipos de columnas para aplicaciones específicas del ADN como son las columnas de Sephadex y Bio-Gel P-60 cuyo principio es la exclusión por tamaño. Sin embargo, el método empleado deberá corresponder a las características del ADN y a SU posible aplicación en la concentración de ADN (Sambrook y Russell, 2001).

Protocolo modificado de extracción con CTAB (bromuro de cetil-trimetil-amonio) (Sambrook y Rusell, 2001) El protocolo se basa en el tratamiento inicial de la muestra vegetal molida (puede ser también utilizado en hongos) con una solución de CTAB caliente, extracción de b s proteínas con una solución de cloroformo-alcohol isoamílico, seguido de la precipitación del complejo ADN-CTAB con isopropanol. La pastilla de ADN resultante después de centrifugar se lava, seca y resuspende. Dependiendo del tejido que se trate pudieran requerirse pasos adicionales de purificación para remover ARN, polisacáridos, polifenoles y otros contaminantes. En el protocolo que se presenta a continuación se incluye un tratamiento con RNasa y precipitación con acetato de amonio, para eliminar el ARN y remover algunos polisacáridos.

Reactivos • Nitrógeno líquido. • Solución amortiguadora de extracción: CTAB al 2% p/v, NaCl 1.4 M, EDTA 20 mM, Tris-HCL 100 mM, pH8.0, β-mercaptoetanol al 0.2% (añadido inmediatamente antes de usarse). 23

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

• • • • • •

Solución de cloroformo-alcohol isoamílico (24: 1). Solución de RNasa: 10 mg mL-1 de RNasa A en Tris-HCl 10 mM, NaCl 15 mM, pH 7.5, hervir por 15 min, enfriar a temperatura ambiente y guardar a -20°C. Isopropanol al 100%. Solución de lavado: etanol al 70%, acetato de amonio 10 mM. Solución amortiguadora de TE: Tris-HCl 10 mM, EDTA 1 mM, pH 8.0. Solución de acetato de amonio 7.5 M.

Metodología 1. Moler en un mortero hasta 3 g de tejido fresco ó 0.5 g de material liofilizado hasta volverlo un polvo fino utilizando nitrógeno líquido. El nitrógeno no es indispensable para el material liofilizado, pero facilita el molido. En caso de tejido fresco es importante que el material molido no se descongele antes de agregarlo a la solución amortiguadora de extracción, ya que de lo contrario las enzimas liberadas degradarán rápidamente el ADN. Si no se tiene nitrógeno líquido, el material puede molerse en la solución amortiguadora de extracción caliente, pero esto resultará en una menor calidad y rendimiento de ADN. 2. Transferir el polvo lo más rápidamente posible a 15 mL de solución amortiguadora de extracción a 60°C en un tubo con tapa de polipropileno, revolviendo los posibles agregados con la ayuda de una espátula. 3. Incubar por 30 min a 60°C en un baño maría, mezclando suavemente cada 10 min. La temperatura y tiempo pueden ser optimizadas de acuerdo al tejido ó especie utilizados. 4. Añadir 1 volumen de solución de cloroformo-alcohol isoamílico, tapar nuevamente el tubo y agitarlo por 10 min con la mano ó en un agitador orbital. La agitación debe ser suave pero con suficiente fuerza y constancia para permitir la emulsificación de las fases. 5. Centrifugar por 10 min (5 mil xg) a temperatura ambiente. Dependiendo de la pureza del ADN deseada la fase superior (acuosa) puede ser re-extraída de una a varias veces con solución fresca de cloroformo-alcohol isoamílico. 6. La fase acuosa final se transfiere a un tubo de centrífuga. Se añade la solución de RNasa a una concentración final de 100 μg mL', se mezcla e incuba a tem­ peratura ambiente por 30 min. 7. Se añaden 0.6 vol de isopropanol frío y se agita suavemente por inversión varias veces. El complejo ADN-CTAB debe observarse como una pelusa o redecilla blanquecina, el cual se recupera enrollándolo en un gancho de vidrio formado 24

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

en la punta de una pipeta Pasteur, transfiriéndolo a la solución de lavado (paso 8) y dejándolo secar (paso 9). Si la muestra se ve simplemente floculenta, turbia ó definitivamente clara después de haberla mezclado con el isopropanol frío (lo cual no es inusual), el precipitado se colecta centrifugando a baja velocidad (2 mil xg) a 4°C. Si una pastilla es visible, se continúa con el paso 8. Si no, la solución se guarda a -20°C de 30 min toda la noche y se centrifuga nuevamente a 2 500 xg. 8. Se añaden 20 mL de la solución de lavado, se agita suavemente por unos minutos, y se precipita por centrifugación (10 min a 5 mil xg y 4°C). Este paso remueve el CTAB residual. 9. Se invierten los tubos y se dejan secar boca abajo sobre una toalla de papel por aproximadamente una hora. Hay que tener especial cuidado en que la pastilla no se desprenda del fondo del tubo. La pastilla no debe tener al final etanol residual así como tampoco estar demasiado seco, ya que en ambos casos la re-suspensión se dificulta. 10. Se añade un volumen apropiado de solución amortiguadora de TE (1 mL, por ejemplo) dependiendo de los pasos subsecuentes de purificación elegidos, y se deja disolver la pastilla por difusión (sin agitar) a 4°C. La duración de éste último proceso dependerá de la pureza del ADN obtenido y de la presencia de polisacáridos contaminantes. El ADN de alto peso molecular requiere varias horas para disolverse.

Tratamiento opcional con acetato de amonio 1. Añadir 0.5 vol de solución de acetato de amonio 7.5 M, mezclar y enfriar en hielo por 15 min. 2. Centrifugar por 30 min (10 mil xg, 4°C) y transferir el sobrenadante a un tubo nuevo. 3. Añadir 2 vol de etanol 96%, mezclar por inversión y guardar a -20°C por 1 h. 4. Centrifugar por 10 min (5 mil xg, 4°C), lavar la pastilla con etanol 70% y centrifugar nuevamente. 5. Drenar la pastilla y disolver en un volumen apropiado de solución amortiguadora TE. El protocolo anterior puede ser escalado a menor cantidad de material inicial, para lo cual deberán usarse en tubos de microcentrífuga. Es de hacer notar que el protocolo descrito es también adecuado para usarse en la extracción de ADN de hongos. 25

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Extracción de ADN a partir de un cultivo bacteriano (TSNT) (Sambrook y Rusell, 2001) Reactivos • Solución amortiguadora de TE: Tris-HCl 10 mM, EDTA 1 mM, pH 8.0. • Solución de lisis 2 (TSNT): 2% Tritón X-100, 1% sos, 100 mMNaCl, 10 mM Tris. • HClpH 8.0 (para prepararla tomar 4 mL Tritón X-100, 10 mL de SDS al 20%, 4 mL de NaCl 5 M y 2 mL Tris-HCl pH 8, disolver en 50 mL de agua destilada y aforar a 200 mL). • Solución de cloroformo-octanol.

Metodología 1. Colocar 500 μL de un cultivo bacteriano en un tubo eppendorf de 1.5 mL y centrifugarlo a 10 mil rpm durante 2 min. 2. Descartar el sobrenadante y resuspender la pastilla de bacterias obtenida en 100 μL de TE IX. 3. Agregar 400 μL de solución de lisis 2 y 10 mL de proteínasa K (10 mg mL 1 ). 4. Agregar 500 μL de cloroformo-octanol y agitar vigorosamente. 5. Centrifugar a 8 mil xg durante 5 min. 6. Recuperar el sobrenadante y agregar 500 μL de cloroformo-octanol, agitar vigorosamente y centrifugar igual que en el paso 5. 7. Tomar el sobrenadante y precipitar el ADN agregando 2 vol de alcohol 100% y 0.1 vol de acetato de sodio 3 M, pH 7.52. 8. Incubar a -20°C durante 1 h. 9. Centrifugar y lavar la pastilla con etanol 70%. 10. Centrifugar, secar la pastilla y resuspender en 50 μL de TE IX.

Protocolo modificado para extracción de ADN genómico de sangre (Sambrook y Rusell, 2001) El tipo de muestra más común para el análisis del material genético de un animal es la sangre, por lo cual se presentan dos protocolos alternativos, que sin embargo también pueden adaptarse a otros tejidos. La solución de Chomczynski se utiliza para purificar el ADN genómico a partir de células o tejido de origen animal y vegetal, 26

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

o de bacterias y levaduras. El ADN se purifica en dos pasos: un paso de lisis celular y homogenización con la solución de Chomczynski y otro de precipitación con alcohol etílico. La simplicidad y rapidez de este método permiten el procesamiento simultáneo de gran número de muestras y la reproducibilidad y pureza del ADN obtenido permite su uso posterior en cualquier aplicación en biología molecular.

Reactivos •

Solución de Chomczynski (ó solución desnaturalizante). •• Tiocianato de guanidina 4 M. - Citrato de sodio 25 mM, pH 7. - 2-mercaptoetanol 0.1 M. - Sarcosil (N-lauril sarcosina) al 0.5%.

Método de preparación: a una botella nueva de tiocianato de guanidina de 100 g se le añaden directamente 117.2 mL de agua, 7 mL de citrato de sodio 0.75 M (pH 7), 10.5 mL de sarcosil 10%. Se entibia a 65°C para tener una buena disolución. El 2-mercaptoetanol se añade justo antes de utilizar la solución, añadiendo 7.2 μL por mililitro de solución. • Buffer de lisis. Sacarosa 0.32 M. Tris 10 mM, pH 7.5. MgCl2 5 mM. Tritón X-100 1%.

Metodología I) Lisis y Homogenización: 1. A un volumen de 300 μL de sangre agregar buffer de lisis en proporción 1: 5 (para 300 μL de sangre, adicione 1 500 μL de buffer de lisis), y agitar suavemente hasta lograr lisis celular (± 20 pipéteos suaves). 2. Centrifugar a 4 mil rpm por 10 min y en forma manual desechar el sobrenadante teniendo cuidado de no descartar el pellet obtenido. 3. Añadir 1 mL de solución de Chomczynski y lisar el precipitado por pipeteo suave y repetido. 27

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

4. Centrifugar el homogenizado por 10 min a 10 mil rpm a temperatura ambiente. Transfiera el sobrenadante a un microtubo nuevo. Este paso permite eliminar fragmentos insolubles, ARN y polisacáridos. II) Precipitación del ADN genómico: 1. Precipitar el ADN añadiendo 0.5 mL de alcohol etílico absoluto por cada mililitro de solución de Chomczynski usada en el paso de homogenización. 2. Mezclar por inversión e incubar por 1-3 min a temperatura ambiente. Debido al pequeño tamaño de la muestra utilizada inicialmente, el ADN no formará precipitado visible. Por esta razón, se debe centrifugar a 10 mil rpm por 1-2 min a temperatura ambiente para precipitar el ADN. 3. Lavar el precipitado de ADN con 1 mL de alcohol etílico al 95%. Agitar por inversión y centrifugar a 10 mil rpm por 1-2 min. Repetir este paso. 4. Desechar el sobrenadante vertiendo el contenido manualmente y dejar secar por 5 min temperatura ambiente. Sacar el exceso de alcohol utilizando una micropipeta, cuidando de no sacar la pastilla. 5. Disolver el precipitado de ADN en una solución de hidróxido de sodio 8 mM por pipeteo suave y repetido (utilice 50 μL para resuspender).

Protocolo de fenol caliente para la extracción de ADN de biopelículas ambientales (Narváez-Zapata y otros, 2005) El método de extracción descrito a continuación es una optimización del proceso de lavado fenol: cloroformo descrito preliminarmente por Sambrook y Rusell (2001) y que ha sido aplicado en plantas. Este método, de acuerdo a los autores, resulta ser eficiente para la remoción de contaminantes, principalmente de polisacáridos y proteínas, empleando combinaciones de fenol: cloroformo, ya que la combinación de los dos tipos de solventes orgánicos resulta ser más eficiente que uno solo. Así mismo, el fenol resulta ser adecuado para la desnaturalización de las proteínas, mientras que el cloroformo actúa inhibiendo la actividad de las RNasas. El empleo posterior de cloroformo remueve cualquier residuo de fenol que pudiera haber quedado en la preparación de los ácidos nucleicos obtenidos (Sambrook y Rusell, 2001). Dado que una de las principales características de las biopelículas es una alta concentración de polisacáridos y otros contaminantes orgánicos originarios de las microorganismos presentes y del sustrato, como primer paso es necesario implementar una remoción de contaminantes y de 28

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

protección de los ácidos nucleicos, con el fin de obtener ADN con un grado de pureza y concentración adecuadas para su posterior amplificación por PCR. Los pasos críticos del protocolo se describen brevemente a continuación, cabe señalar que una descripción detallada de los diferentes pasos se realiza más adelante. Primeramente es necesario establecer un amortiguador de extracción adecuado para este tipo de muestras que no incluya enzimas costosas. Adicionalmente, se debe escalar el volumen del amortiguador a pequeñas cantidades con el fin de optimizar velocidad y costos. El amortiguador seleccionado es el Tris-HCl, ya que ha demostrado ser adecuado para mantener la integridad y viabilidad del ADN durante mucho tiempo, a la solución se adiciona con EDTA y SDS, con el fin de desestabilizar los cofactores de las enzimas ADNasas y disolver las membranas celulares de las bacterias, respectivamente. La solución final se ajusta a 10 mM Tris pH 7.5, 1 mM EDTA y 0.5% SDS, abreviada como TES. Otro aspecto importante con respecto a la extracción es la cantidad de material biológico que resulta ser adecuada para el aislamiento exitoso del ADN; es decir, la cantidad mínima de biopelícula que es necesaria para obtener una buena concentración de ADN, ya que un exceso de muestra podría obstaculizar la acción del amortiguador de extracción, debido a una sobresaturación de contaminantes. El segundo paso consiste en determinar las condiciones de los lavados con solventes orgánicos, tales como la cantidad de fenol: cloroformo y las temperaturas de los reactivos adecuadas para la remoción de los residuos celulares, así como los tiempos y temperatura de las centrifugaciones involucradas en estas etapas de limpieza del ADN. El tercer paso consiste en determinar las condiciones adecuadas para la concentración del ADN, procediéndose a definir las cantidades de sal y alcohol necesarias para la precipitación del ADN liberado. Las condiciones iniciales son establecidas a partir de las propuestas por (Sambrook y Rusell, 2001) para isopropanol (1 V de buffer de extracción / 1 V de alcohol), etanol (1 V de buffer de extracción / 2.5 V de alcohol) y NaCl (1 V de buffer de extracción / 0.1 V de la sal). En la etapa final, es necesario implementar dos lavados extras con etanol absoluto y al 70% en la pastilla de ADN aislado, encaminados a la remoción de residuos de fenol y contaminantes orgánicos restantes tales como los polisacáridos, abundantes en las biopelículas marinas.

Reactivos • Solución amortiguadora de TE: Tris-HCl 10 mM, EDTA 1 mM, pH8.0. • Solución amortiguadora de TES: 10 mM Tris pH 7.5, 1 TΠMEDTA, 0.5% SDS. • Fenol pH 8. 29

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

• Fenol: cloroformo 5: 1 precalentado a 65°C. • Isopropanol. • NaC15M. El método final basado en fenol caliente para la extracción de ADN de biopelículas marinas se describe a continuación.

Metodología I) Extracción, limpieza y concentración inicial: 1. Raspar aproximadamente 0.5 gramos de biopelícula con un bisturí estéril. 2. Resuspender el material biológico en aproximadamente 1.2 mL de buffer TES (10 mMTris pH 7.5, 1 mMEDTA, 0.5% sos) en un tubo Eppendor. 3. Tomar 400 μL y pasar a un nuevo microtubo. 4. Adicionar 400 μL de fenol: cloroformo 5: 1 precalentado a 65°C, fenol pH 8. 5. Incubar a 65°C por 30 min, vortex cada 5 min. 6. Enfriar a -20°C por 5 min. 7. Centrifugar a 4°C por 15 min a 12 mil rpm. 8. Tomar la fase acuosa y transferir a un nuevo microtubo. 9. Agregar nuevamente 400 μL de fenol: cloroformo 5: 1, vortex 3 veces 30 segundos. 10. Centrifugar a 4°C por 5 min a 12 mil rpm. 11. Tomar la fase acuosa y agregar 400 μL de cloroformo frío, vortex 3 veces 30 segundos. 12. Centrifugar 5 min a 12 mil rpm. 13. Tomar la fase acuosa, pasar a un nuevo tubo, agregar 1 mil μL de isopro­ panol y 20 μL de NaCl. 14. Precipitar a - 20°C por 30 min (en esta etapa se puede almacenar el ADN). 15. Centrifugar a 12 mil rpm, 30 min a 4°C. Resuspender la Pastilla en 50 μL de buffer TE. II) Primer Lavado Extra: 1. 2. 3. 4.

Aforar a 100 μL la preparación de adn con buffer te. Agregar 2.5 volúmenes de etanol y 0.5 volúmenes de NaCl. Precipitar a -20°C durante 30 min. Centrifugar a 12 mil rpm, 30 min a 4°C. 30

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

III) Segundo Lavado Extra: 1. Decantar sobrenadante, agregar a la pastilla de ADN 2.5 volúmenes de etanol y 0.5 volúmenes de NaCl. 2. Precipitar a -20°C durante 30 min. 3. Centrifugar a 12 mil rpm, 30 min a 4°C. 4. Resuspender la pastilla en 50 μL de agua estéril.

Extracción de ADN metagenómico por el método de sílice (Roj as-Herrera y otros, 2008) Uno de los principales retos de la biotecnología vigente es conocer los cambios que actualmente sufre la microdiversidad del planeta en función de la gran variedad de hábitats naturales y de los cambios que ocurren en el mundo, producto de eventos naturales y de la intervención humana. Hasta la fecha, se desconoce una parte muy grande de esta microdiversidad debido principalmente a que las técnicas que se implementaban consideraban únicamente a los microorganismos que podían ser cultivados bajo condiciones específicas de nutrimentos, temperatura y osmolaridad. Esto sin considerar el amplio rango de microambientes donde éstos se desarrollan y las relaciones biológicas que imperan entre ellos. Lo anterior provocó que se conociera muy poco de aquellos microorganismos que viven en ambientes extremos y/o de aquellos que viven en relaciones simbióticas muy particulares con otros seres vivos. Todos estos microorganismos fueron clasificados como no cultivables y continúan siendo un reto para la microbiología moderna. Todos los microorganismos comparten secuencias de ADN que han coevolucionado con ellos mismos y que pueden ser usadas para su clasificación e identificación. Entre éstas, destaca la secuencia del ADN ribosomal que ha sido empleada recientemente en el análisis de muestras ambientales ya sea en ambientes extremos o en microorganismos que viven en relaciones simbióticas. Está aplicación es comúnmente llamada como "no cultivable" y el ADN resultante es frecuentemente llamado ADN metagenómico. El método de extracción que se aplica en este tipo de muestras no emplea lavados orgánicos ni precipitaciones con alcohol para purificar el ADN. El método fue inicialmente desarrollado a partir de polvo de diatomeas, el cual contiene elevadas cantidades de dióxido de silicio y se basa en que el ADN pueden unirse a este compuesto en presencia de altas concentraciones de sales caotrópicas como el ioduro de sodio (Koo y otros, 1998). Dichas sales tienen la capacidad de desnaturalizar proteínas interfiriendo con su estructura terciaria (Ausubel y otros, 2002). 31

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Reactivos • • • • • •

Solución amortiguadora de (pH8.0), 500mMNaCl Lisozima (10 mg/mL). SDS 20%. Acetato de potasio 5 M. Suspensión de silica. Alcohol al 70%.

TEN:

100 mM Tris-HCI (pH 8.0), 50 mM EDTA

Metodología Centrifuga y trabaja con el pellet 1. Pulverizar 0.5 g de muestra en 1 mL de amortiguador TEN (100 mM Tris-HCI pH 8.0, 50 mM EDTA pH 8.0, 500 mM NaCl) utilizando un homogenizador ó macerar con nitrógeno líquido, colocándolo en un microtubo. 2. Vortex 1 min hasta la completa resuspensión y adicionar 20 μL de lisozyma (10 mg mi/ 1 ) (PVPP, en caso de muestras con elevados niveles de fenolización). 3. Incubar 1 h con agitación leve a 37°C, posteriormente enfriar en hielo 10 min y calentar a 65°C por 5 min, repetir dos veces más el choque térmico. 4. Adicionar 100 μL de SDS 20%, vortex 1 min e incubar 30 min a temperatura ambiente (vortex cada 5 min). 5. Centrifugar a 10 mil g por 10 min, transferir el sobrenadante a un nuevo tubo y agregar 500 μL de acetato de potasio 5 M, incubar a 65°C por 5 min y luego colocar en hielo por 20 min. 6. Centrifugar a 20 mil xg por 30 min a 4°C, transferir el sobrenadante a un nuevo tubo y agregar 200 μL de la suspensión de sílice (2 g of SiO2 en 50 mL de agua), mezclar suavemente por 3 min. 7. Centrifugar a 16 mil xg por 2 min y descartar el sobrenadante. 8. Lavar la pastilla de ADN con alcohol al 70%, resuspender el ADN en 30 μL de agua, incubar a 55°C por 5 min. 9. Centrifugar a 16 mil g por 2 min y transferir el sobrenadante con el ADN resuspendido a un nuevo tubo.

32

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

Extracción de ARN El aislar y purificar ARN es un proceso que requiere de un alto grado de control en equipo y procedimientos a utilizar, y se debe evitar a toda costa la presencia de ARNasas, por lo que, antes de describir un protocolo de extracción típico, a continuación se dan una serie de indicaciones que aumentarán la posibilidad de éxito al trabajar con éste tipo de ácidos nucleicos.

Manipulación efectiva del ARN 1. Es recomendable separar material para su uso exclusivo con ARN, y usar siempre guantes, que deberán cambiarse frecuentemente, así como cubreboca y cofia. 2. El material plástico deberá ser nuevo, estéril y libre de ARNasas. 3. Para la vidriería, deberá ser lavado y horneado a 180°C durante al menos 8 h. El material plástico (polipropileno) deberá ser enjuagado con cloroformo. 4. La cámara de electroforesis deberá ser lavada con una solución de detergente, enjuagada con agua destilada, después enjuagada con etanol, y se deberá llenar con una solución de H 2 0 2 3%, dejar reposar 10 min a temperatura ambiente, y ser finalmente enjuagada con agua tratada con DEPC (dietilpirocarbonato) al 0.1%. 5. Los reactivos deberán manipularse con espátulas horneadas, y el agua a utilizar deberá ser esterilizada. 6. Siemp're y cuando los reactivos lo permitan, las soluciones deberán tratarse con DEPC al 0.1% por al menos 12 h a 37°C, y luego calentarse a 100°C por 15 min, o autoclavearse 15 min a 15 Ib pulg^2 en ciclo húmedo. {NOTA: no aplicar este tratamiento a soluciones de Tris o cualquier otro compuesto aminado). 7. Usar un inhibidor de ARNasas proteico (hay varios nombres comerciales de esa proteína, y que son similares al inhibidor de la angiogenina), o se puede usar la arcilla denominada Macaloid. 8. Para romper las células e inactivar las ARNasas al mismo tiempo, se puede utilizar una solución de hidrocloruro de guanidina y tiocianato de guanidina, y luego agregar un agente reductor, por ejemplo el β-mercaptoetanol.

33

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Protocolo de extracción de ARN (Cold Spring Harbor Protocol, 2006) Este protocolo está optimizado para hongos y levaduras. Se basa en una precipitación selectiva del ARN por la sal LiCl, la cual tiene más afinidad por el ARN que por el ADN.

Reactivos •

Solución LETS. LiCl 0.1 M. EDTA 10 m M . SDS 0.2%.

Tris-HCl 10 mM, pH 7.

Metodología 1. Inocular precultivos de las cepas toda la noche. 2. Inocular 100 mL de medio fresco con estos precultivos ajustando a uno D.O.600 = 0.1 y recuperar hasta D.O.600 0.6 a 1.0. 3. Centrifugar los 100 mL del cultivo por 5 min a 3 mil 500 rpm y 4°C. 4. Lavar con H20 libre de ARNasas (unos 10 mL), volver a centrifugar. 5. Congelar la pastilla a -80°C toda la noche (opcional). 6. Mantener las muestras en hielo. 7. Preparar microtubos de 2 mL con perlas de vidrio. 8. Poner las células y añadir 500 μL de LETS y 500 μL de fenol. 9. Romper las células con seis agitaciones de 30 s con periodos de 30 s en hielo entre los distintos pases. 10. Centrifugar a 4°C durante 5 min a 13 mil rpm. 11. Recoger el sobrenadante en microtubos y extraer con fenol-cloroformo 25: 25 frío. Agitar en el vértex. 12.Centrifugar a 4°C durante 5 min a 13 mil rpm. 13. Recuperar el sobrenadante y extraer con cloroformo frío. Agitar en el vórtex. 14. Centrifugar a 4°C durante 5 min a 13 mil rpm. 15. Recuperar el sobrenadante y precipitar con 1 vol de LiCl 5 M. 16. Guardar a -20°C durante 3 h (preferentemente toda la noche). 17. Centrifugar a 4°C durante 15 min a 13 mil rpm. 18. Lavar con EtOH 70% (unos 500 μL). 34

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

19. Dejar secar la pastilla. 20.Resuspender en 500 μL de H 2 0. 21. Precipitar con 1/10 del vol de AcNa 3 M y 2 vol de EtOH absoluto. 22.Guardar a -20°C por 2 h. 23. Centrifugar a 4°C durante 15 min a 13 mil rpm. 24.Lavar con EtOH 70%. 25. Secar 1-2 min al vacío. 26.Resuspender en un volumen apropiado (30-50 μL) y cuantificar una dilución 1/50 en el espectrofotómetro a 260 y 280 nm para determinar la calidad y cantidad del ARN obtenido.

Protocolo de extracción de ARN de plantas (Narváez-Zapata y otros, 2002) El método desarrollado emplea fenol caliente en el buffer de extracción y una precipitación selectiva con urea y LiCl (De Vries y otros, 1988; Schuler y Zielinski, 1989). El método se describe a continuación:

Reactivos • • • • • • • •

Amortiguador de lisis: 50 mM Tris-HClpH 8.5, 10 mM EDTA, 200 mMNaCl. Fenol: cloroformo: alcohol isoamílico (50: 49: 1). Ethanol absoluto. NaC15M. Urea 8 M. LiCl 10 M. Acetato de Potasio 3 M. Solución amortiguadora de TE: Tris-HCl 10 mM, EDTA 1 mMpH8.0.

Metodología 1. Un gramo de tejido es macerado con nitrógeno líquido, posteriormente es resuspendido en 20 mL de amortiguador con 50 mMTris-HClpH8.5,10 IΠMEDTA, 200 mMNaCl y 20 mL de solución fenol: cloroformo: alcohol isoamílico (50: 49:1). 2. La suspensión se incuba 10 min a 80°C en agitación constante e inmediatamente se enfria en hielo. 35

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

3. Posteriormente se centrifuga a 8 mil xg durante 5 min en una centrífuga Beckman J2-21. El sobrenadante se transfiere a un nuevo tubo y se centrifuga una vez más con un volumen de fenol: cloroformo: alcohol isoamílico (50: 49: 1). 4. Recuperar el sobrenadante y precipitar con un volumen de isopropanol a -20°C durante 30 min y se centrifugó a 8 mil xg por 30 min. 5. Posteriormente la pastilla obtenida es resuspendida en 5 mL de amortiguador TE y se realiza una segunda precipitación con dos volúmenes de etanol absoluto frío y 0.1 vol de NaCl 5 M, durante 30 min a -20°C, para limpiar del exceso de fenol. 6. Posteriormente se centrifugar a 7 mil xg por 20 min y se resuspender en 0.5 mL de buffer TE. 7. En este punto el ARN se encuentra contaminado con ADN y polisacáridos por lo que se realiza una precipitación selectiva con 0.25 vol de urea 8 M y 0.25 vol de LiCl 10 M durante 12 horas a -20°C. 8. El ARN se recupera al centrifugar a 15 mil xg durante 30 min a 4°C, la pastilla obtenida se resuspende en 0.5 μL de buffer TE y se vuelve a precipitar con dos volúmenes de etanol absoluto frío y 0.1 vol de AcK 3 M durante 20 min a 20°C. 9. La pastilla se recupera centrifugando a 15 mil xg con 4°C durante 20 min. El ARN obtenido se resuspende en 0.5 mL de agua y se le agrega un volumen de etanol al 20%, posteriormente a la resuspensión se le agrega un volumen de cloroformo, se agita brevemente, y se centrifuga a 3 mil xg para obtener un sobrenadante, el cual se transfire a un nuevo tubo donde se precipita el ARN nuevamente con 2.5 volúmenes de etanol absoluto y 0.1 vol de NaCl, se almacena a -80°C para su uso posterior. 10. La cantidad de ARN aislado se cuantifica por espectofotometría a 260 nm y su integridad se verifica en un gel de agarosa al 1% no desnaturalizante corrido a 60 volts durante 1 hora.

Optimización de la fracción de ARNΠI (Rodríguez-Ávila y otros, 2008) En algunas ocasiones los rendimientos del ARN total no son suficientes o no son viables para la manipulación posterior del mismo, sobre todo, cuando se usan fracciones de ARN mensajero a partir de muestras con potenciales sustancias contaminantes. Por lo anterior se presenta un protocolo para optimizar muestras de ARN total para la obtención de fracciones enriquecidas de ARN mensajero de alto peso molecular. 36

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

Reactivos • • • • •

Cloroformo: alcohol isoamílico (24: 1). β-mercaptoetanol. DNasa I 10X. rDNasa I. Reactivo de Inactivación de la DNasa I.

Metodología 1. Las muestras de ARN total deben ser purificadas utilizando una partición orgánica inicial del lisado celular con 0.5V de una solución de cloroformo: alcohol isoamílico (24: 1) y 0.1V de β-mercaptoetanol. 2. Posteriormente, debe aplicarse algún sistema comercial de extracción o bien alguno de los protocolos ya descritos anteriormente. 3. La muestra de ARN total y final debe ser purificada del ADN contaminante que con frecuencia suele aislarse en los procesos de purificación del mismo. Se procede a la eliminación del ADN contaminante presente con 0.1V de buffer 10X DNasa I y 1 μL de rDNasa I (2 U/μL). Dicha mezcla de reac­ ción se dejó incubando a 37°C por 30 min, para posteriormente proceder a adicionar 0.1V de reactivo de inactivación de la DNasa I; dejar incubando nuevamente las muestras, pero en esta ocasión a temperatura ambiente y durante 2 min. Finalmente, se procede a centrifugar por 1.5 min a 10 mil xg y 4°C, transfiriendo el sobrenadante conteniendo al ARN libre de ADN a un nuevo tubo. 4. El ARN mensajero resultante puede ser guardado para aplicaciones posteriores a -80°C.

Protocolos de cuantificación de ácidos nucleicos: espectrofotometría y electroforesis Cuantificación de los ácidos nucleicos Actualmente, se emplean dos tipos de métodos para medir la cantidad de ácidos nucleicos en las preparaciones obtenidas a través de los diversos protocolos de extracción. Si la muestra es pura, es decir, sin cantidades significativas de 37

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

contaminantes como pueden ser proteínas, fenol, agarosa u otros ácidos nucleicos, la medición espectrofotométrica resulta ser el método de elección por ser simple y preciso. El método consiste en términos generales en cuantificar la cantidad de rayos uv absorbidos por las bases nitrogenadas. Por otro lado, si la cantidad de ADN obtenida es muy pequeña o bien, si la muestra contiene cantidades significativas de impurezas, la cantidad de ácidos nucleicos puede ser estimada a través de la intensidad de fluorescencia. Lo anterior se logra por intercalar en el ADN agentes fluorogénicos tales como el bromuro de etidio o el Hoechst 33258 los cuales fluorescen cuando el ADN es expuesto a radiación uv (Sambrook y Rusell, 2001).

Espectrofotometría Se emplea principalmente para preparaciones de ácidos nucleicos libres de impurezas. El ADN se cuantifica a 260 nm. El rango de absorbancia entre 260 y 280 nm se emplea comúnmente para comprobar la contaminación de preparaciones de ADN y ARN con proteínas. Sin embargo, al realizar cuantificaciones de ácidos nucleicos se puede incurrir fácilmente en errores, ya que los ácidos nucleicos presentan absorbancias elevadas a 260 nm y, sólo niveles significativos de contaminación por proteínas podrían causar un cambio en el rango de absorbancia de 260-280 nm (Sambrook y Rusell, 2001). Los coeficientes específicos de absorción del ADN y del ARN pueden ser afectados por la fuerza iónica y el pH de la solución. Por tanto, la cuantificación de los ácidos nucleicos solamente se podrá efectuar cuando la fuerza iónica de la solución es baja y el pH está rigurosamente controlado (Sambrook y Rusell, 2001). Por otro lado, este método de cuantificación solo permite emplear volúmenes de solución con concentraciones de ácidos nucleicos de 5 ug mL~' hasta 90 ug mL~' (Sambrook y Rusell, 2001).

Cuantificación de ácidos nucleicos y oligonucleótidos por espectrofotometría Los ácidos nucleicos absorben eficientemente luz ultravioleta debido a la presencia de bases aromáticas nitrogenadas a lo largo de las cadenas de ADN. La absorción de luz ultravioleta (uv) por el ADN es una característica de la molécula, que es usada eficientemente para determinar su concentración. Cada una de las bases tiene su propio y único espectro de absorción y por lo tanto contribuye de manera diferente a la propiedad total de absorción de uv de una 38

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

molécula de ADN. Para muchas aplicaciones, el porcentaje de contribución de cada una de las bases al espectro de absorción de uv de una molécula de ADN de doble cadena de alto peso molecular (dsADN) puede ignorarse. Sin embargo, esas contribuciones son más significativas cuando se trata de oligonucleótidos y deben ser consideradas si se requiere determinar correctamente la concentración. Los ácidos nucleicos tienen un máximo de absorción a una longitud de onda de 260 nm. A esta longitud por lo tanto, la absorción es proporcional a la concentración molar. C (pmol/μL) = (A260 * 100 * Factor de dilución) / (1.54 *nA + 0.75*nC + 1.17 *nG + 0.92 * nT) En la fórmula: C, es la concentración calculada en picomoles por microlitro (pmol μL^')• A260, es la absorbancia a 260 nm. El denominador consiste de la suma de los coeficientes de cada base multiplica­ dos por el número de veces que aparece en el oligonucleótido. El factor de dilución es igual a el volumen final de la dilución dividido entre la cantidad de alícuota para la dilución. Para ADN de doble cadena:

Protocolo para medir la absorbancia de un oligonucleótido 1. Encender y dejar estabilizar la lámpara de uv (se recomiendan alrededor de 20 min) del espectrofotómetro para su calentamiento y seleccionar la longitud de onda a 230 y 260 nm. 2. Usar agua bidestilada en una celda de cuarzo y utilizarla como blanco de referencia (una celda de plástico no trasmite eficientemente la luz ultraviloleta y por lo tanto NO debe utilizarse para este procedimiento). 3. A 990 μL de agua bidestilada en un tubo de 1.5 mL, agregar 10 μL de solución de oligonucleótido, mezclar bien y transferir a la celda de cuarzo que se utilizó para el blanco. 4. Leer la absorbancia a 230 y 260 nm de la muestra. 39

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Notas: 1. A 260 nm, el ADN debe mostrar una absorbancia máxima. 2. El valor de la lectura a 230 nm (longitud de onda mínima) está influenciado por la cantidad de sales presentes en la muestra. La cantidad de oligonucleótido también se expresa como Unidades de Densidad Óptica (D.O.); esto es, la cantidad de oligonucleótido disuelto en 1 mL de agua con un valor de A260 igual a 1.0 en una celda de 1 cm de longitud, y se calcula por la ecuación: Unidades D.O. = A,,„ * volumen del stock * factor de dilución El valor de A260 se convierte a μg mL'1 usando el coeficiente de extinción para SSADN la cual es 1 mL por cada 33 μg para una celda de 1 cm de longitud. Por lo tanto, para un valor de D.O. de 1.0, en principio la muestra contiene 33 μg de SSADN por mililitro o en la ecuación: 1 unidad de D.O. de SSADN = 33 μg La concentración de ARN se determina por el mismo protocolo que el utilizado para la medición de ADN. Sin embargo, se aplica la siguiente relación: 1 unidad A260 de ARN = 40 μg mL"1 Las preparaciones puras de ARN tienen una relación A260 / A280 de 2.0 -1

Concentración de ARN (μg μL ) = (D.o.260nm * factor de dilución * 40) /1 000

Fluorometría El Hoechst 33258 es un marcador fluorescente de la clase de los bis-benzimidazole y tiene una alta especificidad por el ADN de doble hebra. La concentración de ADN es estimada mediante la construcción de una curva estándar tomando como referencia una concentración conocida de ADN (10-250 ng/mL). La intensidad de la emisión es aproximadamente 1 mil veces mayor que la concentración de ADN contenida en la muestra. Este tipo de análisis no se puede efectuar en condiciones extremas de pH y concentraciones elevadas de sales y detergentes, ya que estos factores afectan los 40

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

resultados obtenidos por este método; las preparaciones del ADN a analizar deben estar libres de bromuro de etidio. Este método es eficiente para preparaciones que contienen bajas concentraciones de ADN y ARN (Sambrook y Rusell, 2001).

Transiluminador

uv

Es un método rápido y sensible que utiliza la fluorescencia producida por los rayos uv como resultado de la intercalación de moléculas de bromuro de etidio en el ADN. Para ello, es necesario realizar una electroforesis horizontal en gel de agarosa adicionado con 0.5 μg mL^1 de bromuro de etidio. El gel de agarosa separa frag­ mentos de ADN de acuerdo a su peso molecular, mientras que el bromuro de etidio intercalado en los ácidos nucleicos emite fluorescencia al suministrar radiación ultravioleta, permitiendo su visualización y documentación fotográfica. Adicionalmente, es necesario cuantificar la fluorescencia de un ADN de concentración conocida (estándar) para estimar la concentración de la muestra problema (Sambrook y Rusell, 2001).

Principios básicos de la electroforesis Las mezclas complejas de moléculas tales como proteínas, ADN O ARN se separan en un campo eléctrico de acuerdo al tamaño y a su carga eléctrica. La electricidad empuja las moléculas a través de los poros del gel, que es una sustancia firme como la gelatina. El gel puede hacerse de manera que sus poros tengan distintas dimensiones para separar las moléculas según el rango específico de tamaños y formas. Las moléculas más pequeñas migran más rápido que las más grandes. Las moléculas ARN y ADN pequeñas, de unos pocos cientos de pares de nucleótidos o menos, por lo general se separan mediante electroforesis en gel de poliacrilamida. Las moléculas de mayor tamaño tienen problemas para desplazarse a través de la cerrada trama de la poliacrilamida y en general se fraccionan en el gel de agarosa, que tiene mayor porosidad. La agarosa es un polisacárido extraído de algas marinas; se disuelve en solución amortiguadora caliente, se vierte en un molde y luego se forma el gel descendiendo simplemente la temperatura. El gel con agarosa en baja concentración (0.8%) se emplea para separar fragmentos de ADN de mayor tamaño. La separación de ácidos nucleicos mediante electroforesis en gel se basa en principios similares a los que operan durante el fraccionamiento de proteínas mediante electroforesis en gel de poliacrilamida con dodecilsulfato de sodio. 41

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

A diferencia de las proteínas, todas las moléculas de ácidos nucleicos, cualquiera que sea su longitud, tienen una densidad de carga similar (número de cargas negativas por unidad de masa) y, por lo tanto, todas tienen potencial equivalente para desplazarse en un campo eléctrico. El gel de poliacrilamida o agarosa suministra la resistencia necesaria para el desplazamiento, de modo que cuanto mayor sea el peso molecular de una molécula de ARN o ADN, más lentamente se desplaza a través del gel. La sensibilidad de la electroforesis en gel es tan grande que con esta técnica se pueden separa moléculas de ADN o de ARN que solo difieren por un nucleótido, característica que le confiere un gran valor como método para secuenciar ADN. Dado que la fuerza impulsora es proporcional a la carga eléctrica, el parámetro que rige el avance (aceleración = fuerza/masa) es realmente la relación carga/masa. Sin embargo, el efecto de retardo debido al gel depende del tamaño molecular. Como resultado neto, la electroforesis separa los fragmentos de ácido nucleico según su tamaño o longitud, expresado en nucleótidos (si son de hebra sencilla) o en pares de bases (si son de doble hebra, caso común del ADN). ES por ello posible, establecer una curva de calibrado que relacione la movilidad con la longitud en pares de bases (PB). Para conseguir una recta se suele representar tamaño versus 1/movilidad o log (tamaño) versus la movilidad. Las múltiples bandas de ADN en un gel pueden ser detectadas si han de aislarse unas de otras. El ADN de doble cadena es teñido por agentes catiónicos aromáticos planares como el ion etidio, el anaranjado de acridina o la proflavina (véase Figura 6). Estos agentes se unen al ADN dúplex por intercalación, exhibiendo fluorescencia bajo una luz uv. Hasta 50 ng de ADN pueden ser detectados por la tinción con bromuro de etidio. Los ácidos nucleicos de una

Bromuro de etidio

Naranja de acridina

Figura 6. Moléculas de los agentes intercaladores. 42

JOSÉ A. NARVÁEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRÍGUEZ-LUNA

sola hebra también estimulan la fluorescencia del etidio, pero en una menor cantidad de la que ocasiona el ADN dúplex (véase Cuadro 2).

Reactivos Solución amortiguadora TBE 5X (pH final 8.3). • 54 g Tris base. • 27.5 g ácido bórico. •

20 mL de 0.5 M EDTA pH 8.

Metodología 1. Disuelva 1.5 g de agarosa en 100 mL de solución TBE 0.5 X y caliente la mezcla hasta lograr la disolución total de la agarosa. 2. Una vez disuelta la agarosa, deje enfriar hasta aproximadamente 55°C antes de vaciar en el molde. El grosor típico del gel, para este tipo de análisis, es de alrededor de 0.5 cm. Tenga en cuenta que el tamaño del orificio en donde se aplicará la muestra, esta determinado por el grosor del gel y por el grosor del peine. 3. Una vez que el gel se ha formado, retire el peine y los extremos de la cámara (si estos han sido sellados para la preparación del gel). 4. Coloque el gel con cuidado en la cámara de electroforesis y agregue suficiente solución TBE 0.5 X para cubrir el gel. Evite la presencia de burbujas de aire atrapadas entre el gel y la cámara, así como en los orificios formados por el peine.

Cuadro 2. Características de movilidad del ADN durante la electroforesis en geles de agarosa Agarosa (%) p/v

Rango de separación (PB)

Xilencianol equivale a:

Azul de bromofenol equivale a:

1.0

350-7 000

6 500 PB

1 000 PB

1.5

200-4 000

3 000 PB

450 PB

2.0

100-2 000

1 500 PB

240 PB

Fuente: elaboración propí a.

43

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

La Reacción en Cadena de la Polimerasa (PCR) como método para la verificación de la viabilidad de los ácidos nucleicos La PCR es una técnica análoga al proceso de replicación del ADN que tiene lugar en las células y hoy día es una de las técnicas moleculares que ha tenido mayor impacto en los estudios de biología molecular. Una de las razones del éxito de esta técnica se debe a que es un método simple y relativamente fácil; por tal motivo, se emplea frecuentemente en el análisis del ADN, así como en los procesos moleculares que se llevan a cabo en las células (Walker y Rapley, 2000). Por otro lado, la PCR es un método sensible y específico para la detección y monitoreo de microorganismos presentes en muestras ambientales complejas. La detección exitosa y la caracterización del ADN microbiano requieren de una eficiente extracción de ADN, además de la adecuada purificación de los contaminantes que pudieran inhibir la PCR.

44

JOSE A. NARVAEZ-ZAPATA, CLAUDIA P. LARRALDE-CORONA E ISABEL C. RODRIGUEZ-LUNA

Bibliografia Ausubel, F. M.; Brent, R.; Kingston, R. E.; Moore, D. D.; Seidman, J. G.; Smith, J. A.; Struhl, K. (2002), Short Protocols in Molecular Biology, 5th Ed., New York, Greene Publishing and Wiley-Interscience. Bailey, J. E; Ollis, D. F. (1986), Biochemical Engineering Fundamentals, 2nd Ed., Singapore, McGraw Hill. Cold Spring Harbor Protocols (2006), doi:10.1101/pdb.rec518. De Vries, S.; Hoge, H.; Biseeing, T. (1988), Isolation of total and polysomal RNA from plant tissues, Plant Mol. Biol, Manual B6, pp. 64-71. Karp, G. (1998), Biologia Celulary Molecular, Mexico, McGraw-Hill Interamericana. Koo, K.; Foegedin, P.; Swaisgood, H. (1998), Isolation of RNA and DNA fragments using diatomaceous earth, Biotechnol. Tech, 12, pp. 549-552. Lehninger, A. L.; Nelson, D. L.; Cox, M. M. (1993), Lehninger Principles of Biochemistry, 3rd Ed., New York, Worth Publ. Madigan, M. T.; Martinko, J. M.; Parker, J. (1998), Biologia de los Microorganismos de Brock, 8va Ed., Madrid, Prentice Hall Iberia. Narvaez-Zapata, J.; Rodriguez-Avila, N.; Ortega-Morales, B. O. (2005), Method for recovery of intact DNA for community analysis of marine intertidal microbial biofilms, Mol, Biotechnol, 30, pp. 51-55. Narvaez-Zapata, J. A.; Flores Perez, P.; Herrera, V.; Castillo, E; Ku Cauich, R.; Canto, B.; Santana, N.; Rivera, Madrid R. (2001), Development of molecular techniques for the study the metabolism of carotenoids in the high pigment producer plant Bixa orellana I, (annatto), HortScience, 36, pp. 982-986. Orozco, E.; Gariglio, P. (2000), Genetica y Biomedicina Molecular, Mexico, Limusa-Noriega. Prescott, L. M.; Harley, J. P.; Klein, D. A. (2002), Microbiologia, Madrid, 5a ed., McGraw-Hill. Rodriguez-Avila, N. L.; Narvaez-Zapata, J. A.; Aguilar-Espinosa, M.; RiveraMadrid, R. (2008), Full-length genes enrichment by using an optimized RNA isolation protocol in Bixa orellana recalcitrant tissues, Mol, Biotechnol, 41, pp. 1-6. Rojas-Herrera, R.; Narvaez-Zapata, J. A.; Zamudio-Maya, M.; Mena-Martinez, M. E. (2008), A simple silica-based method for metagenomic DNA extraction from soil and sediments, Mol. Biotechnol, 40, pp. 13-17. Sambrook, J.; Russell, D. W. (2001), Molecular Cloning: A Laboratory Manual, vol. 1, 3rd Ed., USA, Cold Spring Harbor Laboratory Press, Cold Spring Harbor. 45

CAPÍTULO I. Los ÁCIDOS NUCLEICOS Y SU CUANTIFICACIÓN

Schuler, M.; Zielinski, R. (1989), "RNA isolation from light-and dark-grown seedlings", in Methods in Plant Molecular Biology, New York, Academic Press, pp. 89-96. Singer, M.; Berg, P. (1993), Genes y Genomas, Barcelona, Omega. Walker, J. M.; Rapley, R. (2000), Molecular Biology and Biotechnology, 4th Ed., London, Royal Society of Chemistry. Weising, K.; Nybom, H.; Wolff, K.; Meyer, W. (1995), DNA Fingerprinting in Plañís and Fungi, USA, CRC Press, Boca Ratón.

46

Capítulo II Enzimas de restricción Ana M. Sifuentes-Rincón Xochitl F. De la Rosa-Reyna

Introducción

L

as enzimas de restricción se producen en las bacterias como un mecanismo de defensa en contra de la infección por fagos. Estas proteínas fueron descubiertas hace más de 30 años por Werner Arber, Hamilton Smith y Daniel Nathans, y su uso entre los biólogos moleculares se hizo común desde final de los 70's. Aunque el descubrimiento y caracterización de las enzimas de restricción permitió en gran medida el desarrollo de lo que hoy se conoce como "tecnología del ADN recombinante", actualmente el principal uso de las enzimas de restricción se ha acoplado a nuevas tecnologías principalmente la Reacción en Cadena de la Polimerasa. Este capítulo contiene información general de las enzimas de restricción y específica sobre la aplicación de las endonucleasas de restricción tipo II en la búsqueda y caracterización polimorfismos en regiones específicas del genoma.

Historia y orígenes Uno de los principales resultados de los estudios en genética bacteriana fue el descubrimiento de las endonucleasas de restricción. Éstas, se definen como enzimas que reconocen específicamente secuencias de ADN y cortan sus cadenas ya sea en el sitio de reconocimiento o a cierta distancia de éste. La descripción de los sistemas de restricción fue el resultado del establecimiento de los mecanismos 47

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

de infección de los bacteriófagos, en donde se observó que un fago podía crecer adecuadamente en una cepa A de bacterias, sin embargo cuando éste infectaba una cepa B (de la misma especie que la A) su crecimiento se disminuía considerablemente. Adicio-nalmente se observó, que las pocas partículas fágicas recuperadas de la infección de la cepa B, adquirían la capacidad de infectar eficientemente a ésta cepa pero disminuían su capacidad de infectar la cepa A. Este fenómeno fue denominado variación controlada por el hospedero, ya que el fenotipo (infectividad) del fago claramente se correlacionaba con el hospedero. Con estos resultados se sugirió que algún componente específico para la replicación del fago estaba siendo modificado de manera específica por la cepa hospedera, este componente resultó ser el ADN. Estudios posteriores demostraron que la disminución del crecimiento de fagos en cepas no específicas era causada por la degradación de su ADN, la cual se inicia con el corte específico seguida por el corte total y al azar de esta molécula. El genoma de la bacteria y el del fago de infección específica se protege de la degradación mediante un mecanismo de modificación específico de la molécula de ADN, basado en la metilación del ADN en secuencias cortas que son específicamente reconocidas y digeridas por las endonucleasas cuando no hay metilación, por lo tanto existe invariablemente un sistema de modificación (SM) por cada sistema de restricción (SR), el cual es además específico de cada cepa bacteriana. En algunos SM/SR tanto la enzima de restricción como la de modificación son proteínas separadas que actúan independientemente; sin embargo, en otros las dos actividades se presentan en subunidades o dominios de una sola proteína.

Clasificación de las endonucleasas de restricción Existen cuatro tipos de enzimas de restricción. Esta clasificación está basada en su composición de subunidades, posición de corte, especificidad de secuencias y requerimiento de co-factores.

Endonucleasas de restricción del tipo I (ER I), tipo III (ER III) y tipo IV (ER IV) Las enzimas de restricción clasificadas como tipo I, III y IV se consideran de importancia bioquímica y son consideradas como modelos de estudio para ciencia básica, pero tienen poco valor práctico y su uso en la construcción de recombinantes es prácticamente nulo. Ambos tipos de enzimas son proteínas complejas que presentan 48

ANA M. SIFUENTES-RINCÓN Y XÓCHITL F. DE LA ROSA-REYNA

actividad de endonucleasa y metilasa. Las ER I son el sistema de restricción más complejo, las enzimas que pertenecen a este tipo se caracterizan por tener tres diferentes subunidades. Para cortar, requieren la presencia de Mg+2, ATP y S-adenosilmetionina. Sus sitios de reconocimiento no están bien definidos y el corte del ADN se puede presentar a distancias de 400 a 7 mil pb del sitio que reconocen. Las ER III hacen cortes en el ADN de doble cadena a aproximadamente 25 pares de bases del sitio de reconocimiento. En presencia de ATP y S-adenosilmetionina la misma enzima cataliza la metilación del ADN. Las ER III son proteínas heterodiméricas que tienen dos subunidades. En algunas cepas de E. coli, las subunidades son codificadas por dos genes extra-cromosómicos ubicados en los genomas de un plásmido y un fago. Las ER IV son enzimas que únicamente cortan sustratos de ADN cuyas bases han sido modificadas y se encuentran metiladas, hidroximetiladas o bien glucosil 1-hidroximetiladas. Este grupo contiene al menos 227 enzimas y la mejor caracterizada es la enzima McrBC de E. coli K12. Esta enzima requiere Mg+2 para su actividad y es la única nucleasa conocida que requiere GTP para el corte y translocación del ADN. La enzima reconoce bases modificadas que pueden estar separadas entre 40 y 3 mil nucleotidos y el corte lo realiza aproximadamente 30 bases después de cualquiera de estos sitios.

Endonucleasas de restricción del tipo II (ER II) Las ER II son herramientas indispensables para la construcción de moléculas recombinantes, así como también para analizar la estructura primaria de la molécula de ADN. Estas enzimas reconocen y se unen de manera específica a secuencias nucleotídicas cortas del ADN, y a diferencia de las ER I y III, las del upo II catalizan el rompimiento de los enlaces fosfodiéster dentro del sitió dé reconocimiento. La longitud de los sitios de reconocimiento de las ER II va de 4 hasta 8 pb (véase Figura 1). Sin importar la longitud de la molécula dé ADN las ER II la reconocen y cortan de tal manera que se obtienen patrones de bandas de forma reproducible y su longitud depende de la distancia en la que se ubique un sitio de corte y reconocimiento igual al primero. Estas enzimas Júdrolizan los enlaces fosfodiéster entre el grupo 3'-OH y el grupo 5'-fosfató, prödütierído un grupo 5'-fosfomonoéster en un extremo y 3'-hidroxilo en el otro (fig. 2.2). Esta reacción requiere la presencia de un catión divalente el cual generalmente es Mg+2. Una característica propia de los cortes con las ER II es que los sitios de corte poseen simetría rotacional de segundo orden, es decir la secuencia de reconocimiento es un palíndrome, una secuencia que se lee igual en cualquier dirección. El corte de las ER II en la secuencia de reconocimiento puede dejar 49

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

extremos "romos" por el corte en la mitad de la secuencia de reconocimiento o bien generar extremos cohesivos o "pegajosos", por el corte escalonado de la secuencia de reconocimiento, en este último caso, los extremos pueden re-asociarse espontáneamente mediante puentes de hidrógeno entre las bases complementarias (véase Figura 2); además de la especificidad y precisión en el reconocimiento de las secuencias, la generación de este tipo de extremos es lo que determina su uso en los diferentes procedimientos de construcción de moléculas recombinantes. Entre las enzimas de restricción tipo II aisladas de diferentes cepas de bacterias, se puede compartir la especificidad del sitio de corte. A las ER II que reconocen secuencias idénticas se les ha llamado isoesquizómeros. Aunque la secuencia de reconocimiento es la misma en los isoesquizómeros, el tipo de corte, sensibilidad a metilación y velocidad de corte pueden ser diferentes (véase Figura 3). Lejos de formar una familia de proteínas relacionadas, las ER II difieren completamente una de otra en su secuencia aminoacídica, lo que hace pensar que más que ser el resultado de la divergencia a partir de un ancestro común, estas se formaron de manera independiente en el curso de la evolución. Cada una de las enzimas de restricción conocidas a la fecha se deriva de un organismo procariótico en particular y el nombre que se le da generalmente refleja su origen. Por ejemplo, la enzima EcoRl se obtuvo de E. coli cepa RY13; Haell y Haelll, de H. aegyptus; BamHl de Bacillus amyloliquefaciens cepa H, etcétera.

Figura 1. Secuencias de reconocimiento y corte de diferentes endonucleasas de restricción. Se muestran tres ejemplos de ER II que reconocen secuencias de 4 a 8 nucleótidos. Las flechas indican la posición del corte. 50

ANA M. SIFUENTES-RINCÓN Y XÓCHITL F. DI; LA ROSA-REYNA

Figura 2. Sitios de reconocimiento y digestión de las ER II. Se ilustra el sitio de reconocimiento y corte de la enzima de restricción EcoRI, la reacción se lleva a cabo en dos pasos; primeramente se hidroliza una cadena y después la siguiente. Bajo las condiciones de reacción adecuadas se generan dos cadenas de ADN dúplex con extremos compatibles de cadena sencilla. Cuando se alteran las condiciones de reacción los fragmentos pueden re-asociarse.

Fundamentos para el uso de endonucleasas del tipo II El primer requisito para el uso de una endonucleasa de restricción es que ADN a ser digerido contenga el sitio de reconocimiento. Las enzimas de restricción que reconocen secuencias cortas de nucleótidos (Ejemplo 4 pb) cortan el ADN con mayor frecuencia que aquellas que reconocen un número mayor de nucleótidos. Asumiendo que el contenido de G-C en el ADN sustrato es 50%, una enzima de restricción que reconoce secuencias de 4 pb podría cortar en promedio cada 256 pb (44), en el caso de 6 nucleótidos cada 4 096 bases (64). Dependiendo del uso que se le dará al ADN sustrato que se digiere, la enzima seleccionada podrá generar extremos cohesivos o romos, los cuales en el caso de construcción de recombinantes pueden ser 51

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

Figura 3. Isoesquizómeros. Se muestran un ejemplo de ER II que reconocen la misma secuencia de ADN, el tipo de corte que se genera es diferente mientras que Xma I genera extremos cohesivos, Sma I genera extremos romos.

ligados únicamente con extremos compatibles. El uso de las enzimas de restricción involucra una serie de pasos básicos en los cuales dependiendo del objetivo del experimento se deben considerar las concentraciones de ADN, las unidades de enzima de restricción necesarias para lograr la digestión total, el tiempo y temperatura de incubación, sin olvidar los amortiguadores necesarios para la obtención de un resultado óptimo. Una reacción típica además del ADN y la endonucleasa purificada, debe llevar amortiguador-Tris, Mg+2, NaCl, 2-mercaptoetanol, y Albúmina Sérica Bovina. Todas las enzimas requieren Mg+2 como cofactor, y la mayoría son activas en un rango de pH de 7.2 a 7.6. La principal diferencia entre las enzimas es su dependencia a la fuerza iónica. La mayoría de las casas comerciales que actualmente se encargan de purificar y comercializar estas enzimas, incluyen en sus catálogos las actividades de las endonucleasas en amortiguadores estandarizados que varían principalmente en la fuerza iónica. La disponibilidad de las ER II de forma comercial hace posible que se cuente con una gran cantidad de información y dependiendo del procedimiento se puede realizar el corte enzimático de un ADN sustrato utilizando simultáneamente más de una enzima. La actividad de las ER II se puede ver afectada por diferentes factores entre ellos la distancia que existe entre el sitio de reconocimiento y los extremos del ADN sustrato. Esto es de importancia sobre todo en los casos en los cuales se desea realizar cortes en sitios adyacentes; por ejemplo, en un vector de clonación. Cuando alguno de los parámetros específicos para lograr la actividad adecuada de una ER II se varía (por ejemplo, fuerza iónica, pH, presencia de altas concentraciones de glicerol, etc.) se presenta un fenómeno importante denominado 52

ANA M. SIFUENTES-RINCÓN Y XÓCHITL F. DE LA ROSA-REYNA

"actividad estrella", en el cual la enzima pierde la especificidad por el sitio de reconocimiento y corta en sitios diferentes. Actualmente, existen una gran cantidad de compañías dedicadas al aislamiento, purificación y comercialización de las ER II, de tal forma que se cuenta con una gran cantidad de opciones para su uso en la manipulación del ADN de cualquier especie. Se ha creado una plataforma virtual denominada Rebase (The Restriction Enzyme Datábase), en la cual se resume información concerniente a todas las enzimas de restricción y proteínas asociadas. En esta base de datos, se puede acceder a información sobre el origen, disponibilidad comercial, datos de secuencias de genes que las codifican, información sobre la estructura tridimensional y cristalográfica, sitios de reconocimiento, iso-esquisómeros y sensibilidad a la metilación de las enzimas de restricción. Disponible en http://rebase.neb.com/rebase/rebase. html. Esta base de datos está en continua actualización e incluye la información sobre posibles sistemas de restricción derivados del análisis de los genomas de microorganismos que continuamente se están reportando en el GenBank, de tal forma que constituye una herramienta muy valiosa para detectar todas las posibilidades de uso de las enzimas de restricción. Adicionalmente, esta base de datos está asociada a otras herramientas de análisis como es el NEBcutter, el cual es un programa computacional de acceso libre que permite identificar la presencia de SÍT tios de restricción en secuencias de ADN lo cual facilita el análisis de estas regiones y permite definir estrategias experimentales para la su manipulación enzimática. Disponible en www.fristmarket.com/cutter/cut2.html

Aplicaciones de las enzimas de restricción Las enzimas de restricción del tipo II fueron las herramientas más valiosas para el desarrollo de la Biología Molecular. Durante los 70's éstas fueron ampliamente utilizadas para construir mapas físicos de moléculas pequeñas de ADN así como para la creación de estrategias que permitieran la fácil manipulación de fragmentos específicos de ADN y aunque en los 80 seguían siendo utilizadas para el mapeo de genomas incluso más grandes. Con el advenimiento de tecnologías como la Reacción en Cadena de la Polimerasa la cual tiene como principal ventaja la obtención de fragmentos específicos de ADN se pensó que el uso de las ER II como herramienta de biología molecular quedaría obsoleto; sin embargo, las ER II han encontrado un nuevo nicho de aplicación en la búsqueda, caracterización y diagnóstico de Polimorfismos de genes o regiones génicas, siendo la detección de Polimorfismos de un solo nucleótido (SNPS), el tipo de variación con la que con mayor frecuencia se utilizan las enzimas de restricción. 53

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

Polimorfismos en la Longitud de los Fragmentos de Restricción acoplados a la Reacción en Cadena de la Polimerasa (PCR-RFLP) Cambios en la secuencia nucleotídica de un mismo locus en diferentes individuos se conocen como polimorfismos, los que una vez que son identificados y caracterizados poblacionalmente, son comúnmente conocidos como marcadores moleculares o marcadores de ADN. Las enzimas de restricción son una herramienta muy valiosa para la identificación de polimorfismos, ya que estos se evidencian como alteraciones en los patrones de los fragmentos generados al cortar el segmento de ADN de interés con ciertas enzimas de restricción (véase Figura 4) y por ello se les refieren como polimorfismos en la longitud de fragmentos de restricción o RFLPS (del inglés Restriction Fragment Length Polymorphism). Clásicamente, los RFLPS se realizaban digiriendo el genoma completo de los individuos a comparar y la detección de los patrones polimórficos se evidenciaba mediante la técnica de Southern blot la cual hace uso de sondas marcadas radioactivamente. Las dificultades técnicas de esta

Figura 4. Análisis de los Polimorfismos en la Longitud de los Fragmentos de Restricción (RFLPS). Las variaciones observadas entre distintas muestras de adn pueden ser causadas por: mutaciones puntuales que pueden resultar en la pérdida o ganancia de sitios de corte para una enzima de restricción. 54

ANA M. SIFUENTES-RINCÓN Y XÓCHITL F. DE LA ROSA-REYNA

metodología como son el requerimiento de concentraciones relativamente grandes (50-500ng) de ADN no degradado, tiempo de detección de los patrones alélicos y el hecho de requerir sondas radiactivas o inmunológicas la hace de difícil aplicación rutinaria. Como se verá en detalle en el próximo capítulo, a partir de su descripción una de las herramientas básicas para el análisis del ADN es la Reacción en Cadena de la Polimerasa (PCR, por sus siglas en inglés). La PCR es una técnica que permite replicar in vitro segmento específicos de ADN, obteniendo millones de copias en corto tiempo. En combinación con la Reacción en Cadena de la Polimerasa, el análisis con enzimas de restricción da lugar a una técnica general para identificar en la secuencia de un segmento específico de ADN cambios o mutaciones que provoquen un cambio en los sitios de reconocimiento de una enzima de restricción. Este procedimiento denominado Polimorfismos en la Longitud de los Fragmentos de Restricción acoplados a la Reacción en cadena de la Polimerasa (PCR-RFLP, por sus siglas en inglés), consiste en la amplificación de regiones específicas del genoma y posteriormente su digestión. Una vez que se detecta un cambio en los patrones de digestión entre distintas muestras de una misma región de ADN, este se convierte en un ensayo de PCR-RFLP que puede permitir el análisis de grandes poblaciones para determinar si el cambio detectado puede considerarse un polimorfismo.

Aplicación de la PCR-RFLP para la identificación de polimorfismos Aunque actualmente existen técnicas masivas para la búsqueda de polimorfismos, la PCR-RFLP, puede considerarse una alternativa viable y menos costosa para la exploración de mutaciones causales en genes candidatos a asociarse a enfermedades o un rasgo productivo importante. Un ejemplo, es el factor de crecimiento semejante a la insulina I (IGF-I), regulador crítico en el crecimiento y desarrollo animal. Los polimorfismos en este gen, se han estudiado en humano y en distintas especies domésticas y silvestres. Aunque se han descrito diferentes metodologías para, la búsqueda de polimorfismos en este gen, a continuación se describe el procedimiento básico que permitió mediante el uso de PCR-RFLP la detección de polimorfismos en el gen IGF-I en poblaciones de bovinos del noreste de México. El gen IGF-I en bovinos, estructuralmente está organizado en 5 exones y cuatro intrones, pese a que el-gen tiene una longitud de 71 800 pb, su mensajero es de apenas 841 pb. El primer paso para analizar la presencia de polimorfismos en bovinos fue identificar virtualmente las enzimas de restricción con mayor potencial para la ubicación de cambios nucleotídicos en los primeros cuatro exones del gen (fragmentos 1 al 4). 55

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

Utilizando las secuencias nucleotídicas previamente reportadas para estas regiones, la base de datos Rebase permitió identificar cuatro enzimas de restricción de moderada y alta frecuencia de corte. En el fragmento 1, se identificó la enzima Tru9I (T|TAA), en el fragmento 2 Hinfl (GjANTC), en el fragmento 3 Hae III (GGjCC) y en el fragmento 4 las enzimas Nru\ (TCGjCGA) y Rae III (GGjCC). Una vez identificadas las enzimas, se realizó inicialmente un ensayo virtual de digestión. Este ensayo consiste en utilizar programas de computadora para reproducir in silico, el resultado de una reacción de digestión. Para este tipo de ensayos los programas de libre acceso como el NEBCutter ó RestrictionMapper son utilizados con igual eficiencia que los programas comerciales como el DNA Strider™ ó Drawmap™. El ensayo virtual completo, da como resultado una representación gráfica de los patrones de digestión esperados, este ejercicio previo a la digestión in vitro facilita la comparación de resultados esperados contra los observados, también ayuda en la identificación de posibles fuentes de error posteriores a la reacción de digestión. Para la detección de los RFLPS, se diseñaron 4 pares de iniciadores que amplifican las 4 regiones de IGFI (1 778 pb). Individualmente se amplificaron estas 4 regiones en diferentes muestras de bovinos, se realizaron las digestiones enzimáticas utilizando los fragmentos amplificados y se analizaron los patrones de digestión (véase Figura 5). Los resultados de este análisis permitieron la detección de un polimorfismo en el fragmento 4 el cual es revelado por la enzima Nrul. Como se muestra en la Figura 6 la presencia de corte enzimático fue interpretada como una secuencia de ADN normal y la ausencia de corte enzimático representado por una banda, se interpretó como un

Figura 5. Se muestra el diagrama general para la búsqueda de polimorfismos en el gen IGF-I. La figura representa el patrón de restricción esperado en el análisis virtual de digestión enzimática. 56

ANA M. SIFUENTES-RINCÓN Y XÓCHITL F. DE LA ROSA-REYNA

nuevo polimorfismo en el gen IGF-I bovino. Se sabe que IGF-1 puede presentar procesamientos alternativos justo en la región donde se ubica este nuevo polimorfismo, por lo que es importante evaluar si este polimorfismo interviene en alguno de ellos (fig. 2.6).

Aplicación de la PCR-RFLP para la detecciónde polimorfismos de un solo nucleótido (SNPS) Los polimorfismos de un solo nucleótido (SNP, por sus siglas en inglés) representan el tipo de variación más frecuente en una secuencia de ADN, y en muchos casos pueden ser utilizados para predecir el fenotipo de los individuos. Existen diferentes técnicas asociadas a la detección de SNPS una de ellas es la PCR-RFLP. Como se mencionó previamente, esta técnica se basa en el corte con endonucleasas de restricción de los productos amplificados por PCR. Si dos ampliaciones presentan una variación de la secuencia nucleotídica en los sitios de reconocimientos de las enzimas de restricción, generarán distintos patrones de fragmentos. La aplicación de esta técnica se ve en la mayoría de los casos limitada por que en las secuencias no existen sitios de reconocimiento para enzimas de restricción que permita después de la digestión detectar el SNP. En tales ejemplos, se pueden crear artificialmente sitios de restricción mutando la secuencia durante la amplificación. La creación

Figura 6. Se muestran los patrones de presencia/ausencia del cambio nucleotídico en el gen IGFI de la raza Beefmaster. M=marcador L/Pst I, SD=Producto sin digerir, carriles 1-7, individuos Beefmaster. 57

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

de sitios de restricción durante la amplificación por PCR (ACRS, por sus siglas en inglés) ha sido ampliamente aplicada en el diagnóstico molecular de enfermedades asociadas a SNPS específicos, así como también para la detección de genes asociados a características económicamente productivas en animales domésticos. El punto clave para la identificación de SNPS por medio de ACRS, es el diseño de los iniciadores para la amplificación ya que de éstos depende la creación del sitio de restricción artificial que permitirá discriminar entre el alelo normal y el mutado (véase Figura 7). Existen versiones libres de software que permiten la identificación de sitios de restricción candidatos a ser creados por per, estas herramientas facilitan el análisis de las secuencias candidatas y permiten en corto tiempo hacer el diseño de estrategias basadas en PCR-RFLP para la detección de SNPS asociados a características fenotípicas.

Futuro En las últimas tres décadas se han identificado más de 3 500 enzimas de restricción, sin embargo solo 500 se han comercializado. En algunos casos, las enzimas que se encuentran en el mercado tienen características indeseables como son: baja estabi-lidad y tendencia a dar actividad estrella. Continuamente se están aislando de bac-terias endonucleasas de restricción del tipo II y muy frecuentemente estas enzimas cortan en secuencias idénticas a otras ya conocidas; sin embargo, tienen ventajas adicionales a las ya existentes incluyendo costos y/o eficiencia para ser utilizadas en la manipulación de las moléculas de DNA.

Figura 7. Estrategia para la creación de sitios de restricción durante la amplificación por PCR. Las flechas indican los sitios en los que se modifica la secuencia del iniciador, los asteriscos indican la posición del SNP. 58

ANA M. SIFUENTES-RINCÓN Y XÓCHITL F. DE LA ROSA-REYNA

Bibliografia Avise, J. C. (1994), Molecular Markers: History and Evolution, New York, Chapman & Hall. Eiken, H. G.; Odland, E.; Boman, H.; Skjelkvwle, L.; Engebretsen, L. R; Apold, J. (1991), Application of natural and amplification created restriction sites for the diagnosis of PKUmutations, Nucl. Acids Res., 19, pp. 1427-1430. Ellrott, K. P.; Kasarjian, J. K. A.; JiangcT, Ryu J. (2002), Restriction enzyme recognition sequence search program, Biotechniques, 33, pp. 1322-1326. Griffiths, A. J. E; Miller, W. E; Jeffrey, H.; Suzuki, D. X; Lewontin, R. C; Gelbart, W. M. (1999), Introduction to Genetic Analysis, 7th Ed., New York, WH Freeman & Co. Hua, W.; Therrien, C; Blanchard, A.; Guan, X.; Zhu, Z. (2008), The Fidelity Index provides a systematic quantitation of star activity ofDNA restriction endonucleas-esM, Nucl. Acids Res., 36: e50. Disponible en http://nar.oxfordjournals.org/ cgi/content/abstract/gkn 182 Jeremy, W. D.; von Schantz, M. (2003), From Genes to Genomes. Concepts and Applications ofDNA Technology, New York, Wiley-VCH. Karp, A.; Edwards, K. J. (1997), DNA markers: a global overview. In: DNA Markers Protocols, New York, Applications and Overviews, Wiley-VCH, pp. 1-14. Kasarjian, J. K. A.; Iida, M.; Ryu, J. (2003), New restriction enzymes discovered from Escherichia coli clinical strains using a plasmid transformation method, Nucl. Acids Res., 31: e22. Disponible en http://nar.oxfordjournals.org/cgi/content/full/31/5/e22 Kruger, D. H.; Bickle, T. A. (1983), Bacteriophage survival: multiple mechanisms for avoiding the Deoxyribonucleic Acid restriction systems of their hosts, Microbiol. Rev., 47: 345-360. Loevendahl, R (2004), Polymorphism of the somatotropic axis genes in cattle- physiology and productivity, Anim. Sci. Papers Rep., 22, pp. 101-108. Martinez-Montoya, H. (2006), Deteccion de polimorfismos en los genes IGF-1 y MYF-5 en la raza bovina Beefmaster, Mexico, Morelia, Tesis de Licehciatura, Instituto Tecnologico de Morelia. Meade, K. G.; Hill, E. W.; Buckley, E; MacHugh, D. E. (2005), Convenient detection of single nucleotide polymorphism haplotypes in the bovine growth hormone gene using amplification created restriction sites, Anim., Genet., 36, pp. 160-190. Mullis, K. B.; Faloona, F.; Scharf, S.; Saiki, R.; Horn, G.; Erlich, H. (1986), Specific enzymatic amplification ofDNA in vitro: the polymerase chain reaction, Cold Spring. Harb. Symp. Quant. Biol., 51, pp. 263-273. Murray, N. E. (2000), Type I restriction systems: sophisticated molecular machines, Microbiol. Mol. Biol. Rev., 64, pp. 412-434. 59

CAPÍTULO II. ENZIMAS DE RESTRICCIÓN

Orlowskil, J.; Bujnicki, J. M. (2008), Structural and evolutionary restriction enzymes based experimental analyses, Nucl. Acids Res., 36, pp. 3552-3569. Pingoud, A.; Jeltsch, A. (2001), Structure and function of type II restriction endonucleases, Nucl. Acids Res., 29, pp. 705-3727. Pingoud, V.; Sudina, A.; Geyer, H.; Bujnicki, J. M.; Lurz, R.; Luder, G.; Morgan, R.; Kubareva, E.; Pingoud, A. (2005), Specificity Changes in the Evolution of Type II Restriction Endonucleases: a biochemical and bioinformatic analysis of restriction enzymes that recognize unrelated sequences, J. Biol. Chem., 280, pp. 4289-4298. Roberts, R. J. (2005), How restriction enzymes became the workhorses of molecular biology, USA, Proc. Natl. Acad. Sci, 102, pp. 5905-5908. Roberts, R. J.; Macelis, D. (2000), REBASER-estriction enzymes and methylases, Nucl. Acids Res., 28, pp. 306-307. Roberts, R. J.; Vincze, T.; Posfai, J.; Macelis, D. (2007), REBASE-enzymes and genes for DNA restriction and modification, Nucl. Acids Res., 35, pp. 269-270. Roberts, R. J.; Belfort, M.; Bestor, T.; Bhagwat, A. S.; Bickle, T. A.; Bitinaite, J.; Blumen-thal, R. M.; Degtyarev, S. K. H.; Dryden, D. T.; Dybvig, K.; Firman, K.; Gromova, E. S.; Gumport, R. I.; Halford, S. E.; Hattman, S.; Heitman, J.; Hornby, D. P.; Janulaitis, A.; Jeltsch, A.; Josephsen, J.; Kiss, A.; Klaenhammer, T. R.; Kobayashi, I.; Kong, H.; Kruger, D. H.; Lacks, S.; Marinus, M. G.; Miyahara, M.; Morgan, R. D.; Murray, N. E.; Nagaraja, V.; Piekarowicz, A.; Pingoud, A.; Raleigh, E.; Rao, D. N.; Reich, N.; Repin, V. E.; Selker, E. U.; Shaw, P. C; Stein, D. C; Stoddard, B. L.; Szybalski, W.; Trautner, T. A.; Van Etten, J. L.; Vitor, J. M.; Wilson, G. G.; Xu, S. (2003), A nomenclature for restriction enzymes, DNA methyltransferases, homing endonucleases and their genes, Nucl. Acids Res., 31, pp. 1805-1812. Vincze, T.; Posfai, J.; Roberts, R. J. (2003), NEBcutter: A program to cleave DNA with restriction enzymes, Nucl. Acids Res., 31, pp. 3688-3691. Williams, R. J. (2003), Restriction endonucleases: Classification, properties, and applications, Mol. Biotechnol, 23, pp. 225-243.

60

Capitulo III Aplicaciones de la tecnologia del ADN recombinante Juan M. González-Prieto Krystal Lira-Mendez Sanjuana Hernández-Delgado Netzahualcoyotl Mayek-Perez

E

l término tecnología del ADN recombinante puede considerarse sinónimo de Ingeniería Genética. El fundamento de la tecnología del ADN recombinante, es la inserción de fragmentos de ADN de cualquier organismo en vectores o plásmidos (clonación) que sean aplicables a bacterias. El vector es amplificado obteniéndose grandes cantidades de éste, y el fragmento de ADN insertado en el vector puede ser estudiado de manera estructural y funcional. En este capítulo revisaremos los conceptos, generalidades y las estrategias utilizadas para la obtención de ADN recombinante, así como también se revisan sus aplicaciones en salud humana, agrícola, pecuaria e industrial.

Orígenes de la Ingeniería Genética En los inicios de los 70s, el ADN era una molécula difícil de estudiar por métodos bioquímicos, debido a su gran longitud y se pensaba que era monótona por las repeticiones de bases en sus secuencias; por lo cual, sólo era posible su análisis por métodos indirectos, esto es por la determinación de las secuencias de sus proteínas o del ARN. A continuación se mencionan los descubrimientos importantes que permitieron el desarrollo de la tecnología del ADN recombinante (véase Cuadro 1). 61

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

Clonación La clonación de genes consiste en multiplicar un fragmento de ADN recombinante en una célula-huésped (generalmente una bacteria o una levadura) y sustentar las copias de ADN obtenidas. En términos de biología molecular, la clonación de genes es el método de inserción de un segmento de ADN foráneo heterólogo, dentro de un vector que se replica en un huésped específico tal como sería un plásmido o un virus (véase Figura 1). La recombinación in vitro del ADN comprende una serie de pasos que van desde la purificación del material genético aislado de cualquier fuente como pueden ser: nuclear, mitocondrial y de cloroplasto y su manipulación en tubos de ensayo para llevar a cabo el corte, unión e introducción de las moléculas de ADN, realizado por diferentes enzimas, donde destacan las endonucleasas de restricción y aquellas encargadas en la realización de moléculas recombinantes (véase Cuadro 2).

Cuadro 1. Cronolog ia

de los descubrimientos importantes que dieron lugar a la tecnologia del ADN recombinante

Año

Autor

1970

Hamilton Smith

1972-1973

Boyer, Cohen y Berg

1975-1977

Maxam y Gilbert, Sanger y Barrel

Descubrimiento Afelamiento de la primera resctrictasa que corta el ADN en diana o secuencia determinada. Obtencion de la primera molecula de ADN recombinante artificial (quimerico). Metodos rapidos para la secuenciacion de fragmentos de

1975 1981 1981-1982 1980-1983

Southern Itakura, Riggs, Boyer y Zapata Kan y Dozy

ADN.

Tecnicas de hibridacion y transferencia sobre gel para la detection de secuencias especificas de ADN. Se produce una hormona humana, la somatostatina, en microorgamsmos. Primer diagnostico prenatal de la enfermedad anemia falciforme por analisis de ADN con restrictasas.

Palmiter y Birnster Obtencion de superratones de peso doble del normal.

1983

Schell, Van Montagu y Herrera-Estrella Sanger

1983

Mullis y Faloona

Expresion de genes quimericos transferidos a celulas de plantas usando un vector derivado del plasmido Ti. Secuencia completa del ADN del fago lambda, de 48 502 pb. Invention de la tecnica de reaction en cadena de la polimerasa (PCR, por sus siglas en ingles).

Fuente: elaboracion propia. 62

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Vectores de clonación El análisis molecular del ADN ha sido posible mediante su clonación o aislamiento. Las dos moléculas que se requieren para la clonación son el ADN a clonarse y el vector de clonación. Un vector de clonación es una molécula de ADN circular que porta ADN extraño en la célula huésped, se replica dentro de la célula bacteriana o de levadura, produciendo muchas copias de sí mismo, junto con el ADN extraño. De manera general, se espera que los vectores de clonación: 1. Posean secuencias que permitan su replicación autónoma en la bacteria (o en una levadura para el caso de Cromosomas Artificiales de Levadura o "YACS").

Figura 1. Procedimiento de clonacion de ADN. 63

CAPITULO III. APLICACIONES DE LA TECNOLOGIA DEL ADN RECOMBINANTE

Cuadro 2. Principales enzimas utilizadas en Ingenieria Genetica Enzima (s)

Ejemplo

Funcion

Nucleasas

Endonucleasa de restriction tipo II

Reconocer secuencias especificas de ADN y cortar el esqueleto fosfodiester dentro o en la vecindad de la secuencia especifica.

Fosfatasas

Fosfatasa alcalina

T4 ADN ligasa Ligasas T4 ARN ligasa

Quinasas

T4 polinucleotido cinasa ADN polimerasa I

Polimerasas Transcriptasa inversa

Remover grupos fosfatos de los extremos 3' y 5' del ADN y ARN.

Catalizar la formacion de enlaces fosfodiester en presencia de ATP y ADN de doble cadena con extremos -30H y -5P libres. Catalizar la formacion de enlaces fosfodiester entre el extremo -5P de un donador y el -30H de un aceptor en acidos nucleicos de cadena sencilla o doble. Anadir un grupo fosfato al grupo OH del extremo 5' de un polinucleotido para marcarlo o para permitir una ligation. Rellenar los huecos de ADN, tiene actividad exodesoxirribonucleasa en ambos sentidos. Sintetizar una cadena de ADN complementaria a una hebra de ARN, ADN O ARN-ADN.

Topoisomerasas

Topoisomerasa I

Catalizar la remocion de superenrrollamiento al cortar ambas cadenas y reformar los enlaces fosfodiester.

Transferasas

Guanililtransferasa

Transferir GMP del GTP al ARN con un grupo di o trifosfato terminal.

Fuente: elaboration propia.

2. Tengan un sitio de clonación múltiple para insertar ADN extraño. Los vectores más versátiles contienen un sitio que puede ser cortado por muchas enzimas de restricción. 3. Cuenten con un método de selección para bacterias (o levaduras en el caso de YACS) que contengan al vector con ADN extraño; usualmente, con el uso de marcadores de selección para resistencia a drogas, o antibióticos, síntesis de aminoácidos, algunas bases, etcétera. 64

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Tipos de vectores de clonación En los años setenta otro de los problemas que enfrentaba la ingeniería genética era la necesidad de producir hospedadores y vectores que fueran viables y capaces de mantener el ADN foráneo y además poder identificar las bacterias portadoras de los genes clonados. También se debe considerar que los hospedadores y vectores debían ser seguros y no tener repercusiones para la salud humana, por ejemplo la primera cepa segura de Escherichia coli, K12 requería ácido diamonipimélico, el cual no se encuentra en el intestino humano. Otro de los aspectos a considerar en la utilización de los plásmidos es el hecho de que naturalmente poseen resistencia a antibióticos, movilidad y producción de bacteriocinas, por lo cual en el momento de su manipulación se debe tener cuidado de no contribuir a difundir la resistencia a los antibióticos de las bacterias con la consecuencia de generar nuevas cepas resistentes. Los plásmidos con genes para resistencia a antibióticos son muy convenientes como vectores de ADN, por ejemplo el plásmido pBR322 lleva genes para resistencia a dos antibióticos, ampicilina y tetraciclina, en los que se encuentran dianas de restricción. Cuando se inserta una secuencia de ADN extraña en uno de estos genes, el gen se inactiva y la bacteria o célula que reciba ese plásmido adquiere la resistencia especificada por el otro gen, que está intacto (véase Figura 2). Una característica importante de los plásmidos es la capacidad de transferirse natural o artificialmente a otras células por mecanismos de movilización, tales como la conjugación, la transducción y la transformación. A continuación se da una lista de vectores de clonación con sus características principales: • Plásmido. Molécula de ADN circular extra-cromosómico que se replica de manera autónoma dentro de la célula bacteriana y que soporta fragmentos clonados de hasta 10 mil pb (10 kb). Un ejemplo clásico de un plásmido es el pBR322 (véase Figura 3). • Fago. Por ejemplo el bacteriófago lambda. Son moléculas de ADN lineal cuyas regiones pueden reemplazarse con ADN extraño sin interrumpir su ciclo de vida. Soporta fragmentos clonados de 8 a 20 kb. • Cósmido. Molécula de ADN circular extra-cromosómico que combina características de plásmidos y fagos. Soporta fragmentos clonados de 35 a 50 kb. Sus características son: un origen de replicación plasmídico, uno o más marcadores seleccionables, un sitio eos que es una secuencia de ADN del bacteriófago X, que se necesita para el empaquetamiento. • Cromosomas Artificiales Bacterianos (BACS). Se basan en plásmidos mini-F de bacterias. Soporta fragmentos clonados de 75 a 300 kb. 65

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

Cromosomas Artificiales de Levaduras (YACS). Son cromosomas artificiales que contienen telómeros, origen de replicación, centrómero de levadura y un marcador de selección para su identificación en la levadura. Soporta fragmentos clonados de 100 a 1 mil kb. Pueden amplificar en bacterias y se facilita la secuenciación del ADN. Cromosomas Artificiales derivados de Pl (PACS). Son cromosomas artificiales que tienen un sistema de clonación basado en bacterias que tiene un vector basado en Pl y el complejo de empaquetamiento Pl que se soporta insertos de hasta 100 kb con bajo número de copias, aunque es un sistema altamente estable. Existen bibliotecas comercialmente disponibles de este sistema de humanos y ratones.

Figura 2. Insercion de ADN extrano utilizando el plásmido pBR322. 66

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Cromosomas Artificiales de Mamíferos (MACS) Ó Cromosomas Artificiales de Humanos (HACS). LOS MACS y HACS son vectores artificiales utilizados para transferir o expresar grandes fragmentos de ADN humano. Los HACS se comportan como cromosomas humanos y tienen una apariencia similar y son los nuevos sistemas de vectores que se están desarrollando artificialmente para saber si es posible generar un cromosoma artificial que contenga elementos humanos y funcione como cromosoma humano y, además, si este tipo de vector puede utilizarse para transferir y expresar fragmentos grandes de ADN humano. Los cromosomas artificiales humanos también se llaman cromosomas artificiales de mamíferos. Aunque es posible que los cromosomas artificiales humanos puedan no funcionar en todas las células de mamíferos, cumplen con los siguientes requisitos: se comportan como un

Figure 3. Mapas geneticos de vectores de clonación. El plasmido pBR322 donde se observan los dOS genes para resistencia a antibioticos. Un vector tipo BAC, pBeloBAcl1 donde se observa el operon lacZ y un vector tipo YAC, PYAC4 con su origen de replicacion autonoma (ARS2) y el marcador de selection URA3. 67

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

cromosoma; se replican una vez por cada ciclo de la célula y se segregan uno a uno durante la mitosis; son artificiales porque son construidos a partir de fragmentos de un cromosoma funcional. Sin embargo, actualmente no se tiene una idea completa acerca de cuáles son todas las piezas necesarias para su construcción.

Pasos generales para un proyecto de clonación molecular de ADN 1. Identificar el método adecuado para la selection de la secuencia deseada: patrones de restriction, tamafio esperado, fuente enriquecida de ARNm.

2. Seleccionar el vector de donation adecuado tomando en cuenta su secuencia nucleotidica, genes de selection, marcadores. 3. Seleccionar la cepa receptora: condiciones de cultivo, genotipo, requerimientos especiales. 4. Preparar el vector y el ADN a ser clonados mediante digestion con las mismas enzimas de restriction para generar terminaciones complementarias. 5. Ligar el ADN extrano en el vector con ayuda de la ADN ligasa. 6. Introducir el ADN en las celulas bacterianas (o en el tipo de celula-vector que se usara) para su transformation, incorporando en el experimento los testigos adecuados. 7. Seleccionar las celulas que contengan al ADN extrano (vector) mediante el uso del marcador de selection que posee el vector o plasmido.

Clonación de ADN complementario La clonación que se ha descrito hasta el momento trabaja para piezas aleatorias de ADN. Pero en el caso de experimentos donde el objetivo es obtener una secuencia de ADN que codifica específicamente la producción de una proteína, cualquier procedimiento que optimice la clonación será benéfico. Una técnica que trabaja en ese sentido es la clonación de ADN complementario (ADNC). El principio de esta técnica se basa en que el ARNm aislado de un estado específico del desarrollo deberá contener ARNm específicos para cualquier proteína expresada durante dicho estado. Así, si el ARNm puede ser aislado, el gen puede estudiarse. El ARNm no puede clonarse directamente pero si puede clonarse una molécula de ADNC, sintetizada a partir del ARNm. Esta conversión puede lograrse con la acción de una transcriptasa reversa y una ADN polimerasa, la primera hace una copia de ADN 68

JUAN M. GONZALEZ, KRYSTAL LIRA, SANJUANA HERNANDEZ Y NETZAHUALCOYOTL MAYEK

de cadena sencilla del ARNHI y la segunda cadena se genera con la ADN polimerasa; finalmente, el producto de doble cadena se introduce en un vector apropiado, segiin las condiciones deseadas (vease Figura 4). En los fagos a diferencia de los plasmidos se pueden insertar fragmentos de ADN grandes, hasta 20 kb y su ventaja radica en que toda la region central de ADN del fago es innecesaria para su replication y solo sirve para asegurar la integration del ADN del fago en el cromosoma del hospedante (vease Figura 5).

Selecci6n de clonas en bibliotecas El resultado de cualquier experimento de donation que se realice a partir de ADN genomico total de una fuente especi'fica es una biblioteca de "clonas". De esta manera, el ARNHI a traves de un intermediario de ADN genera una biblioteca de ADNC que representa al ARNHI de un estado de desarrollo especifico del organismo, o la celula, etc. En contraste, si se clona el ADN humano total en un vector del fago lambda o un cosmido, puede obtenerse una libreria genomica que contenga (con una probabilidad de 95 a 99%) todas las secuencias del genoma humano o el ADN complementario. Las bibliotecas de fago lambda o de c6smidos se utilizan para establecer bibliotecas genomicas dado que generalmente se pueden clonar en ellas genes completos que contienen la secuencia codificante y los elementos regulados de una clona individual. Uno de los elementos clave para identificar un gen durante la clonacion es el uso de "sondas". Una sonda es un fragmento de ADN que forma parte de la secuencia que se esta buscando. Tipicamente, se marca la sonda con un metodo radiactivo o no radiactivo. La sonda se usa para hibridarla contra el ADN inmovilizado en membrana. El principio es acorde a lo descrito por Southern. Para clarificar un poco, se indican los siguientes terminos: • Sonda. Acido nucleico (por lo general de ADN) que es complementario a un gen especifico o a una secuencia de acido nucleico de interes; cuando la biblioteca de ADNC esta en el cribado, se utiliza un anticuerpo para identificar a la proteina que esta expresando el inserto de la clona. • Sonda homologa. Sonda exactamente complementaria a la secuencia del acido nucleico buscado; p.e. un ADNC humano usado para buscar en una biblioteca genomica humana. • Sonda heterologa. Sonda similar pero no exactamente complementaria a la secuencia del acido nucleico que se esta buscando; p.e. una sonda de raton que se usa para buscar en una biblioteca genomica humana. 69

CAPJTULO III. APLICACIONES DE LA TECNOLOGIA DEL ADN RECOMBINANTE

Figura 4. Preparacion de ADNC a partir de ARNM mediante la enziraa transcriptasa reversa. 70

JUAN M. GONZALEZ, KRYSTAL LIRA, SANJUANA HERNANDEZ Y NETZAHUALCOYOTL MAYEK

Figura 5. Clonación en células de mamíferos utilizando un vector retrovírico: fago λ. 71

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

Búsqueda de un ADNC O Biblioteca genómica Para realizar una correcta búsqueda en una biblioteca genómica es conveniente realizar lo siguiente: 1. Inmovilizar los miembros de la biblioteca en una membrana de nylon y desnaturalizarlos para que permanezcan en cadena sencilla. 2. Preparar la sonda marcada (con radioisótopos, quimioluminiscencia o fluorescencia) y desnaturalizarla para dejarla en cadenas sencillas. 3. Hibridar la sonda con las clonas de la biblioteca. 4. Lavar los excesos de la sonda y exponer la membrana a una película de rayos X y revelarla. 5. Aislar la clona positiva y analizarla. El paso de hibridación se realiza con temperatura no astringente (condiciones no severas de hibridación, como baja temperatura), misma que asegura que la sonda se pueda unir a cualquier clona que contenga una secuencia similar. Al mismo tiempo, ocurrirán algunas hibridaciones no específicas debido a que algunas clonas contendrán limitada aunque no significativa similitud con la sonda. El paso de lavado se lleva a cabo en condiciones de temperatura astringente para que se lave la sonda de todas las clonas en las cuales se unió de manera no específica. Es importante que la temperatura no sea tan alta de manera que la sonda se lave de las clonas que contengan las secuencias similares o idénticas a la misma sonda. Por tanto, debe tenerse muy en cuenta la fuente de la sonda (homologa o heteróloga) para determinar la temperatura a usar en el lavado ó eliminación de la sonda sin hibridar (véase Figura 6). Existen múltiples aplicaciones de la tecnología del ADN recombinante, en procesos básicos de investigación y de la biología de todos los organismos, como en los procesos aplicados a estos. Por razones antropocéntricas, revisten mayor importancia aquellas aplicaciones que tratan de dar respuesta a los principales problemas que aquejan a la humanidad, principalmente en las áreas de la salud, la alimentación, la agropecuaria y la industrial. La clonación o aislamiento de fragmentos de ADN de cualquier organismo, ha sido la base para poder estudiar los genes a nivel estructural y funcional; gracias a ello, se han podido caracterizar un gran número de genes de interés, analizando su secuencia para saber cómo están regulados, cuál es la composición de sus nucleótidos o bases y cómo afectan éstos en su expresión, que tipo de proteína codifican, cuáles son las zonas más importantes para que esa proteína lleve a cabo su función, cuál es la conformación tridimensional que guarda en el espacio, etc. Aunado a esto, la clonación de genes también ha servido para manipularlos, añadiendo, eliminando o sustituyendo parte de su secuencia con múltiples propósitos, dentro de los que 72

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Figura 6. Identificación de una clona con el fragmento de ADN deseado. 73

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

destaca la creación de copias no funcionales de los genes (mutantes) para estudiar la función de esos genes. Fundamentalmente, por ingeniería genética se pueden elaborar o introducir mutaciones en los genes para inactivarlos, por tres diferentes maneras: a) Introduciendo en el gen una secuencia de ADN, que puede ser un gen que sirva como marcador de selección (gen que proporciona resistencia a antibióticos, por ejemplo); b) eliminando una parte o la secuencia completa del gen a estudiar (puede ser parte de su región catalítica, es decir, la región que es importante para ejercer la función de ese gen); ó c) introduciendo un cambio puntual en el gen (inserción, eliminación o sustitución de hasta una base) (véase Figura 7). La única condición que se debe cumplir en cualquiera de los procedimientos mencionados, es que exista una alteración en el marco de lectura abierto de ese gen, para que genere un transcrito (mARN) diferente al gen silvestre, y que lleve a la producción, cuando sea el caso, de una proteína no funcional. La adición o eliminación de fragmentos de ADN de un gen es algo rutinario en la biología molecular, y se hace de forma simple gracias al uso de las enzimas de restricción como se ha mencionado en apartados anteriores. Sin embargo, el introducir una mutación puntual en un gen representa una tarea más difícil, porque en muchas ocasiones no existen sitios de corte favorables para llevar a cabo la mutación. Para introducir una mutación puntual se utilizan oligonucleótidos (fragmentos cortos de ADN de 15 a 25 bases), éstos se diseñan con la mutación que se desea introducir al gen. El gen a ser modificado se clona en un plásmido que pueda originar una cadena sencilla de ADN (como el fago MI3), así el oligonucleótido sirve como cebador para la síntesis in vitro de la cadena complementaria de ADN. Posteriormente el

Figura 7. Maneras de interrumpir genes, a) Eliminación de una parte o del gen completo, b) Introducción de un marcador de selección dentro del gen. c) Introducción de una mutación puntual en el gen. 74

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

fago se reproduce en una bacteria para dar lugar a múltiples fagos con copias del ADN mutado. Este procedimiento tiene varios usos: principalmente en la interrupción (mutación) de genes, en la eliminación o creación de sitios de restricción, generación o eliminación de codones que detienen la transcripción, o generación de nuevos codones que codifiquen para aminoácidos diferentes, etcétera. Otro empleo básico de la tecnología del ADN recombinante es la síntesis artificial de genes. Este método fue aplicado por primera vez a mediados de los 60s por Khorana, quien sintetizó el ADN que codifica para el ÍARN de la alanina (cuya secuencia ya se conocía). Diseñó varios oligonucleótidos cortos de cada cadena, añadiendo una base a la vez. Los oligonucleótidos cortos fueron seleccionados por tener secuencias complementarias, permitiendo el apareamiento (hibridación) entre ellos para generar la secuencia completa del gen. No se puede concebir la secuenciación de genomas completos sin la clonación. Desde 1995 cuando se reportaron los primeros genomas totalmente secuenciados de dos bacterias {Haemophilus influenzae y Micoplasma genitaliurrí), hoy en día el número de organismos, tanto procariotas como eucariotas, cuya secuencia de su genoma se conoce ha ido en aumento, y se ha visto favorecido por las diferentes estrategias que se han establecido para secuenciarlos. En los principios de la secuenciación de genomas, se construían librerías genómicas, y no eran sino grandes fragmentos de ADN que se clonaban en un vector apropiado, y se ordenaban de manera que se translaparan esos fragmentos para poder ser secuenciados. La técnica de secuenciación usada es conocida como "paseo cromosómico" (véase Figura 8). Es necesario tener un punto de partida en la secuenciación (un gen en particular), y por medio de hibridación se identificaba la clona (fragmento de ADN) que contenía ese gen. Una vez secuenciada toda la clona, se utilizaba la región más distal de la secuencia como sonda para identificarla en otra clona u otro plásmido, donde se encontraba su "traslape o empalme"; se volvía a secuenciar y mediante hibridación de la región más distal de esa secuencia con otras clonas, se identificaban la siguiente clona de empalme con la región ya secuenciada. Este proceso se repetía varias veces hasta secuenciar todas las clonas, y así se conocía de manera ordenada la disposición de los fragmentos de ADN clonados en la biblioteca genómica. Una de las técnicas más comunes para la secuenciación, consiste en cortar el ADN genómico del organismo en fragmentos cortos y clonarlos en vectores apropiados para posteriormente secuenciarlos. Una vez hecho esto, con ayuda de programas computacionales, se procede a ensamblar esos fragmentos mediante alineamiento de las secuencias obtenidas, para disponer en forma ordenada las secuencias. Esto resulta muy práctico cuando se trata de secuenciar genomas relativamente pequeños como es el caso de las bacterias. Cuando se desean secuenciar organismos de mayor tamaño como los de organismos eucarióticos, la estrategia a seguir es la ruptura del ADN genómico en fragmentos grandes de varios miles de bases, que son clonados 75

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

Figura 8. Secuenciación del ADN mediante "paseo cromosómico".

en vectores tipo cósmidos, ya que en estos vectores se pueden clonar fragmentos de ADN muy grandes. Alternativamente a este procedimiento, es recomendable que la secuenciación del genoma se lleve a cabo en partes, por ejemplo, cromosoma por cromosoma. En la actualidad con la ayuda de la nanotecnología, se emplean estrategias para conocer el genoma de diversos organismos como la piroseeuenciación, desarrollada por la empresa 454 Life Sciences (véase Figura 9). Esta técnica involucra el uso de placas con microceldas que contienen una nanoesfera atrapada por cada celdilla, y en la cual se lleva a cabo una reacción de secuenciación individual, mediante la amplificación por PCR del ADN, cuyo tamaño aproximado es de 100 bases, adjunto a cada nanoesfera. La técnica se denomina piroseeuenciación debido a que la incorporación de cada nucleótido durante la síntesis del ADN, libera una molécula de pirofosfato, la cual al interaccionar con enzimas específicas, es detectada por 76

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Preparar adaptadores ligados auna sola cadena de ADN

Los fragmentos amplificados se unen a secuencias complementarias contenidas en la esfera

Cargar esferas y enzimas en el dispositivo "PicoTiterPlate"

Solo entra una esfera por pocilio junto con las enzimas

Inicia secuenciación por síntesis en el secuenciador.

Figura 9. Esquema general del desarrollo de la pirosecuenciación. 77

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

quimioluminiscencia usando una cámara de detección de fotones acoplada a una computadora. Los alcances de esta metodología son de secuenciar hasta 20 millones de bases en pocas horas, correspondiente al tamaño de genomas de organismos procariotas y algunos eucariotas inferiores. Sin embargo, datos presentados en el foro de los avances en tecnología y biología de los genomas en este año, en Florida, E.U.A., indican que se han estandarizado secuenciaciones de 657 bases por celdilla en promedio, en comparación con las 100 bases cuando se inició esta técnica, lo que implica una reducción considerable en el tiempo empleado para descifrar un genoma. Un aspecto importante en el estudio de la funcionalidad de los genes, es realizar un análisis de su expresión. El aislamiento de los genes permite monitorear su expresión, y en muchos de los casos, no es necesario conocer la secuencia completa del gen (véase capítulo de análisis de la expresión génica). Como se ha mencionado anteriormente, los genes aislados son susceptibles a ser manipulados con diferentes propósitos. Uno de estos fines está enfocado a estudiar la región regulatoria (promotores) de los genes. Estos pueden incluir el análisis de la secuencia de esta región para buscar elementos conservados que estén involucrados en la transcripción de los genes de organismos procariotas o eucariotas. A su vez, se puede evaluar la fuerza o potencia de los promotores para dirigir la expresión de los genes, así como la regulación de dicha expresión, puesto que no todos los genes se expresan en tiempo y espacio de la misma manera. Para evaluar estos parámetros se usan los genes reporteros, cuya función es monitorear la expresión temporal y espacial de un gen determinado. Para realizar esto, se elabora in vitro un vector sustituyendo el gen de interés por un gen reportero (beta galactosidasa, proteína verde fluorescente (GFP), por ejemplo) dejando intacto el promotor del gen en estudio. Posteriormente se introduce este vector al organismo de donde se aisló el gen a analizar, y por técnicas bioquímicas y moleculares, se determina tanto el nivel de expresión, como el estadio del organismo donde está expresado ese gen reportero. De esta manera podemos evaluar la fuerza del promotor, así como la regulación a la cual está sujeto el gen de interés. En este mismo orden de ideas, con la ayuda de los genes reporteros, se puede analizar la localización celular de una proteína, el nivel de transcripción (nivel de expresión a la que puede transcribir un gen) y la regulación, de la gran mayoría (sino es que todos) de los promotores presentes en un genoma dado. Para ello se clona en un vector un gen reportero sin su promotor. Se integran miles de copias del vector de manera aleatoria en el genoma del organismo cuyos promotores se desean estudiar. Sólo habrá expresión del gen reportero si y solo sí, éste se integra junto a un promotor que pueda transcribirlo. Posteriormente, analizando la expresión de ese gen reportero se seleccionan aquellas células que muestren una alta expresión (si es el parámetro a evaluar), y para conocer la identidad de ese promotor, se diseñan oligonucleótidos con base en la secuencia del gen reportero y se realiza un PCR hacia 78

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

fuera del gen, para después secuenciar el producto amplificado en la PCR. Otra alternativa es realizando un mareaje (radiactivo o no radiactivo) del gen reportero para usarlo como sonda, y por medio de la técnica de Southern blot se identifica el fragmento de ADN donde ocurrió la inserción del gen reportero, se clona en otro vector este fragmento y se determina su secuencia para identificar el promotor que dirigió la expresión del gen. Para realizar un análisis completo del genoma en la búsqueda de promotores, el ADN genómico total se digiere en fragmentos pequeños que se ligan o introducen en el vector que lleva el gen reportero sin promotor, después se introducen al organismo en estudio para evaluar su expresión. Si bien estas aplicaciones de la clonación han sido más empleadas en bacterias, existen otras estrategias (como la localización de elementos regulatorios de la transcripción, regiones de ADN que sirven de unión a proteínas, por citar ejemplos) que se han llevado a cabo en hongos, plantas y mamíferos. Adicionalmente los genes clonados pueden ser expresados en otros organismos diferentes de donde fueron aislados (expresión heteróloga). De manera similar a los casos antes mencionados, el gen de interés se clona en un vector que tiene un promotor fuerte del organismo en el cual se desea expresar ese gen, la condición determinante es que ese promotor "propio" (homólogo) del organismo dirija la transcripción del gen a estudiar. Esta estrategia se le conoce también como fusión transcripcional, ya que la expresión del gen está ligada a un promotor dado. Este mecanismo ha sido de gran utilidad por el gran potencial aplicativo que se le ha dado en diversas áreas, cuyos ejemplos se detallarán más adelante (véase Figura 10). Otra aplicación básica de la clonación de los genes, es el estudio de la localización celular de una proteína de interés, codificada por un gen en particular. Para ello se realiza una fusión traduccional del gen cuya proteína se desea estudiar, con un gen usado como reportero, bajo la dirección de un promotor homólogo del organismo en el cual se desea localizar. La fusión traduccional del gen en estudio, puede llevarse a cabo tanto en el 5' como en el 3' (inicio o final) del gen reportero. Por fusión traduccional se entiende como la unión in vitro de dos genes para codificar en una sola molécula, las dos proteínas codificadas por esos genes. La condición indispensable que se necesita para establecer una fusión traduccional es que al unir los genes, al primero de ellos se eliminen las tres bases del codón de parada de la transcripción, para inmediatamente unir el codón de inicio de la transcripción (ATG) del segundo gen. Dicho de otra manera, la fusión debe conservar el mismo marco de lectura abierto en ambos genes, sin el codón de terminación del primer gen, para que la transcripción y traducción de ese gen, de como resultado la producción de las dos proteínas de los genes, unidas en una sola molécula. De esta manera, la ARN polimerasa transcribirá el primer gen, y al no encontrar el codón de terminación (deliberadamente eliminado), seguirá con la transcripción del segundo gen hasta su 80 codón de 79

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

Figura 10. Fusión transcripcional de un gen. a) La expresión de un gen está dirigida por su promotor, b) Introducción de un nuevo gen (sustituyendo al anterior) cuya expresión estará regulada por las secuencias promotoras que se encuentren en la región 5'.

parada. Esto da como resultado una molécula de ARNIΠ que tiene los transcritos de ambos genes y que posteriormente, será usado como molde para sintetizar las dos proteínas unidas. Actualmente existen vectores comerciales que facilitan las fusiones traduccionales para diversos fines, con diferentes genes reporteros y promotores específicos para su expresión en diversos organismos (véase Figura 11).

Transformación genética Para que la tecnología del ADN recombinante pueda tener una aplicación práctica y uso potencial para desarrollar todos los aspectos que abarca la biotecnología, es de vital importancia tener un eslabón entre el aislamiento y clonación de los genes in vitro, y el estudio de esos genes in vivo en los diversos organismos. El siguiente 80

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Figura 11. Fusión traduccional de un gen. a) La expresión de un gen está dirigida por su promotor. La fusión traduccional puede hacerse en la parte carboxilo-terminal o amino-terminal respecto a la proteína codificada por el gen 1, b) y c), respectivamente, b) El gen 2 que se desea fusionar (puede ser un gen reportero) se introduce en el extremo C-terminal, con la condición de eliminar el codón de parada de la transcripción del gen 1, para evitar la ruptura del marco de lectura, c) En este caso en el gen 2 se elimina el codón de paro de la transcripción y se introduce en el extremo N-terminal. La flecha con la punta truncada simboliza el gen sin el codón de paro de la transcripción.

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

paso después de la clonación es introducir el ADN a estudiar en el organismo de elección. Al proceso de introducción de ADN foráneo a una célula procariota se le conoce como transformación, mientras que cuando la célula aceptora del ADN es eucariota se denomina transfección. La introducción del material genético se debe hacer tomando en cuenta que las células eucariotas y procariotas poseen una barrera natural que selecciona el tipo de sustancias pueden pasar a través de ella. Esta barrera es la membrana celular. Para poder superar esta barrera se han diseñado muchas estrategias experimentales, algunas basadas en la formación de poros u orificios en la membrana, más o menos permanentes, y otras en el transporte de moléculas hacia el interior de la célula mediante el uso de las vías naturales de entrada de macromoléculas, la endocitosis. Existen diversas metodologías para llevar a cabo la transfección del material genético, y pueden clasificarse de forma general en métodos físicos, químicos o biológicos. Sin embargo, el fundamento de todos ellos es permitir que el ADN traspase esa barrera física permeabilizando la membrana, ya sea alterando las cargas, creando poros o utilizando un vehículo o vector. Es importante también que el organismo que va a ser transformado genéticamente se encuentre en un estado de "competencia", es decir, un estado fisiológico que le permita estar susceptible a recibir el ADN foráneo. En bacterias las técnicas más usadas en la transformación de células, es la alteración de la permeabilidad y cargas de la membrana usando soluciones de cationes como el calcio, posteriormente se aplican a las células un choque térmico, generalmente 42 grados Celsius, que varía de segundos a un par de minutos, esto permite la entrada a la célula del material genético. La electroporación es una técnica basada en la aplicación de un voltaje elevado a las células durante un periodo de tiempo muy corto (menos de un segundo). Durante ese tiempo, las células despolarizan sus membranas y se forman pequeños orificios por los que penetran las moléculas (proteínas o ADN) que se encuentran en el medio. Para realizar transformación genética de organismos eucariotas, existen mayor cantidad de procedimientos que se pueden emplear. En eucariotas inferiores como los hongos, se han empleado diversas técnicas como el tratamiento con solución de acetato de litio que permeabilizan la pared, seguida de un choque osmótico. Otras técnicas emplean la digestión parcial o total de la pared celular (formación de protoplastos) de estos organismos, utilizando enzimas líticas que degradan los polímeros que forman parte de la pared celular. Además, técnicas usadas en organismos eucariotas superiores como la biobalistica y transformación vía Agrobacterium tumefaciens, han sido adaptadas y aplicadas en hongos con muy buenos resultados. Desde hace millones de años, A. tumefaciens ha hecho ingeniería genética por su cuenta. Esta bacteria, patógena de plantas que induce tumores, se asocia con la planta para transferirle un vector, llamado Ti, el cual contiene la información necesaria para que la planta produzca una sustancia 82

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

de la que solo se puede nutrir esta bacteria. Gracias a este mecanismo, y a la manipulación del vector Ti, has sido posible establecer esta metodología como una de las más empleadas en la transformación genética de plantas. La transformación por bombardeo de partículas o biobalística, es una alternativa a la técnica mediada por A. tumefaciens. Este método usa un dispositivo "tipo pistola" que dispara microproyectiles metálicos, los cuales están recubiertos del ADN que se desea integrar, y van dirigidos a un blanco que pueden ser células de la epidermis de tejido foliar, por ejemplo. Algunas otras técnicas que se usan son los cultivos de suspensiones de células embriogénicas (callos), uso de protoplastos, electroporación, entre otros. La microinyección es una técnica comúnmente utilizada para la transfección de material genético en plantas y animales. Esta técnica permite la introducción de material genómico ajeno a la célula mediante el uso de una microaguja, que penetra en ella, controlada por un microscopio de alta resolución. Esta técnica es muy sensible, pero requiere de equipo especializado y es usada para trabajar con un número limitado de células.

Aplicaciones de la tecnología de ADN recombinante La tecnología del ADN recombinante ha revolucionado al mundo, a partir de la posibilidad de introducir secuencias foráneas de ADN al genoma de una célula, para que ésta lo exprese como si fuera suyo. Las aplicaciones de la ingeniería genética van desde el diseño de nuevos medicamentos, diagnóstico y cura de enfermedades, hasta la producción de plantas transgénicas, pasando por un amplio espectro de aplicación ambiental e industrial, además de contribuir en la biología y la genética con una mayor comprensión de los mecanismos moleculares que operan en los sistemas vivos.

Aplicaciones en genética molecular de humanos Como se mencionó anteriormente, la síntesis artificial de genes tanto en procariotas como en eucariotas tiene una gran aplicación. Los primeros reportes posteriores a los de Boyer, quien sintetizó artificialmente la somatostatina, datan de 1986 cuando Abelson, Miller y sus colaboradores construyeron el gen artificial del ARN de transferencia de la fenilalanina, sintetizando 6 oligonucleótidos individualmente que se solapaban entre sí. Además de la clonación directa, esta técnica ha sido usada para introducir plásmidos recombinantes que llevan secuencias de genes particularmente pequeños, como la insulina humana, la hormona del crecimiento, factores de 83

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

la coagulación, el interferón, entre otros. Estos plásmidos se introducen en bacterias, y a partir de sus cultivos se han obtenido grandes cantidades de las proteínas mencionadas. Esta técnica también se ha usado para la detección y comprensión de varias enfermedades genéticas aplicándose actualmente para la cartografía de genes humanos, es decir, la asignación de la posición de cada gen en su cromosoma respectivo. Hoy en día es posible efectuar la detección de enfermedades genéticas y otros problemas relacionados mediante la Ímplementación de análisis de mayor precisión como los marcadores RFLP (polimorfismos de longitud fragmentos de restricción), los cuales se producen por la acción de diferentes enzimas de restricción. Estos fragmentos son altamente específicos y cualquier variación da la posibilidad de detectar mutaciones, ya sean éstas de carácter mendeliano o no. Incluso esta técnica puede ser empleada para el estudio del ligamiento de genes, ya que si se construyen familias de RFLP en varias generaciones es posible incluso detectar genes completamente ligados, lo que a veces no se puede hacer con las técnicas tradicionales pues no se pueden diferenciar de los genes no ligados. Con el proyecto del genoma humano se pretende cartografiar todos los genes, y esto repercutirá en la identificación de los genes que intervienen en procesos tales como hipertensión arterial, diabetes, Alzheimer, etc. Además de ayudar en el diagnóstico de enfermedades genéticas en niños y poder determinar la susceptibilidad a sufrir determinados padecimientos dentro de las familias. En el área de la medicina y la salud, son indudablemente las más beneficiadas con la Ímplementación de la tecnología de ADN recombinante, puesto que ésta ha permitido detectar y buscar tratamientos alternos para numerosas enfermedades, desarrollar la producción de nuevos fármacos y el desarrollo de terapias genéticas para diversas enfermedades. Además de la detección y diferenciación de organismos patógenos. La producción de sustancias útiles y medicinas es una de las primeras aplicaciones que se encontró para la tecnología del ADN recombinante en el campo de la medicina. Utilizando sistemas bacterianos se han producido hormonas, enzimas, aminoácidos y vitaminas en grandes cantidades, a precios mas bajos, haciéndolas mas accesibles a la población. Los ejemplos más típicos son la producción de la insulina y la hormona del crecimiento humano en cepas de E. coli. Hace algunos años la insulina se extraía de otros mamíferos y su costo era elevado, pero la tecnología de ADN recombinante permitió introducir el gen que la codifica en el genoma de E. coli, la cual produce esta proteína como si fuese propia, llegando a constituir un 40% de la carga proteica total de la célula. Actualmente como aplicación de la biotecnología se han podido incorporar con éxito las principales proteínas de la leche materna a la leche de las vacas, conteniendo hasta un 80% de las proteínas de la leche materna humana. Sin duda esta leche será un sustituto excelente a las leches maternas artificiales que se encuentran hoy en día en el mercado. 84

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Una de las aplicaciones más importantes de la ingeniería genética es la capacidad de detectar mutaciones en los genes que den lugar a enfermedades específicas, o una predisposición a desarrollarlas. El mapeo genético constituye la técnica más empleada para identificar estos genes, y en algunos casos es posible complementar el análisis con otra forma de mapeo conocida como mapeo citogenético. Esta técnica se basa en que al teñir los cromosomas eucarióticos con giemsa producen un patrón de bandas característico, algunas partes del cromosoma se tiñen más que otras. Si la mutación en un cromosoma produce un patrón de bandeo diferente, éste puede ser detectado microscópicamente. El gen humano que codifica para la fenilalanina hidroxilasa (el cual está defectuoso en personas que padecen fenilcetonuria) se localizó mediante este método. Sin embargo es un método de mapeo poco preciso, pero si el gen a localizar ha sido clonado, mediante la técnica de hibridación fluorescente in situ (FISH) se puede determinar con precisión su localización en el cromosoma. Una limitación del mapeo genético es la necesidad de contar con un marcador asociado a un fenotipo específico. El uso de marcadores moleculares, tales como los RFLP y microsatélites, pueden ayudar a localizar genes asociados a una enfermedad de manera más precisa, asociándolos a un polimorfismo específico. Otra estrategia para identificar genes causantes de enfermedades es la genética inversa o retrogenética. Comienza con un fragmento de ADN O un gen cuya función se desconoce para luego deducir su función. Se altera la secuencia de este gen para inactivarlo y se introduce al organismo en estudio para que reemplace al gen silvestre (activo) presente en el genoma, posteriormente se evalúa el fenotipo del organismo transformado (imitante) para tener alguna idea acerca de la función de ese gen desconocido. La distrofia muscular de Duchenne y la fibrosis quística, son ejemplos de enfermedades en las que mediante genética inversa, se entendieron mejor las causas que originan estos desórdenes. El diagnóstico de enfermedades genéticas en la actualidad puede ser llevado a cabo no solo en individuos adultos, sino desde antes de nacer, a esto se le conoce como diagnóstico prenatal, y puede realizarse principalmente mediante dos técnicas: la amniocentesis y la extracción de vellosidades coriónicas. La primera, se basa en la extracción de una muestra del líquido amniótico que protege al feto dentro las membranas embrionarias; el segundo en la extracción de una pequeña muestra de tejido del corion, una de las membranas de protección embrionaria. Esta última tiene la ventaja de poderse llevar a cabo desde etapas tempranas del embarazo, sobre todo cuando el aborto es considerado como una opción. Estas metodologías son útiles para el diagnóstico de genes ligados a una enfermedad específica que se desarrolle desde la fecundación, genes de enfermedades que se desarrollan en etapas adultas del individuo, o aquellos genes que sean una causa de predisposición a una enfermedad en particular. En todos los casos la enfermedad a diagnosticar debe ser 85

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

conocida y con la finalidad de evaluar la posible presencia de mutaciones en esos genes, se emplean técnicas como la PCR y RTPCR. Recientemente se ha usado la técnica de nucleótidos específicos y rastreo genético. Esta técnica utiliza en condiciones adecuadas una sonda que se denomina oligonucleótido específico de alelo (abreviatura ASO, en inglés) el cual hibridará sólo con su secuencia complementaria y no con otras secuencias, aunque éstas varíen sólo en un nucleótido, la hace altamente específica. Las enfermedades que más comúnmente se detectan prenatalmente son la talasemia, la anemia de células falciformes, la predisposición a desarrollar cáncer de pecho, hemofilia, fenilcetonuria, entre otras, porque estos padecimientos están bien documentados y se tiene un conocimiento previo de la localización de los genes que los provocan. El concepto de terapia génica surge como una alternativa para el tratamiento de enfermedades, y esta consiste en transferir alelos normales a un individuo enfermo para eliminar su problema. La finalidad de la terapia génica es la de corregir el defecto de un gen en un organismo, mediante técnicas de ADN recombinante insertando vectores apropiados que contengan ese gen funcional. Esta técnica se emplea rutinariamente con microorganismos, pero obviamente tiene una gran importancia en los seres humanos, ya que alberga la esperanza de la cura de enfermedades hereditarias. En otros mamíferos diferentes al hombre, se ha usado esta metodología con éxito. Un ejemplo es la corrección de una deficiencia en la hormona de crecimiento de ratones. El gen que codifica para esta enzima en la rata fue introducida a ratones; aproximadamente 1% de ellos aceptaron el gen foráneo y mostraron aumento en su talla. Esta manipulación hasta la fecha solo se ha realizado de manera controlada en organismos eucariotas inferiores como los hongos y levaduras. Un punto crucial es la correcta integración en el genoma de la copia endógena. En mamíferos es muy variable el sitio de integración, pocas veces se inserta en el locus homólogo (sitio correcto), por lo tanto no supone una corrección genuina del defecto original, sino un enmascaramiento del mismo. Los alcances de la terapia génica también apuntan a tratar de resolver los problemas asociados con cualquier tipo de cáncer; sin embargo, los estudios al respecto son preliminares y se desconoce mucho sobre el origen y mecanismos que operan en este tipo de desórdenes celulares.

Vacunas Tradicionalmente las vacunas que se emplean hoy en día están elaboradas a partir de una suspensión del patógeno inactivado o muerto, atenuado o con base en dar protección contra toxinas específicas. Algunas vacunas basadas en bacterias muertas 86

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

producen efectos secundarios no deseables. Si se pudieran separar los componentes de la vacuna que causan los efectos colaterales, se tendría una vacuna más segura e igualmente eficaz. A este tipo de vacunas se les denomina subvacuna (subunit vaccine), las cuales se pueden construir por medio de la ingeniería genética, usando exclusivamente los genes (antígenos) del patógeno que son responsables de la inmunidad. Éstas tienen ventajas como su bajo costo, mas seguridad y efectividad para el humano, se evitan problemas de contaminación, daño de los componentes de la vacuna y seguridad en el proceso de producción de la vacuna al no tratar con grandes cultivos de organismos patógenos. El ejemplo clásico es el desarrollo de una vacuna contra el virus de la hepatitis B, en donde el blanco usado es el antígeno de superficie HbS del virus. Esta molécula por si sola confiere inmunidad. También cabe destacar que en un mismo vector se pueden incluir varios genes de antígenos que confieran resistencia contra diferentes patógenos, haciendo una vacuna múltiple. Se han descrito otras tecnologías en el desarrollo de nuevas vacunas como el uso de peptidos sintéticos y vacunas conjugadas, en las cuales el antígeno es unido a una proteína acarreadora.

Aplicaciones forenses La tecnología de ADN recombinante ha pasado a ser un fuerte aliado de la medicina forense y la investigación criminal. La huella digital del ADN O llamada también huella génica, indica que cada ser humano tiene un patrón de restricción único e irrepetible a lo largo de su genoma. Cuando el ADN genómico de varios individuos se corta con una enzima de restricción, y los fragmentos son separados por electroforesis, cada ADN presenta un patrón específico conocido como polimorfismo de longitud de los fragmentos de ADN O RFLP por sus siglas en inglés. El patrón de bandas se utiliza para identificar de forma inequívoca al individuo de quien se obtuvo la muestra de ADN. La muestra de ADN puede provenir de cualquier tejido o fluido humano y gracias a la aplicación de la PCR, el tamaño de muestra puede ser extremadamente pequeño. Este descubrimiento es la base para el desarrollo de técnicas de investigación forense y criminalística, así como para la elucidación de casos de paternidad biológica. No obstante, estos procedimientos han levantado fuertes críticas éticas, ya que en algunos casos estos resultados llevan a discriminaciones raciales y a problemas familiares. Actualmente también se usan los minisatélites o VNTR (secuencias muy repetitivas en "tándem") como huellas moleculares, ya que al ser altamente variables, la combinación de los distintos satélites y la posición de cada uno es una característica única de cada persona, la cual no se puede modificar, ocultar o borrar. 87

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

Aplicaciones en plantas y agricultura Las plantas como muchos otros organismos, son hospederos de moléculas de ADN recombinante. Son múltiples los propósitos para las cuales se utilizan las plantas como receptoras de genes foráneos, como son el desarrollo de plantas resistentes a enfermedades o condiciones ambientales diversas, la producción de metabolitos secundarios, aumento de la producción de los cultivos, la alteración de las propiedades nutricionales, organolépticas, sensoriales y de textura de algunos de sus productos, la producción de vacunas, la promoción del desarrollo del crecimiento vegetal, la tolerancia a herbicidas, el aumento de la adaptabilidad a diferentes tipos de suelos, etc. Como en los demás organismos, para llevar a cabo el desarrollo de estas tecnologías, es necesario el uso de vectores para introducir el ADN a las células vegetales. Se han desarrollado dos sistemas para introducir ADN foráneo en las plantas que se basan en dos tipos de vectores principales: vectores virales específicos de plantas y el plásmido Ti de la bacteria Agrobacterium. Los vectores derivados del plásmido Ti de A. tumefaciens son los más utilizados actualmente. A. tumefaciens es una bacteria fitopatógena que vive en el suelo, y como parte de su ciclo de vida, se introduce a la planta por medio de heridas, transfiriéndole al genoma vegetal el plásmido Ti para modificarla genéticamente (véase Figura 12). La formación de un tumor o agalla en la planta, es la consecuencia de la transferencia, integración en el genoma vegetal y expresión de genes de un fragmento del plásmido Ti, llamado ADN-T o ADN de transferencia. Este ADN-T codifica para dos hormonas (auxina y citocinina) promotoras del crecimiento vegetal, además de unas sustancias llamadas opinas que solo utiliza Agrobacterium como fuente de carbono para su crecimiento. Los vectores Ti son usados como vehículo acarreador del ADN foráneo; sin embargo, han sido sujetos de manipulación para eliminar los genes de las hormonas y las opinas, así como disminuir su tamaño para hacerlos manipulables e introducirles un origen de replicación bacteriano para su mantenimiento y propagación. Los virus se han usado como vectores porque infectan eficientemente las células vegetales, aunque dicha capacidad está determinada por la especie de la planta. El problema más común con estos vectores es que los genes que se introducen son inestables y no se heredan a las siguientes generaciones. Los vectores virales más empleados son los caulimovirus y los geminivirus. Los caulimovirus son esféricos y de genoma circular de ADN. El virus representativo de este grupo es el virus del mosaico de la coliflor, quien puede infectar a un reducido número de plantas emparentadas con la coliflor. Este virus causa una infección sistémica, pero no puede acarrear ADN de gran tamaño porque pierde su infectividad. Los geminivirus poseen un pequeño genoma circular de cadena sencilla. Estos virus infectan tanto mono como dicotiledóneas; sin embargo, la transformación con estos virus es complicada.

JUAN M. GONZÁLEZ, KRYSTΛL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Agrobacteπum conteniendo el

Plasπudo Ti m odificado con un tiansgen

Introducción del vector Ti a una cepa de Agobacterium

plásmidoTí

Figura 12. Transformación genética por Agrobacterium tumefaciens.

Como se ha mencionado, las plantas y células vegetales tienen una gran importancia en la aplicación de la tecnología del ADN recombinante. Entre muchos otros ejemplos se pueden citar los siguientes: • Generación de plantas resistentes a la infección por bacterias (papa). • Producción de especies resistentes al ataque de virus (papa, tabaco, papaya, arroz, tomate, etcétera). • Generación de plantas resistentes al infecciones fúngicas (arroz, tabaco y canola). • Producción de plantas resistentes a los efectos de los herbicidas (tabaco, petunia, tomate, algodón y papa). • Producción de vacunas para uso humano (tomate, plátano y lechuga). • Manipulación de la pigmentación de las flores (clavel, tulipán, crisantemo, rosas y petunia). • Modificación de la apariencia o propiedades sensoriales de las plantas o sus productos (tomate, coliflor y papa). 89

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

• • • •

Alteración en el patrón de maduración de frutos (tomate y mango). Alteración del contenido nutricional de las plantas (maíz y soya). Desarrollo de plantas tolerantes a diferentes tipos de estrés (maíz). Generación de plantas con mayor adaptabilidad a suelos pobres (arroz y maíz).

Aplicaciones de células animales y animales transgénicos Inicialmente el cultivo de células animales fue dirigido a la producción de virus para las vacunas. En la actualidad por medio de la tecnología del ADN recombinante, los cultivos de células animales han servido para obtener una gran variedad de proteínas, hormonas, etc. Además hoy en día se cuenta con la capacidad de transferir genes a líneas celulares, con la posibilidad de crear animales genéticamente idénticos, mediante el transplante de núcleos de tejido embrionarios a huevos u óvulos enucleados, por lo que el mejoramiento y generación de líneas genéticamente puras será un proceso más simple. El cultivo de células que provienen de organismos como el ganado bovino, caprino y porcino, ratón, conejo, simios, etc., se usan para producir una amplia variedad de productos biológicos de interés comercial, entre los que se cuentan los inmunoreguladores, interleucinas, anticuerpos, factores de crecimiento, hormonas, vacunas, interferones, antígenos, etc. Además entre otros usos, se cuenta con el crecimiento de fibroblastos para su transplante en casos de quemaduras severas. Los animales transgénicos son aquellos que han sido modificados genéticamente por la integración artificial de uno o más genes en su genoma. Esto se realiza mediante la introducción del gen foráneo al núcleo de huevos fertilizados, así como la implantación de éstos en una hembra receptora donde se llevará a cabo la gestación de los nuevos organismos. A este procedimiento se le conoce como transgénesis. El o los genes son integrados en el genoma al azar, pero es posible dirigir su integración por una recombinación homologa si lleva zonas flanqueantes homologas al cromosoma. Existen tres procedimientos para la obtención de animales transgénicos (véase Figura 13): Mediante vectores retrovirales: se extrae un embrión de 8 células de una hembra donadora y se infecta con un vector retroviral que contiene el transgene. Posteriormente se implanta el embrión transgénico en una hembra receptora. Obtención por microinyección: se extrae un óvulo de una hembra donadora y se inyecta el transgene en el núcleo masculino. Se implanta el óvulo en una hembra para obtener los animales transgénicos. A partir de células embriónicas: se obtienen unas células de blastocisto las cuales se transfectan con el transgene, estas células transfectadas se inyectan a un blastocisto recipiente y se implanta en una hembra. 90

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Figura 13. Estrategias para la producción de animales transgénicos.

Los ratones son modelos especialmente útiles para llevar a cabo estos procedimientos, y es en estos organismos donde se han obtenido una serie de mutantes afectadas en muchos genes de interés, también llamados gene knock-out. Para mutagenizar un gen e integrarlo de manera homologa en el genoma, se introduce un marcador de selección dentro del gen que se desea interrumpir (en el caso de los ratones se ha utilizado el gen que confiere resistencia a neomicina en bacterias y a geneticina en animales). Posteriormente el transgen es transfectado al genoma de los ratones por doble recombinación homologa. De esta forma no se expresa el gen blanco que fue mutado y así se obtiene un ratón knock out, o un ratón "fuera de combate" en ese gen. Esta técnica ha sido crucial para la completa elucidación de la función exacta de muchos genes. Las técnicas anteriormente mencionadas tienen múltiples aplicaciones prácticas, como la biosíntesis de proteínas heterólogas en las glándulas mamarias de las hembras, producción de organismos resistentes a infecciones y enfermedades, el mejoramiento de productos secundarios de los animales, aceleración de crecimiento para disminuir los tiempos de crianza y sobre todo el establecimiento de modelos animales para el estudio de enfermedades y defectos genéticos en humanos. En este orden de ideas, los ratones se 91

CAPÍTULO III. APLICACIONES DE LA TECNOLOGÍA DEL ADN RECOMBINANTE

ofrecen como buenos modelos para el 92 estudio de enfermedades humanas y para probar agentes terapéuticos contra enfermedades como el Alzheimerv artritis, distrofia muscular, tumorogénesis, hipertensión, disfunciones endocrinas y neurológicas, enfermedades cardiovasculares, etcétera. En el ámbito industrial-comercial, especies del ganado bovino, porcino y caprino han sido utilizadas como biorreactores para la expresión de proteínas como hormonas, factores de coagulación, lactoferrina, enzimas y anticuerpos específicos. En el ganado avícola, con las técnicas de ADN recombinante se han podido obtener aves transgénicas con capacidad mejorada de reproducción y producción de huevos, así como la creación de aves resistentes a enfermedades y producción de huevos con menor contenido de colesterol en la yema. En la industria pecuaria se han obtenido especies de salmón, tilapia y carpa con acelerada velocidad de desarrollo y crecimiento, debido a que se les integró varias copias del gen que codifica para la hormona del crecimiento.

92

JUAN M. GONZÁLEZ, KRYSTAL LIRA, SANJUANA HERNÁNDEZ Y NETZAHUALCÓYOTL MAYEK

Bibliografía Alberts, B.; Johnson, A.; Lewis, J.; Raff, M; Roberts, K.; Walter, P. (2002), Molecular Biology ofthe Cell, 4th Ed., New York, Garland Science, Taylor and Francis Group. Balbás, P. (2002), De la Biología Molecular a la Biotecnología, México, Trillas. Lewin, B. (2000), Genes VII, New York, Oxford University Press. Cherfas, J. (1984), Introducción a la Ingeniería Genética, Madrid, Alianza, p. 293. Darbre, P. D. (1999), Basic Molecular Biology, New York, John Wiley & Sons. Dharmaraj, S. (2004), RT-PCR: The Basics. Disponible en www.ambion.com/techlib/basics/rtpcr; consultado el 10 de agosto de 2009. Fontúrbel, R. F. (2003), La Tecnología del ADN Recombinante: Principios y Aplicaciones, Portal de Biología y Ciencias de la Salud. Disponible en www.biologia. org; consultado el 22 de abril de 2009. Freifelder, D. (1988), Fundamentos de Biología Molecular, España, Acribia, Zaragoza. Griffiths, A. J. F.; Miller, J. H.; Suzuki, D. T.; Lewontin, R. C; Gelbart, W. M. (2000), An Introduction t.o Genetic Analysis, 7th Ed., New York, W. H. Freeman. Dale, J. W.; von Schantz, M. (2002), From Genes to Genomes. Concepts and Applications ofADN Technology, England, John Wiley & Sons, West Sussex. National Health Museum (1999), Cloning into a Plasmid. Disponible en www. accessexcellence.org/RC/VL/GG/plasmid.html; consultado el 24 de noviembre de 2004. Ream, W.; Field, K. G. (1999), Molecular Biology Techniques, New York, An Intensive Laboratory Course, Academic Press. Sambrook, J.; Fritsch, E. F.; Maniatis, T. (1989), Molecular Cloning: a Laboratory Manual, 2nd Ed., New York, Cold Spring Harbor Laboratory Press. Watson, J. D.; Tooze, J.; Kurtz, D. T. (1988), ADN Recombinante, Barcelona, Labor, p. 183. Castro, E. (2008), ADN Recombinante, Las Palmas de Gran Canaria, España, Universidad de Las Palmas de Gran Canaria. Disponible en www.personales.ulpgc.es/ecastro.dbbf/Descargas/Transparencias/ADN%20recombinante. pdf; consultado el 12 de abril de 2009.

93

Capítulo IV Reacción en cadena de la polimerasa (PCR) Mario A. Rodríguez-Pérez

Introducción

E

l ensayo de la PCR consiste en la multiplicación exponencial del número de copias de una secuencia específica de ADN. El método para llevar a cabo la PCR se ha mantenido en el transcurso de los años, pero existen innovaciones sobre todo con el uso de nuevos y más modernos termocicladores. El primer registro del uso de la PCR fue en 1986 por el Dr. Mullis. En los primeros años de su descubrimiento, el PCR se utilizó con ADN polimerasa nativa (E. colí) con el inconveniente de que requería de una gran cantidad de enzima debido a la alta temperatura empleada y riesgo de contaminación. En 1989, el Dr. K. Saiki patenta la Taq polimerasa (derivado de Termophylus aquaticus) por lo que se reduce la cantidad de enzima en el ensayo y se incrementa resistencia a la alta temperatura. Con el tiempo aparecen diversas modalidades de la PCR. El ensayo clásico consiste en la amplificación de un fragmento cuya secuencia es conocida mientras que en la RT-PCR se amplifica un gen cuyo material de partida es ADN de cadena simple o ARN, para producir un ADN complementario. Se pueden amplificar fragmentos de ADN O ARN muy inestables por PCR O un número variable de cebadores (PCR multiplex). La PCR anidada se utiliza para disminuir productos indeseables y obtener productos más específicos y el PCR "hot start" para temperaturas de alineamiento bajas lo que evita formación de dímeros. Aparece el PCR en tiempo real que utiliza cebadores marcados y se lleva a cabo en un sistema capilar permitiendo obtener resultados en minutos. Se obtiene un ahorro en tiempo en el ensayo y se puede visualizar la cinética de reacción pero el costo es elevado. Con el descubrimiento y uso de la PCR provienen 95

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

problemas y limitaciones. Sin embargo, en general, su uso ha conducido al desarrollo biotecnológico de muchos países y, en particular, en nuestro laboratorio ha sido muy útil el protocolo basado en PCR acoplado a un ELISA para la detección molecular, a gran escala, de ADN de parásitos. El protocolo PCR-ELISA puede ser adaptado para la detección de ADN de otros agentes infecciosos o de genes asociados a enfermedades congénitas.

Historia y orígenes de la reacción en cadena de la polimerasa (PCR) "En el año de 1971, el Dr. Khorana describió una técnica para reproducir una región de ADN dúplex mediante el uso de dos cebadores de ADN diseñados, de tal manera, que cada región 3' terminal apuntaba hacia cada uno. Sin embargo, el método para realizar este experimento, de una manera repetida (amplificación), no llegó sino hasta 12 años después (McPherson y Maller, 2000)". "Así, en 1983, el Dr. Kary Mullís de Cetus Corp. desarrolló una nueva técnica que hizo posible la síntesis de grandes cantidades de un fragmento de ADN sin el uso de la técnica de clonación. Esta técnica fue la reacción en cadena de la polimerasa (PCR, por sus siglas en inglés Polymerase Chain Reaction), la cual, hasta hoy en día, ha tenido gran importancia práctica y un notable impacto en el campo de la biotecnología a nivel mundial. Así fue la historia de tan notable descubrimiento. Con la tecnología del ADN recombinante ya plenamente establecida como una técnica de uso rutinario por cientos de laboratorios en el mundo, el Dr. Mullis, de Cetur Corp. en San Francisco, California, tuvo una súbita inspiración mientras manejaba su auto y se dirigía hacia una cabana en la que se disponía descansar el fin de semana. Como muchos otros investigadores, el Dr. Mullis se encontraba desarrollando aplicaciones para los oligos sintéticos. Concibió entonces la idea de que combinando el uso de los oligos con varios ciclos de replicación in vitro se podía amplificar, es decir; obtener en gran cantidad, un segmento de ADN específico (por ejemplo, un gen en particular). Pero veamos en qué consistió la idea. La enzima ADN polimerasa participa en la replicación del ADN. Para convertir una molécula de ADN de doble cadena en dos moléculas idénticas, la enzima requiere que las cadenas de la molécula inicial se separen, para así tener un molde disponible. Además, la enzima requiere un segmento de ADN con un extremo libre, que sirve para cebar o iniciar la reacción de replicación y los nucleótidos precursores. Si se colocan estos sustratos en un tubo de ensayo, la ADN polimerasa puede incorporar uno por uno los nucleótidos correspondientes, es decir, frente a una A en el molde, adicionará T en la cadena creciente; frente a G, C, etc. En realidad, este concepto era perfectamente conocido y 96

MARIO A. RODRÍGUEZ-PÉREZ

aplicado desde mucho antes de que se concibiera la técnica de la PCR. LO original de la idea de la concepción del Dr. Mullis fue pensar qué sucedería si se aplica este procedimiento en ciclos sucesivos, en una reacción en cadena. Los oligos sintéticos, en virtud de su propiedad de hibridación de los ácidos nucleicos, definen los puntos de partida para el copiado de las cadenas de ADN. Si se colocan dos oligos cuya secuencia define los extremos de un segmento determinado de ADN, se hibridan con las hebras del molde, previamente separadas, y se someten a una reacción con ADN polimerasa, de lo que resultarán dos moléculas cuyos extremos están definidos por los oligos y que corren en sentido opuesto. Las cadenas resultantes son complementarias entre si: existen ahora el doble de moléculas con la secuencia que demarcan los oligos. ¿Qué pasa si ese proceso se repite, cíclicamente? El resultado es lo que se denomina un crecimiento exponencial. En el siguiente ciclo de separación de cadenas, hibridación con los oligos y reacción con ADN polimerasa, se obtendrán cuatro moléculas de la región entre los oligos. Los ciclos subsecuentes generarán ocho, 16, 32, 64 moléculas, y así sucesivamente. Así, con la técnica de la PCR se pueden amplificar segmentos específicos de ADN para crear muchos millones de moléculas a partir de unas cuantas, o incluso de una sola. Para esto se requirió adaptar el concepto básico haciendo uso de ADN polimerasas proveniente de microorganismos termófilos (que crecen a temperaturas de más de 70°C en manantiales termales). De otra manera, la enzima se inactivaba en cada ciclo, pues se requiere aplicar calor para separar las moléculas del ADN molde. Hoy día un ciclo puede tomar cinco minutos o menos, por lo que el proceso de amplificación se lleva a cabo en menos de dos horas (normalmente 20 ó 30 ciclos son suficientes). Esto fue un concepto bellamente simple. Lo sorprendente es que los elementos técnicos y conceptuales necesarios para esta invención estuvieron disponibles por varios años antes de que el Dr. Kary Mullis los desarrollara (Soberón-Mainero, 1996)".

Fundamento del ensayo de la PCR "Supongamos que deseamos sintetizar grandes cantidades de una determinada secuencia de ADN. El primer paso consiste en sintetizar fragmentos con secuencias idénticas a las que flanquean la secuencia diana (secuencia que se desea amplificar). Esto se consigue fácilmente con una máquina sintetizadora de ADN, denominada termo-ciclador. Los oligos sintéticos suelen tener unos 20 nucleótidos de longitud y actúan de cebadores o iniciadores de la síntesis del ADN. El proceso de la PCR tiene lugar en tres fases. En primer lugar, el ADN diana que contiene la secuencia que va a amplificarse se desnaturaliza mediante calentamiento para separar sus cadenas complementarias (fase 1). Normalmente, el ADN diana tiene una longitud de entre 97

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

100 y 5 mil pb. A continuación, se añade un exceso de cebadores y se hace descender la temperatura de forma que los cebadores puedan formar puentes de hidrógeno con el ADN a ambos lados de la secuencia diana (fase 2). Debido a que existe un exceso de cebadores, las cadenas del ADN diana prácticamente siempre se asociarán a los cebadores en vez de asociarse entre ellos mismos. Finalmente, se añaden a la mezcla de reacción nucleósidos trifosfatos y una ADN polimerasa. La ADN polimerasa extiende los cebadores y sintetiza copias de la secuencia diana de, ADN (fase 3). Sólo pueden utilizarse polimerasas que sean capaces de funcionar a las elevadas temperaturas que se requieren en el ensayo de la PCR. DOS enzimas de uso común son la polimerasa Taq de la bacteria termófila Thermus aquaticus y la polimerasa Vent de Thermococcus litoralis. Al final de un ciclo, las secuencias diana de ambas cadenas han sido copiadas. Cuando se repite el ciclo de tres fases, las cuatro cadenas del primer ciclo se copian para producir ocho fragmentos (Saiki y otros, 1988; Cariello y otros, 1991; Rodríguez-Sánchez y Barrera-Saldaña, 2004)". "Antes de continuar con el proceso del ensayo de la PCR veamos la importancia de la polimerasa. En la descripción original del ensayo de PCR se utilizó la polimerasa de ADN Klenow. Debido al proceso de desnaturalización a alta temperatura, se requería añadir enzima fresca durante pada ciclo. En ensayo de PCR sufrió una innovación al incorporarse la polimerasa Taq de ADN. La polimerasa Taq de ADN es resistente a altas temperaturas y no es necesario rellenar con la enzima en cada paso durante el proceso de PCR. Además, puesto que la reacción de extensión se lleva a cabo a altas temperaturas, la especificidad de unión de los nucleótidos no se compromete. Como consecuencia del uso de la enzima resistente al calor, el PCR pudo ser automatizado simplemente colocando los ingredientes de reacción en una placa caliente con un programa térmico cíclico adecuado. La polimerasa Taq de ADN carece de la actividad de una exonucleasa correctora de lectura 3'-5\ Esta carencia parece producir errores durante la amplificación de PCR debido a la incorporación equivocada de nucleótidos. Para sobrellevar, de manera parcial, este problema, se han buscado y descrito otras polimerasas de ADN termoestables con mejor fidelidad; sin embargo, la polimerasa Taq de ADN continúa siendo la enzima más utilizada en el ensayo de PCR. En ciertas aplicaciones, especialmente donde se desea clonar ADN, es importante confirmar la secuencia de nucleótidos del producto clonado para revelar cualquier mutación que pudiera haber ocurrido durante el ensayo de PCR. La fidelidad de la reacción de amplificación puede ser evaluada mediante clonación, secuenciación y comparación de varias moléculas amplificadas de manera independiente. Continuando con el proceso del ensayo de la PCR, digamos que en el tercer ciclo de la PCR se generan 16 productos. En teoría, al cabo de 20 ciclos se producirán aproximadamente un millón de copias de la secuencia diana de ADN; en 30 ciclos se generarán alrededor de mil millones de copias. Es posible amplificar fragmentos 98

MARIO A. RODRÍGUEZ-PÉREZ

cuya longitud oscila entre menos de 100 pares de bases y varios miles de pares de bases. Para llevarse a cabo este proceso sólo son necesarios de entre 10 y 100 picomoles del cebador. La concentración de ADN diana puede ser de tan sólo de entre 10^20 y 1015 (ó entre 1 y 105 copias de ADN por 100 pm). La mezcla de la reacción total a menudo ocupa un volumen de 100 pm o menos (Rodríguez-Sánchez y BarreraSaldaña, 2004)". "Existen dos aspectos fundamentales en el ensayo de la PCR. Un aspecto es la enorme amplificación obtenida. Para ilustrar esto, podemos tomar como ejemplo la rutinaria aplicación de un PCR —la amplificación de la secuencia de un gen humano—. Una cantidad inicial típica es 1 μg de ADN genómico humano. Esto se puede obtener fácilmente de la sangre ya que 1 mL de muestra de sangre puede dar aproximadamente 50 μg de ADN. La cantidad inicial de ADN contiene 3 x 105 mo­ léculas de una copia de cualquier secuencia simple, equivalente a 0.1 pg (ó 10 l3 g) de una secuencia diana de 300 nucleótidos de longitud. La amplificación por PCR de una secuencia de este ADN genómico produce una cantidad de ADN diana (hasta 1 μg) suficiente para una aplicación directa en cualquier procedimiento de estudio en biología molecular, incluyendo la secuenciación directa de ADN. Por ejemplo, una pequeña muestra (10 μl en una reacción típica de 100 μL de reacción) del producto de PCR amplificado producirá una banda de ADN que es fácilmente visualizada por fluorescencia con bromuro de etidio después de una electroforesis de un gel. Simples moléculas diana de ADN pueden ser amplificadas. Tal extrema sensibilidad del ensayo de PCR requiere de que la contaminación de la muestra o los reactivos debería de evitarse de manera cuidadosa. El segundo aspecto es la especificidad del PCR. La región diana es definida por el flanqueo de los cebadores y, la especificidad se deriva de la hibridación específica de los cebadores bajo las condiciones de unión en los ciclos termales. El hecho de que la longitud de las secuencias diana sea limitado, en práctica, a menos de unas pocas kilo-bases, tiene una consecuencia positiva en la especificidad del PCR. Esta limitación es positiva porque en algunas aplicaciones de la PCR, un cebador pudiera unirse en ciertos puntos de la secuencia molde: esto es especialmente probable cuando se utilizan cebadores degenerados (ver abajo). Sin embargo, un punto inespecífico de hibridación será a menudo irrelevante ya que es poco probable que una molécula, de un segundo cebador, se una suficientemente cerca para que ocurra la amplificación. La especificidad del PCR depende crucialmente de los cebadores. Los siguientes factores son importantes en la selección de cebadores efectivos. • Los cebadores deberían ser de entre 17 y 30 nucleótidos en longitud. • Un contenido de GC de aproximadamente 50% es lo ideal. Para los cebadores con un bajo contenido de GC, es deseable seleccionar un cebador largo para evitar una temperatura baja de fusión. 99

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

• Las secuencias con largos corrimientos (es decir más de tres o cuatro) de un nucleótido simple deberían ser evitados. • No debería haber complementariedad entre los dos cebadores. La gran mayoría de los cebadores que conforman estos requisitos pueden ser de fácil manejo, aunque no todos los grupos de cebadores son igualmente efectivos aún bajo condiciones óptimas. Existen varias aplicaciones donde es necesario el uso de cebadores degenerados. Un cebador degenerado es realmente una mezcla de cebadores, todos de similar secuencia pero con variaciones en una o más posiciones. Una circunstancia común que requiere el uso de cebadores degenerados es cuando las secuencias de cebadores han sido predichas de secuencias de aminoácidos. Los cebadores degenerados también pueden ser empleados para buscar miembros "novel" de una familia conocida de genes. Cuando se diseña un cebador degenerado sobre la base de una secuencia de aminoácidos, se debe considerar la degeneración del código genético. Una degeneración de 128 veces en cada cebador puede tener éxito al amplificar una copia diana simple del genoma humano. Bajo tales circunstancias, la concentración de cualquier secuencia individual del cebador es muy baja, así que la incorporación equivocada entre los cebadores y la plantilla deberá ocurrir bajo las condiciones de unión seleccionadas. Ya que la incorporación equivocada del nucleótido terminal 3' del cebador puede prevenir una extensión eficiente, debe evitarse la degeneración en esta posición. La optimización empírica de las condiciones de la reacción de PCR es especialmente importante cuando se emplean cebadores degenerados. Se pone atención particular en la temperatura de unión. Es también deseable emplear un protocolo que empiece con una temperatura alta, lo cual significa que la polimerasa de ADN se añade después del primer paso de desnaturalización a alta temperatura, la adición toma lugar a una temperatura de o cerca de la temperatura de unión y antes del paso de unión del primer ciclo. El empezar con una temperatura alta elimina el problema que sucedería si la polimerasa de ADN fuera añadida para completar el contenido de la mezcla de la reacción de PCR a una temperatura relativamente baja. A una baja temperatura, debajo de la temperatura de hibridación deseada para el cebador (típicamente en la región 45-60°C), se formarán cebadores de incorporación equivocada y éstos pudieran ser extendidos, de alguna manera, por la polimerasa. Una vez extendidos, la incorporación equivocada de los cebadores se estabiliza en la posición inespecífica. Habiéndose incorporado dentro del ADN extendido durante el primer ciclo, el cebador se unirá eficientemente en los ciclos subsecuentes, y por lo tanto puede causar la amplificación de productos falsos de ADN (Kunkel y Eckert, 1989; Saiki, 1989; Taylor, 1993)". 100

MARIO A. RODRÍGUEZ-PÉREZ

"La sensibilidad del ensayo de PCR es muy alta pero presenta algunos inconvenientes, como son que no es una técnica cuantitativa y una relativamente alta probabilidad de obtener falsos positivos por contaminación. Para solventar este último problema se ha de optimizar la secuencia de los cebadores, así como la temperatura precisa para que estos se unan al ADN en la localización correcta y realizar una adecuada manipulación de los reactivos. Por otra parte, para solventar el problema de la cuantificación se han generado ciertas variaciones sobre el esquema inicial de la PCR, dando lugar a lo que se conoce como PCR cuantitativa. La clave en el ensayo de la PCR cuantitativa es la posibilidad de detectar en tiempo real la amplificación de nuestro gen de interés. Para llevar a cabo esta detección existen varios métodos pero casi todos basados en la utilización de otro fragmento de ADN (sonda) complementario a una parte intermedia del ADN que queremos amplificar. Esta sonda lleva adherida una molécula fluorescente y otra molécula que inhibe esta fluorescencia ('quencher'), de tal forma que sólo cuando la sonda es desplazada de su sitio por acción de la ADN polimerasa, la molécula fluorescente se libera de la acción del 'quencher' y emite fluorescencia al ser iluminada con/por un rayo láser. La cuantificación de la fluorescencia emitida durante cada ciclo de la PCR será proporcional a la cantidad de ADN que se está amplificando. En general para que sea válida esta técnica, se requiere realizar en paralelo una curva patrón bajo las mismas condiciones para conocer la cantidad total de ADN que se está amplificando (García-Castro y Vicente-Martín, 2002-2006)". Como ya se mencionó, "la técnica de la PCR es un proceso automatizado que se lleva a cabo en una máquina especialmente diseñada para ello. Actualmente, una máquina de PCR puede llevar a cabo 25 ciclos y amplificar el ADN 105 veces en tan sólo 57 min. Durante un ciclo típico, el ADN es desnaturalizado a 94°C durante 15 s, a continuación se unen y extienden los cebadores (fases 2 y 3) a 68°C durante 60 s. La tecnología de la PCR está experimentando mejoras constantes. Por ejemplo, ahora es posible utilizar, de manera eficiente, el ARN en los procedimientos de PCR. La ADN polimerasa rTt/i transcribe el ARN a ADN y a continuación amplifica el ADN. ES posible estudiar el ARN celular y los virus de ARN incluso en los casos en los que el ARN está presente en muy pequeñas cantidades (puede transcribirse y amplificarse la reducida cifra de 100 copias). Con la PCR también es posible cuantificar los productos de ADN sin utilizar isótopos. Esto permite encontrar la cantidad inicial de ADN diana en menos de una hora utilizando un equipo automatizado. La PCR cuantitativa es de gran utilidad en virología y en estudios de expresión génica. El ensayo de la PCR se basa en la catálisis de ADN por la polimerasa de ADN duplicando el ADN diana en cada ciclo. Los sistemas alternativos de amplificación pueden estar fundamentados en la habilidad de la polimerasa de ARN para generar transcritos múltiples a partir de una plantilla de ADN. Dado que la amplificación inherente en la 101

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

transcripción es mucho más del doble, se requieren menos ciclos de amplificación. Este sistema involucra el uso del fago de polimerasa T7 ARN durante el proceso de amplificación de transcripción y, una transcriptasa de reversa para regenerar la plantilla de ADN y su subsiguiente amplificación. Como se ha mencionado, el ADN diana que se va a amplificar suele tener una longitud inferior a los 5 mil pb. Se ha desarrollado una técnica de 'PCR larga', que es capaz de amplificar secuencias de hasta 42 kb de longitud. La técnica de la PCR es una herramienta muy valiosa en varias áreas de la biología molecular, en medicina y en biotecnología. La PCR puede utilizarse en la amplificación de cantidades muy pequeñas de ADN específico y generar productos de PCR en cantidad suficiente para realizar un análisis de secuenciación o para clonar el fragmento, con precisión, mediante técnicas estándar (Barnes, 1994; Cheng y otros, 1994; Rodríguez-Sánchez y Barrera-Saldaña, 2004)". "¿Pero cuándo se debe utilizar la PCR y cuándo la clonación? Un fragmento de ADN se une, por ligamiento, a un vector de clonación que se replica dentro de una célula hospedera como la bacteria E. coli. Se obtiene un gran número de moléculas recombinantes para su análisis. Esto conlleva un período de tiempo mayor que el PCR. En el caso de pruebas genéticas de rutina y pruebas de diagnóstico molecular de patógenos, el PCR puede reemplazar la clonación, pero no en los estudios de nuevos genes y enfermedades genéticas. El PCR, es por lo tanto, una técnica complementaria. Con PCR se amplifica una fragmento de ADN blanco y posteriormente éste se clona para análisis (McPherson y Moller, 2000)".

Aplicaciones del ensayo de PCR "La aplicación de la PCR, en sí misma, ha ocasionado un avance revolucionario en la investigación biológica moderna. Uno de los más espectaculares ejemplos que ilustran la potencia de esta técnica es el rescate y secuenciación de ADN prehistórico (realidad que sustenta la historia de ciencia ficción Parque Jurásico, de Michael Crichton). Así, el impacto del ensayo de la PCR en biología molecular ha sido muy significativo. La reacción se lleva a cabo fácilmente lo que permite la amplificación de secuencias específicas de ADN por un factor enorme. A partir de un principio básico simple, muchas variaciones de la técnica, con sus respectivas aplicaciones, han sido desarrolladas a través de la tecnología del gen. De forma importante, el PCR ha revolucionado el diagnóstico pre-natal permitiendo que los ensayos usen pequeñas muestras de tejido fetal. En las ciencias forenses, los procedimientos basados en PCR con gran sensibilidad han sido explotados para diseñar los ensayos de perfiles de ADN; después de la publicidad de Jurassic Park, casi todo mundo sabe de la aplicación potencial del PCR en paleontología y arqueología. El ensayo 102

MARIO A. RODRÍGUEZ-PÉREZ

de la PCR se utilizó de forma extensa en la elaboración de mapas del proyecto Genoma Humano. Igualmente, se han desarrollado pruebas de diagnóstico basadas en la PCR para el sida, la enfermedad de Lyme, las infecciones por Chlamydia, la tuberculosis, la hepatitis, la oncocercosis, las infecciones por el virus del papiloma humano y por otros patógenos. Las pruebas de la PCR son rápidas, sensibles y específicas por lo que ha suplementado las pruebas de diagnóstico clásicas. Por ejemplo, la manera clásica de diagnosticar enfermedades infecciosas, y en particular las causadas por virus, consiste en detectar los anticuerpos que el paciente produce contra el virus. Si hay anticuerpos circulantes se conoce que existe o hubo infección, pero no se puede distinguir entre las dos posibilidades. Puede que el paciente ya se haya curado del virus pero que aún presente anticuerpos en sangre. En cambio, la detección directa de un segmento específico del genoma del patógeno mediante PCR permite saber con certeza si hay o no infección en el momento del análisis. Esto cobra importancia en el diagnóstico de sida en recién nacidos de madres seropositivas. En tales casos, la detección de anticuerpos no es útil para el diagnóstico porque los bebés, infectados o no, presentan anticuerpos contra el virus HIV en su sangre provenientes de la madre a través de la placenta. La PCR es muy útil en la detección de enfermedades genéticas tales como la anemia falciforme y la fenilcetonuria. Por lo mismo, la PCR ha facilitado enormemente el diagnóstico de estas enfermedades hereditarias así como de otras como la talasemia, hemofilia, distrofia muscular de Duchenne, fibrosis quística, poliquistosis renal, retardo mental asociado a fragilidad del cromosoma X, corea de Huntington, enfermedades de Sandhoff y de Gaucher constituyen otros ejemplos notorios. Los genes responsables de estas enfermedades han sido aislados y caracterizados recientemente y ya se encuentran disponibles pruebas diagnósticas seguras. En algunos casos las mismas pueden ser aplicadas para identificar dentro de una familia a los portadores, es decir, individuos que transmiten la enfermedad pero que no la padecen, los sanos y los afectados. Pueden ser utilizadas para el diagnóstico prenatal, mediante el análisis del ADN de una biopsia del feto, o para el diagnóstico pre-sintomático, sobre todo en casos como los de la corea de Huntington o la poliquistosis renal donde los síntomas aparecen tardíamente. En enfermedades oncológicas pueden detectarse por PCR mutaciones de oncogenes. Los oncogenes son genes presentes en todas las células del organismo, cuyos productos cumplen funciones importantes para el funcionamiento normal de la célula. Las alteraciones (mutaciones) de estos oncogenes contribuyen a la generación de tumores y, en algunos casos, el saber cuál es el oncogen mutado permite diagnosticar prematuramente cánceres de naturaleza hereditaria o establecer pronósticos. Se han implementado métodos por PCR para la evaluación del riesgo de padecer trastornos auto-inmunes tales como diabetes dependiente de insulina, enfermedad celíaca y esclerosis múltiple. En estos casos se analizan los genes de los llamados 103

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

"antígenos" de histocompatibilidad o HLA, los cuales codifican para una serie de proteínas de la membrana celular que participan en la iniciación de la respuesta inmune. Si bien estos genes no son los responsables directos de las enfermedades auto-inmunes, existe una correlación comprobada entre la presencia de ciertas variantes de los genes HLA y el riesgo de padecerlas. La PCR también se utiliza en la determinación de identidad y lazos biológicos. La información genética nuclear proviene en iguales proporciones de la madre y del padre. Cada gen o región inter-génica puede presentar múltiples variantes (por ej. a, b, c, d) en los distintos individuos de la población. Pero lo importante es que cada individuo lleva en sus células sólo dos de esas variantes. Así, para un gen dado, habrá individuos aa, ab, ac, ad, bb, be, bd, ce y cd, sabiendo con certeza que en cada uno de ellos, una de las variantes proviene del padre y la otra de la madre. Si se analizan los pares de variantes de distintos genes de una persona se observará un patrón característico y exclusivo, al que llamamos "huella" del ADN, y que constituye la base genética de su identidad. La PCR y otras técnicas de análisis del ADN permiten determinar cuál es la "huella" genética de cada individuo mediante un análisis de sangre realizable en laboratorios públicos como privados. Al comparar "huellas" de distintos individuos pueden confirmarse o descartarse lazos de parentesco entre los mismos, con un altísimo grado de certeza. Esta es sin duda la ventaja más importante de la utilización del análisis del ADN para la determinación de paternidad, respecto de los métodos clásicos, como la tipificación de grupos sanguíneos o los marcadores de histocompatibilidad (HLA). Si en los métodos tradicionales puede llegarse a estimar inclusión con una certidumbre que oscila entre el 90 y 98%, en el análisis del ADN, usualmente se manejan estimaciones que tienen un grado de confiabilidad mayor del 99.999%. Esta poderosa metodología ha permitido resolver muchos casos de identidad tanto a partir de individuos vivos como de muestras forenses (el análisis puede hacerse con muestras de raíz de pelo, semen, sangre seca, restos humanos no identificados provenientes de incendios, explosiones, huesos u otros restos exhumados). Los modernos métodos de filiación han sido muy útiles para los organismos de Derechos Humanos y en particular en la identificación de personas desaparecidos. En estos casos, al faltar los padres, el método de elección para establecer lazo biológico con los abuelos es el estudio del ADN de las mitocondrias. Estas provienen evolutivamente de las bacterias y en consecuencia conservan su propio ADN, el cual se hereda por vía exclusivamente materna. Esto es así debido a que en la fecundación, el espermatozoide inyecta únicamente su núcleo en el óvulo, de manera tal que las mitocondrias del nuevo individuo provendrán mayormente de aquellas que ya se encontraban presentes en el óvulo materno. A diferencia del análisis del ADN nuclear, donde el grado de certeza en el establecimiento del lazo biológico disminuye al alejarse el parentesco, el análisis del ADN mitocondrial permite asignar con el mismo y alto grado de 104

MARIO A. RODRÍGUEZ-PÉREZ

certeza, lazos con la madre u otros familiares por vía materna (abuela materna, tíos maternos, tíos abuelos maternos). Así la técnica de PCR ha teniendo un fuerte impacto en el campo de medicina forense, campo en el que se está utilizando en investigación criminal como parte de la tecnología de la "huella" del ADN. ES posible excluir o incriminar a individuos sospechosos utilizando muestras extremadamente pequeñas de material biológico descubierto en la escena de un crimen (Kornblihtt, 2000)".

Limitantes del ensayo de la PCR "Uno de los problemas más evidentes que presenta esta técnica, sobre todo cuando se le utiliza como herramienta de diagnóstico, es la posible generación de resultados falsos positivos. Podría llegar a indicar, por ejemplo, la presencia de secuencias virales en personas no infectadas. Esto es consecuencia de la extrema sensibilidad del método. Los falsos positivos pueden generarse por contaminación de una muestra a partir de una única molécula de ADN proveniente de otra muestra. Esta molécula será amplificada en la PCR y aparecerá como una banda en el caso de electroforesis en gel o como una respuesta positiva en una hibridación con una sonda de ADN radiactiva. La causa más frecuente de falsos positivos es el 'arrastre' de secuencias de ADN amplificadas en reacciones previas. Tales secuencias pueden estar presentes en los equipos de laboratorio y en los reactivos, pudiendo esparcirse por medio de aerosoles. Frente a esto, los expertos recomiendan la realización de controles negativos múltiples (reacciones de amplificación con todos los reactivos, excepto el ADN molde), además del uso de técnicas de esterilidad y de micropipetas que eviten la generación de aerosoles como precaución para prevenir la contaminación de las muestras.

Problemas de contaminación El ADN contaminante puede estar sobre la superficie de la mesa de trabajo del laboratorio, equipo del laboratorio, pipetas, partículas del aire tales como microbios, pelillos, piel, soluciones contaminadas, etc. La contaminación más común se presenta en el ADN molde original; moléculas de ADN clonadas que portan el gen blanco, moléculas de PCR previamente amplificadas (carry over). ¿Cómo evitar contaminación? Mediante el diseño de un área exclusiva, el uso de pipetas, puntillas, soluciones (alícuotas), reactivos de alta calidad y de agua ultrapura pasada por autocable, aceite mineral, cambio de guantes, etc. (McPherson y M0ller, 2000)". Para mayores detalles de cómo evitar contaminación ver la sección de reglas para evitar contaminación con los productos de PCR y plásmidos (véase Figura 1). 105

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

Optimización del ensayo de la PCR "Mispriming. El problema de 'dos agujas en un pajar' que experimentan los cebadores para encontrar el sitio correcto no es gran problema durante los ciclos iniciales del PCR. Por lo contrario, existe un gran número de cebadores que están buscando su secuencia complementaria. Algunos de estos cebadores pueden encontrar sitios alternativos sobre un molde que es parcialmente complementario y se unen por un buen tiempo, quizás tiempo suficiente para que la polimerasa interactúe e inicie la síntesis de ADN. ¿Cómo evitar esto? Los cebadores se deben diseñar cuidadosamente de acuerdo a ciertas reglas como las descritas anteriormente. Las condiciones de alineamiento deberán de seleccionarse a una temperatura lo más alta posible así que sólo secuencias complementarias perfectas puedan formar moléculas dúplex estables. Se ha desarrollado una gran variedad de técnicas para mejorar la especificidad del alineamiento de los cebadores. Estas incluyen el uso de 'aditivos' (tales como formamida, dimetilsulfoxido, cloruro de trimetilamonio, detergentes como Tween 20, glicol de polietileno, glicerol, etc.) o mediante ciertos procedimientos como el denominado 'hot start', 'touchdwori, 'nested', 'booster', o mediante el número de ciclos y longitud de los ciclos, el tipo de termociclador en uso, etcétera (McPherson y Moller, 2000)".

Reactivos e instrumentación de la PCR Reactivos Tampones del ensayo de la PCR a) Tris-HCl. Es un tampón o amortiguador bipolar. El pH del tampón Tris varía con la temperatura, así durante el PCR el pH variará entre 6 y 8.3. La ADN polimerasa tiene su máxima fidelidad en el pH más bajo que ocurre en la temperatura más alta. Se recomienda también el uso de Bis-Tris propano y Pipes como tampones y así mejorar la fidelidad (tasa de error) del PCR. b) KC1. Asiste en el alineamiento del cebador y el molde. Una concentración elevada de KC1 puede ocasionar productos anómalos (estabiliza el mispriming). c) Magnesio. Es el componente más crítico. Su concentración puede afectar la especificidad y eficiencia de la reacción. La ADN polimerasa depende de la presencia de iones Mg y muestra su máxima actividad entre una concentración de 1.2 y 1.3 mM de iones de Mg libres. También, afecta la tasa de error (fidelidad) de la ADN polimerasa. Se recomienda optimizar el PCR con Mg. 106

MARIO A. RODRÍGUEZ-PÉREZ

Nucleótidos Soluciones de CINTPS (100 a 300 mM) se almacenan a -70°C y se hacen soluciones de 50 a 200 mM de cada dNTP en agua estéril doble destilada. Es importante que los dNTPs estén en concentración equimolar, de otra manera, se puede afectar la fidelidad del PCR. La concentración de dNTPs debe estar entre 50-200 μM, si la con­ centración es más alta se altera la fidelidad y si es más baja se afecta la eficiencia del PCR.

Iniciadores (oligonucleótidos) Entre otros puntos (como ya se mencionó anteriormente): 1. Que sea entre 20-30 nucleótidos de largo; esto confiere buena especificidad para un secuencia blanco única; aún en moldes complejos como ADN genómico humano. 2. Que contenga aproximadamente un número igual de cada nucléotido. 3. Evitar secuencias repetidas o regiones que contengan franjas del mismo nucléotido ya que esto puede dar que el cebador se "derrape" sobre el molde. 4. Que no contenga secuencias en la región 3' terminal que permita un autoapareamiento o a otro cebador que pudiera estar acoplado con el PCR; de otra manera, se pueden formar cebadores-dímeros. ADN polimerasa Existen dos clases de ADN polimerasas de acuerdo al molde que copian: ADN polimerasa dependiente de ADN y ADN polimerasa dependiente de ARN (transcriptasa reversa). La ADN polimerasa siempre cataliza la síntesis del ADN en la dirección 5' a 3'. Algunas polimerasas de ADN también tienen actividad exonucleasa, es decir de 3' a 5' llamada "edición" que checa que la base correcta ha sido añadida a la tira de ADN en crecimiento. La ADN polimerasa termoestable de T. aquaticus tiene una temperatura óptima en la síntesis de ADN entre 72 y 75°C. Moldes de ácidos nucleicos Los moldes pueden ser derivados de ADN genómico, mARN, CADN, bibliotecas genómicas, plásmidos, fagos, cósmidos, poly(A) ARNS, clonas BAC (cromosoma bacteriano^ YAC (cromosoma de levadura). Se requiere optimizar la cantidad de molde 107

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

a usar, pero por lo general se utiliza menos de 1 nanogramo de molde clonado y hasta un microgramo de ADN genómico. El PCR funcionará mejor si se utiliza un ADN muy puro y limpio. Sin embargo, debido al poder de PCR aún con tejidos crudos que simplemente han sido Usados, por ejemplo, mediante ebullición, puede producir productos de PCR. Sin embargo, en otros casos no puede haber amplificación, particularmente en aquellas fuentes de ADN que contienen polisacáridos. El ADN aislado puede contener contaminantes que inhiben la acción de la ADN polimerasa. Se puede evitar esto manejando diversas diluciones del ADN genómico o mediante varias purificaciones.

Cantidad de molde de ADN requerido Una cantidad razonable inicial de ADN es de 3 xlO5, así se debería de contar con: • 1 μg de ADN genómico humano. • 10 ng de ADN genómico de levadura. • 1 ng de ADN genómico de E. coli. • 1-2 pg de plásmido o M13 ADN. • 20 pg de bacteriófago lamda de ADN.

Aceite mineral Es una barrera que previene la evaporación termal (McPherson y Maller, 2000).

Modalidades del ensayo de la PCR • PCR clásica para la amplificación de un fragmento cuya secuencia es conocida. • RT-PCR, amplificación de un gen cuyo material de partida es ADN de hebra simple o ARN (estabilización como CADN). • PCR "in house", amplificación para fragmentos de ADN o ARN muy inestables. • PCR multiplex, amplificación con un número variable de cebadores (más de cuatro iniciadores). • Nested PCR: PCR de anidación para reducir productos indeseados. • HHot Start PCR: para Tm bajas, evita formación de dímeros. • PCR en tiempo real, utiliza principalmente cebadores marcados, se realiza en sistema capilar y permite ver resultados en aproximadamente 20 min. Su importancia radica en el ahorro de tiempo y en la visualización de la cinética de reacción (McPherson y Mol ler, 2000). 108

MARIO A. RODRÍGUEZ-PÉREZ

Futuro del ensayo de la PCR "La PCR se ha sumado a la lista de desarrollos tecnológicos originados en el ámbito industrial que provocaron cambios cualitativos en las ciencias básicas. Uno de los proyectos más ambiciosos de la biología moderna fue la determinación de la secuencia completa del genoma humano. Esto permitió no sólo identificar los genes responsables de numerosas enfermedades hereditarias y trastornos metabólicos, sino el descubrimiento de nuevos genes y sus funciones celulares relacionadas. Un paso indispensable para concretar dicho objetivo consistió en realizar un "mapeo" del genoma, es decir, una especie de carta geográfica que permitió ubicar los genes con cierta precisión a lo largo de los cromosomas. La PCR se reveló como una de las técnicas de apoyo fundamental en tal empresa. En otro orden, el uso de la PCR puede llegar a cambiar aspectos de la vida del hombre tales como la planificación del sexo de los hijos. Ya se ha utilizado PCR para determinación prenatal del sexo después de fertilización in vitro. Con la ayuda de un micromanipulador es posible remover una única célula de un embrión de 10 células, sin afectar el normal desarrollo de las restantes. A partir del ADN de la célula aislada, y en menos de 24 h, una PCR de 60 ciclos, realizada con cebadores que reconocen secuencias exclusivas del cromosoma (ausente en las mujeres) permite diagnosticar el sexo del embrión, para luego implantarlo en la madre. Este procedimiento ha sido utilizado clínicamente para familias con riesgo de padecer enfermedades hereditarias que se manifiestan casi exclusivamente en los varones, con el fin de seleccionar embriones hembra para la implantación. La extensión de este procedimiento a familias sin antecedentes de enfermedades hereditarias, con el simple objetivo de "elegir" el sexo del niño, es sin duda una cuestión ética sumamente polémica. A través de las ciencias básicas, el uso de la PCR se ha diversificado y han surgido variantes del diseño original cuya descripción excede los propósitos de este capítulo. Quizá la prueba más contundente de la trascendencia del invento y de su futura expansión sea la venta de su patente por aproximadamente 300 millones de dólares a la poderosa multinacional Hoffmann-La Roche (Satz y Kornblihtt, 1993)".

Aplicación del ensayo de la PCR en el Laboratorio de Biomedicina Molecular del Centro de Biotecnología Genómica La PCR-ELISA para la detección de infección por Onchocerca volvulus en Simulium ochraceum sensu lato La rápida y correcta identificación de larvas en desarrollo de O. volvulus en las poblaciones del insecto vector, S. ochraceum s.l., es de gran relevancia en la 109

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

evaluación del impacto del programa para la eliminación de la oncocercosis en México (así como en todos los países afectados a nivel mundial). El método tradicional de disección al microscopio de estos insectos presentó diversas desventajas: la disección se tuvo que realizar con ejemplares recién recolectados en campo, esto consumió mucho tiempo y esfuerzo de técnicos altamente especializados. La identificación morfo-métrica de las larvas de O. volvulus en desarrollo fue imprecisa en lugares donde co-existen otras especies de Onchocerca. Con la técnica tradicional era impensable querer establecer un sistema de monitoreo de la transmisión en varias o todas las comunidades endémicas que están protegidas con el fármaco Mectizán (ó ivermectina). Actualmente, esto es posible con el uso de la PCR. Para esto, se desarrolló un método de extracción y purificación de ADN del parásito en lotes de S. ochraceum s.l. y se optimizó un sistema de detección específica del parásito O. volulus con el uso de sondas de ADN marcadas con fluoresceína (molécula no radioactiva) y el ensayo inmunoenzimático (ELISA). Ahora es posible procesar un gran número de estos insectos (>100 mil) en relativamente poco tiempo (un par de meses), lo cual ha sido de gran utilidad en la estimación de parámetros entomológicos de la transmisión del parásito en los tres focos endémicos de México (Rodríguez-Pérez y otros, 2004, 2006, 2008a, b). El ensayo de PCR-ELISA es una técnica universal que puede ser aplicada en situaciones donde se requiera obtener un diagnóstico molecular de infecciones producidas por patógenos, en la cual se utilizan cebadores para la amplificación de una secuencia del genoma (por PCR) y sondas de ADN para una identificación específica mediante ELISA (Nutman y otros, 1994). El protocolo, ya establecido en el laboratorio, permite el proceso, eficiente y rápido, de un gran número de muestras biológicas. A continuación, presentamos el protocolo que utilizamos para el diagnóstico molecular de la infección producida por O. volvulus en la especie de Simulium ochraceum s.l. El protocolo puede ser adaptado para la detección de infecciones producidas por otros parásitos o patógenos. Si se requieren mayores detalles del protocolo por favor solicítelo al Dr. Mario Rodríguez: [email protected]

Procesamiento de insectos de S. ochraceum s.l. Los insectos, conservados en isopropanol a temperatura ambiente, se separan por especie en el laboratorio y los pocos individuos S. ochraceum s.l. que se encuentren con sangre en el estómago, son desechados. 1. Los ejemplares de S. ochraceum s.l. se dividen en alícuotas de 50 ejemplares cada una, el isopropanol se elimina, se lavan tres veces en etanol al 95% y se dejan secar. 110

MARIO A. RODRÍGUEZ-PÉREZ

2. Los insectos secos son transferidos a un tubo para criopreservación de 2 mL. En un tubo de plástico Falcón de 50 mL se introducen a presión cinco de los tubos para criopreservación y se colocan en nitrógeno líquido por 30 min luego de lo cual, el tubo se abre para liberar la presión ejercida por la baja temperatura. 3. Los tubos se agitan, de manera vigorosa y, se golpean sobre un cojinete de computadora o contra una superficie de cemento para separar las cabezas de los cuerpos. Las cabezas se separan de los cuerpos mediante su paso por un tamiz de 0.25 mm. Las cabezas y cuerpos aislados son separados en tubos de microcentrifugación de 1.5 mL y procesados de manera independiente. Purificación de ADN 1. Los grupos de cabezas y cuerpos de los insectos son macerados de manera independiente y se obtiene una solución homogenizada con el uso de los siguientes químicos: 100 mM NaCl, 10 mM Tris-HCl pH 8.0,1 mM EDTA, 0.1% SDS, 100 μg/mL de proteinasa K y 3 μg mL"1 de ADN de esperma de salmón. 2. Para digerir las proteínas con la proteasa en el homogenizado, éste se incuba a 55°C por una hora. El homogenizado es incubado a 100°C por 30 min en presencia de lOmM DTT para romper la cutícula del parásito, seguido de una serie de pasos de congelamiento y deshielo para liberar el ADN del parásito. 3. Se realiza la extracción de ADN de los tejidos de los simúlidos y del ADN del parásito con fenol-cloroformo (1/1 v/v) en dos ocasiones, seguida de una extracción con cloroformo. 4. La capa acuosa de la extracción final se transfiere a un pozo de una placa de microtitulación (Immulon 2 de fondo redondo de Dynex, Chantilly, VA). En esta placa se realiza la purificación del ADN con una solución de yoduro de sodio (Nal) y dos rondas de absorción del ADN con perlas de vidrio (Rodríguez-Pérez y otros, 1999) en grupos de 20 muestras (de 50 insectos por cada muestra). 5. En paralelo al ensayo de cada grupo de muestras, se realizan dos "falsas" extracciones de ADN (es decir, se lleva a cabo el proceso de extracción pero sin contener los insectos) que sirven como control negativo interno. 6. El ADN se diluye en la paca de microtitulación de 96 pozos en una solución final de 50 μL conteniendo 10 mM Tris-HCl pH 8 y 1 mM EDTA y es almace­ nada a -80°C. Actualmente, trabajamos con un protocolo de purificación de ADN mejorado y, además, hemos innovado el proceso con el uso de partículas paramagnéticas. 111

CAPÍTULO IV. REACCIÓN EN CADENA DE LA POLIMERASA (PCR)

Amplificación por PCR Las reacciones de amplificación de ADN por PCR se llevan a cabo en grupos de 84 muestras, en las hileras B-H de una placa de microtitulación. 1. En la amplificación se utiliza como molde para la reacción de PCR, 2.5 μL del preparado de ADN purificado dentro de un volumen total de 50 μL que contiene una concentración final de 0.5 μM del cebador O-150 (5' GATTYTTCCGRCGAANARCGC 3') y 0.5 μM del cebador O-150 (5' B-GCNRTRTAAATNTGNAAATTC 3', donde N = A, G, C o T; Y = C o T; R = A o G), marcado con biotina para etiquetar el producto de PCR resultante. 2. Las condiciones del ensayo de PCR son las siguientes: 1) la concentración de solutos en la mezcla de PCR consiste en 60 mM Tris HC1 pH 9.0, 15 mM (NH4)2S04, 2 mM MgCl2, 0.2 mM para cada nucleótido dATP, dcTP, dGTP y dTTP y 2.5 unidades de polimerasa Taq (Roche Diagnostics, Indianápolis, USA); y, 2) cada reacción de PCR consiste de 5 ciclos de 1 min a 94°C, 2 min a 37°C y 30 s a 72°C, seguido por 35 ciclos de amplificación de 30 s a 94°C, 30 s a 37°C y 30 s a 72°C. La reacción se completa con una incubación a 72°C por 6 min. 3. La hilera A de la placa de microtitulación es reservada para colocar 10 controles negativos y dos controles positivos. En uno de los controles positivos del PCR se coloca la cantidad mínima de ADN del parásito (ADN del pOVS134 purificado) que es detectada de manera consistente de acuerdo a la condición de amplificación en un ensayo de microtitulación. Este control positivo nos asegura que todas las reacciones en los grupos ensayados están operando en el pico de mayor eficiencia. El segundo control contiene la misma cantidad mínima de ADN del parásito mezclado con 2.5 μl de un preparado de una muestra que resulte ser negativa en un ensayo anterior. Con esto controlamos la posibilidad de la presencia de inhibidores de la PCR y, por tanto, de resulta­ dos falso negativos.

Detección de productos de PCR por inmunoensayo (ELISA) y su interpretación El procedimiento de ELISA para detectar productos de PCR O-150 ha sido descrito por Nutran y otros (1994), Unnasch y Meredith (1996) y Rodríguez-Pérez y otros (2004, 2006, 2008a,b). 112

MARIO A. RODRÍGUEZ-PÉREZ

1. En resumen, 10% de cada producto de PCR (5 μL) se colocan en un pozo de la placa de microtitulación que contiene estrepavidina (1 μg mi/ 1 ) y las tiras del ADN son desnaturalizadas con tratamiento alcalino. 2. Los productos de PCR, etiquetados con biotina, pegados en la placa se unen a una sonda de ADN O oligonucleótido específico para O. volvulus marcada con fluoresceína (OVS2: 5' AATCTCAAAAAACGGGTACATA-FL 3'); la sonda OVS2 con fluoresceína es detectada con anticuerpo anti-fluoresceina conjugado a fosfatasa alcalina (fragmento FA; Roche Diagnostics). 3. La reacción entre la sonda y el anticuerpo se revela usando el estuche de amplificación de sustrato FA de Invitrogen (Carlsbad, CA), siguiendo las instrucciones del fabricante. El desarrollo del color de la reacción se detiene con una solución de ácido sulfúrico (0.3M H2S04) y las placas se colocan en una lectora ELISA a 450 nm. 4. Enseguida se determina la media y desviación estándar de la densidad óptica de los 10 controles negativos. El punto de corte de la ELISA es la media más tres desviaciones estándar, es decir, con P , respectivamente. En el siguiente ejemplo: [WV]-X-A-X (4)-{LI}. El motivo se interpretaría como: [Trp o Val] - cualquiera - Ala - cualquiera cualquiera - cualquiera - cualquiera - {cualquiera menos Leu o He}. Mientras los motivos de secuencia son muy útiles, existen regiones funcionales o estructurales o dominios que no pueden ser detectados mediante el uso de expresiones regulares, debido a su extrema divergencia a nivel de secuencia. La mayoría de las proteínas son lo suficientemente largas para contener más de un dominio. 233

CAPÍTULO VIII. BIOINFORMÁTICA

Particularmente, un dominio estructural corresponde a un segmento de una cadena polipeptídica que puede plegarse en una estructura tridimensional independientemente de la presencia de otras cadenas. La separación de los dominios de una proteína puede interactuar o pueden estar unidos solo por un polipéptido. Una proteína con varios dominios puede utilizarlos para establecer interacciones funcionales con diferentes moléculas. Existen más proteínas que dominios funcionales, debido principalmente a la existencia del mismo dominio en varias proteínas. Ejemplos típicos de dominios funcionales donde solo unas cuantas posiciones en la secuencia son conservadas son: las globinas y los dominios SH2 y SH3. Adicionalmente de los dominios estructurales, existen también los dominios homólogos. Éstos hacen referencia patrón extendido en la secuencia, generalmente determinado mediante alineamientos de secuencias, reflejando un origen evolutivo común entre las secuencias alineadas. Un dominio homólogo es generalmente más largo que un motivo. El uso de técnicas basadas en perfiles permite la detección de tales dominios. Un perfil es una tabla de puntuaciones asignadas a aminoácidos en una posición específica y penalizaciones asociados a deleciones. Estos valores o puntajes se utilizan para calcular puntuaciones de similitud de alineamientos entre un perfil y secuencia o partes de perfil y una secuencia. Es decir, el perfil es deslizado a lo largo de la secuencia problema para localizar las regiones con mejor puntaje mediante la utilización de algoritmo de programación dinámica (ver el apartado de alineamiento de secuencias). Cuando el alineamiento de una secuencia con un perfil da una puntuación por encima de un cierto umbral se considera que dicha secuencia está asociada al perfil. Los perfiles son más sensibles y robustos que las expresiones regulares ya que a partir de los alineamientos se puede obtener una puntuación discriminatoria no solo para los residuos presentes en una posición determinada, sino para aquellos que no aparecen. Los puntajes para los aminoácidos no encontrados se extrapolan de las matrices de puntuación utilizadas (PAM, BLOSUM, etc.). Los perfiles se pueden construir de muchas maneras. Por ejemplo, el algoritmo PSI-BLAST realiza una búsqueda iterativa y va construyendo un perfil que utiliza para subsecuentes búsquedas más refinadas. Este algoritmo es uno de los más poderosos y más utilizados cuando se trata de encontrar homólogos remotos. Por otro lado, si realizamos una búsqueda en PROSITE y la secuencia problema contiene un motivo que aún no ha sido descrito o introducido en esta base de datos, éste no será detectado. Por tal motivo, se han desarrollado otras aproximaciones computacionales que identifican motivos en secuencias que aparentemente no están relacionadas. El método llamado Gibbs sampling y todas sus variantes (como AlinACE) y el programa MEME son ejemplos de programas utilizados con este propósito. De los anteriores, MEME es el más utilizado y según diversos estudios comparativos, es el más robusto. El algoritmo bajo el cual funciona MEME consta de un 234

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

modelo de dos componentes; donde uno de ellos describe el motivo y el otro describe el fondo (otras posiciones en la secuencia diferentes al motivo), MEME cuenta también con una variante llamada mast la cual es capaz de tomar un motivo generado con MEME u otro algoritmo y realizar búsquedas del mismo en un conjunto de secuencias. Además de ser muy utilizado en el descubrimiento de nuevos motivos en secuencias de proteínas, MEME también es ampliamente utilizado para descubrir motivos que corresponden a secuencias de nucleótidos asociadas a mecanismos regulatorios de la transcripción, MEME y mast están disponibles para ser instalados localmente o pueden ser utilizados directamente en su sitio web. Disponible en http://meme.sdsc. edu/meme/intro.html Otra técnica para la construcción de perfiles es mediante los modelos ocultos de Markov (HMM). En esta técnica los datos disponibles de secuencia se intentan ajustar a distribuciones de probabilidad mediante un algoritmo de optimización local. El uso de esta técnica se ha extendido principalmente a que fue implementado en el paquete HMMER; el cual ha sido muy utilizado en la construcción de una de las bases de datos más importantes en el área de los dominios de proteínas, Pfam. La principal ventaja de utilizar HMM para construir perfiles, además del formalismo estadístico, es que éstos pueden ser derivados a partir de secuencias no alineadas. Disponible en http://hmmer.janelia.org

Predicción de la estructura tridimensional de las proteínas Dado que la máxima expresión funcional de la secuencia de una proteína se manifiesta cuando ésta adquiere su estructura nativa, es fundamental contar con métodos capaces de hacer predicciones de su estructura tridimensional a partir de la información contenida en la secuencia. Una de las ideas clave en bioinformática es la noción de homología. Como vimos en la parte de anotación de genomas y genómica comparativa, la homología puede ser utilizada para predecir la función de un gen; si se conoce la función de un gen denominado "A" y su secuencia es homologa a la de un gen "B", del cual se desconoce su función, podemos asumir que "B" presenta una función similar a la de "A". También, en la rama de la bioinformática encargada del análisis y predicción de la estructura tridimensional de las proteínas, la noción de homología es utilizada para determinar qué partes de la proteína son importantes para la formación y mantenimiento de la estructura y de sus propiedades funcionales. Así, si se conoce la estructura tridimensional de una proteína, ella podrá ser utilizada como un molde para modelar la de sus homólogos cuya estructura aún se desconoce. El uso de esta información y recursos es lo que se conoce con el nombre de modelaje por homología. Aunque esta técnica no es única, 235

CAPÍTULO VIII. BIOINFORMÁTICA

actualmente sigue siendo la mejor manera de predecir estructuras de manera confiable. Otro tipo de técnica utilizada para la predicción de la estructura tridimensional de las proteínas es la conocida como hilvanado (del inglés threading); generalmente es utilizada cuando no es posible construir un modelo por homología y sus resultados tienden a ser menos confiables. Básicamente el método busca cómo una determinada secuencia (o segmento) puede encajar en alguna de las estructuras conocidas, basándose en el comportamiento estadístico y del medio ambiente fisicoquímico esperado para esa secuencia dentro de la estructura. Finalmente, existen otros métodos llamados ab-initio. Como su nombre lo dice éstos parten de cero a través de algoritmos complejos y sólo la información de secuencia es tomada en cuenta para la construcción del modelo. Vale la pena mencionar, que independientemente del método utilizado, no existe un modelo bueno o malo, más bien un modelo útil o inútil y ésto depende a su vez de la aplicación del mismo. Los reconocidos investigadores David Baker y Adrej Sali, hicieron una revisión de los diferentes métodos de modelaje y sugirieron una escala donde se relaciona la calidad del modelo con su posible utilidad. A continuación se presenta una adaptación de dicha escala la cual pude servir como guía para aquellos que deseen construir un modelo y predecir su posible utilidad (véase Figura 2). En adelante nos referiremos principalmente al modelaje por homología, ya que es la técnica más confiable, utilizada y para la cual existen diversidad de programas y servidores en internet. En el modelaje por homología, generalmente puede decirse que a mayor porcentaje de identidad entre las secuencias menor diferencia habrá en sus estructuras, aunque ésto no debe considerarse como una regla ya que aún con baja similitud entre dos secuencias (homólogos remotos) es posible hacer la construcción de un modelo, aunque nuevamente su utilidad será reducida. De esta manera, para secuencias con más del 70% de identidad, su estructura diferirá en algunas posiciones de las cadenas laterales y en las llamadas regiones de desorden que están relacionadas con propiedades netamente funcionales. Por ejemplo, estas regiones de desorden participan generando interacciones transitorias entre dos proteínas; dichas interacciones se ha visto que son cruciales para el correcto funcionamiento de vías de señalización y vías metabólicas, etc. Cuando el grado de identidad comienza a ser menor del 50% las estructuras empiezan a diferir en aspectos cada vez más relevantes; por ejemplo, diferencias en las posiciones relativas de distintos dominios estructurales y desviaciones del esqueleto de carbonos alfa. En estos casos o aún cuando el porcentaje de identidad entre secuencias es menor, los errores de los métodos comunes de alineamiento de secuencias se magnifican y no logran reproducir la correspondencia entre secuencia y estructura. Consecuentemente, la obtención de un alineamiento de secuencias de buena calidad, entre la secuencia a modelar y la secuencia molde, se convierte en paso crítico. Éste es el caso de modelos utilizados 236

ALDO SEGURA-CABRERA Y MAURILIO GONZALEZ-PAZ

Figura 2 Fases de la prediccion de la estructura tridimensional de las proteinas. Fuente: Modificado de Baker y Sali, 2001.

en proyectos de diseño de fármacos basado en la estructura proteica, donde se sugiere que el alineamiento se realice con alguno de los programas mencionados en el apartado de alineamiento de secuencias distinto a ClustalW. Una buena opción sería T-Coffee, en su variante 3D-expresso que incorpora información estructural en los alineamientos. 237

CAPÍTULO VIII. BIOINFORMÁTICA

Aunque no existe una guía única para construir un modelo por homología, sí podemos encontrar algunas pautas generales, las cuales se describen a continuación. El primer paso consiste en la búsqueda del molde que será utilizado para la construcción del modelo. Ésto se puede realizar mediante una búsqueda con BLAST con una posterior selección en la base de datos que corresponda al PDB. Se selecciona la o las secuencias (ésto dependerá del programa a utilizar) con mayor similitud y mayor significancia estadística (valor-is). Posteriormente, se construye un alineamiento entre la secuencia problema y la o las secuencias que serán utilizadas como molde. Algunos programas solo utilizan para la construcción del modelo un alineamiento entre la secuencia problema y la secuencia molde, y otros, en su mayoría, utilizan más de una secuencia molde; ésto proporciona un alineamiento que incluye información estructural, haciendo más confiable el modelo resultante. Para el proceso de construcción del modelo, dos son los algoritmos más utilizados, el primero de ellos se basa en la satisfacción espacial de restricciones derivadas del alineamiento entre la secuencia problema y las secuencias molde, este algoritmo es el implementado en el programa Modeller; este programa es muy poderoso y versátil, pero poco amigable con los principiantes. El segundo de los métodos se basa en la construcción de un esqueleto promedio para la proteína a modelar, a partir del alineamiento múltiple previamente descrito. La localización espacial para cuantos átomos sea posible de la secuencia a modelar se deriva de las posiciones de los átomos correspondientes en las coordenadas espaciales de las estructuras de los moldes. Posteriormente, es necesario modelar aquellas regiones desordenadas o con inserciones/deleciones, generalmente correspondientes a las llamadas asas (loops). Actualmente, muchos de los programas incluyen bases de datos de aquellas posiciones preferidas por los aminoácidos en determinada región de proteínas que se conoce su estructura tridimensional (rotameros). Posteriormente, los modelos deben ser sometidos a un proceso de refinamiento con programas de dinámica molecular, los cuales se encargan de optimizar la geometría de los enlaces y eliminar contactos desfavorables. Sin embargo, dicha optimización debe ser mínima, ya que diversos estudios muestran que minimizaciones excesivas no mejoran la calidad del modelo y, por el contrario, podrían generar desviaciones drásticas del modelo con respecto al molde. Por último, se debe determinar la fiabilidad de los modelos. Varias herramientas, también implementadas en forma de servidores web, se han convertido en imprescindibles en el campo de evaluación de la calidad de lbs modelos. Dos de las más famosas son Procheck y Prosa. Procheck calcula una multitud de parámetros referidos a la representatividad estadística de las estructuras modeladas, estereoquímica, principalmente. Disponible en www.biochem.ucl.ac.uk/~roman/procheck/procheck.html. El servidor Prosa, realiza una estimación de la significación estadística de cada aminoácido en su contexto estructural, derivado de las aproximaciones de threading, proponiendo un 238

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

análisis detallado de la posibilidad de cada aminoácido del modelo de estar correctamente predicho. Estos valores deben de compararse con los equivalentes en una estructura de referencia, puesto que habitualmente las proteínas contienen regiones irregulares, por ejemplo centros activos, que aparecen como anómalas en este tipo de análisis. Disponible en https://prosa.services.came.sbg.ac.at/prosa.php Actualmente ya se dispone de varios servidores en Internet capaces de realizar de manera automática un proyecto de modelaje por homología, threading o ab initio. Ejemplos de estos servidores son: SwissModel, NCBI threading y Robetta, de los cuales SwissModel es el que goza de mayor popularidad debido principalmente a su facilidad de uso. Disponible en http://swissmodel.expasy.org/. Adicionalmente cuenta también con una base de datos de modelos generados por él mismo; hasta octubre del 2008 más de tres millones de modelos; también está disponible para ser instalado localmente. La principal desventaja de SwissModel es que no es posible ajustar los parámetros finos para la realización del modelo. Mientras que con Modeller, es posible realizar modelos más complejos con varias estructuras como moldes y alineamientos refinados externamente entre la secuencia problema y las estructuras; sin embargo, con este programa se requiere de alto grado de familiarización para poder explotarlo al máximo. Por último e independientemente del método, servidor o programa utilizado, es importante evaluar la calidad del modelo.

La bioinformática aplicada al diseño de fármacos El descubrimiento de un fármaco se ha hecho tradicionalmente por una combinación de investigación al azar, por error, por la utilización de productos naturales y en las últimas décadas a través del diseño racional. En la práctica, este último acercamiento es generalmente frustrado por una falta de datos experimentales referentes a la estructura y función de los blancos biológicos (mayoritariamente proteínas). Con la terminación del proyecto genoma humano en el 2003 y los avances recientes en proteómica y genómica estructural de muchos microorganismos (principalmente patógenos para el humano), se dispone de una gran cantidad de información referente a la estructura y función de las proteínas, aumentando de manera significativa la cantidad de potenciales blancos farmacológicos. El método dominante para la identificación de potenciales fármacos es el cribado físico de grandes librerías de compuestos químicos (quimiotecas) y los subsecuentes ensayos de actividad contra un blanco biológico; a esta metodología se le conoce con el nombre de cribado de alto rendimiento (HTS, por sus siglas en inglés). Así mismo, con la introducción de la química combinatoria, se ha logrado incrementar el tamaño de las quimiotecas al orden de millones de compuestos. De tal manera que el HTS 239

CAPÍTULO VIII. BIOJNFORMÁTICA

nos permite probar experimentalmente todos los posibles candidatos frente a todos los posibles blancos farmacológicos. Sin embargo, el análisis de grandes quimiotecas sigue siendo un proceso que consume una gran cantidad de tiempo y dinero, con índices significativos de falsos positivos y negativos. Por ejemplo, de cada 10 mil moléculas activas detectadas por un proceso de HTS sólo una llega a alcanzar la categoría de candidato a fármaco y de 10 candidatos a fármacos sólo uno llega al mercado. Las desventajas y poco rendimiento del HTS, en conjunción con los avances en las tecnologías computacionales aplicadas a las ciencias de la vida, abrieron la puerta para la consolidación de una metodología en el descubrimiento y diseño de fármacos. Esta metodología se le conoce con el nombre de cribado virtual intensivo y ha demostrado ser una alternativa que complementa y enriquece a los procesos de HTS. Esta metodología consiste en cribar mediante herramientas computacionales, largas bases de datos que contienen desde miles hasta millones de estructuras (2D y 3D) de compuestos químicos (quimiotecas virtuales), sesgando la selección de sólo aquellas moléculas con características deseables para un fármaco y que pudieran unirse con alta afinidad a una proteína blanco de interés farmacológico. Posteriormente, dichas predicciones deben ser corroboradas experimentalmente en el laboratorio. Generalmente, para construir una quimioteca, es necesario acceder y descargar vía internet una gran cantidad de moléculas orgánicas alojadas en bases de datos. Varias de ellas pertenecen a instituciones gubernamentales y académicas, como por ejemplo la del Instituto Nacional del Cáncer en Estados Unidos de Norteamérica (NCI, por sus siglas en inglés) y la base de datos ZINC, alojada en la Universidad de California en San Francisco; todas ellas son de libre acceso. Por otra parte, también existen otras pertenecientes a compañías privadas, donde algunas son también de libre acceso y por otras hay que pagar la respectiva licencia. Disponible en http://dtp.nci.nih.gov/ docs/3d_database/dis3d.html y http://zinc.docking.org Las estrategias de cribado virtual de manera general se dividen en dos grupos; métodos indirectos basados en la estructura del ligando y métodos directos basados en la estructura proteica (receptor). En los métodos basados en la estructura del ligando, tenemos las búsquedas de similitud con moléculas para las cuales ya ha sido comprobada su actividad biológica, construcción de modelos farmacóforos y análisis de relación estructura-actividad (QSAR). Por otra parte, en los métodos basados en la estructura proteica, el más utilizado es la simulación del acoplamiento proteína-ligando (docking), el cual considera tanto parámetros estructurales como energéticos en dicho acoplamiento. El principal requerimiento de los métodos de cribado virtual es la necesidad de información previa referente a las propiedades estructurales-funcionales del ligando y/o del receptor, según la estrategia utilizada. Por ejemplo para el caso del diseño basado en la estructura del ligando, el espacio químico de los posibles ligandos es tan vasto, que los métodos para poder filtrar, 240

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

analizar y encontrar moléculas biológicamente activas siguen en constante desarrollo. Para el caso del diseño basado en la estructura proteica, la situación con respecto a la carencia de información está cambiando de manera significativa. Con la revolución en la biología molecular, los avances de la genómica estructural y la aplicación de tecnologías de alto rendimiento (High-throughput), se está determinando la relación que existe entre determinados genes y sus respectivos productos proteínicos, traduciéndose en un incremento en el número de estructuras tridimensionales resueltas por cristalografía de rayos X, resonancia magnética nuclear (RMN), modelado por homología y consecuentemente en la cantidad de potenciales blancos farmacológicos. Las metodologías antes mencionadas están proporcionando información invaluable respecto a las interacciones a nivel atómico-molecular entre el ligando y la molécula blanco, que difícilmente serían resueltas mediante técnicas experimentales. Así, el diseño de fármacos basado en la estructura proteica se ha convertido en la aproximación más utilizada en esta área de investigación, debido principalmente a que se fundamenta en las bases moleculares de la enfermedad y en el conocimiento a nivel atómico de la estructura de una macromolécula tal como una enzima; siendo posible encontrar nuevas moléculas que se unan a ella, modulando así su actividad. La ventaja de esta aproximación es que las moléculas candidatas a conformar un fármaco pueden ser seleccionadas a medida para interactuar con el blanco farmacológico. Esta propiedad debería mejorar la eficacia y especificidad de un fármaco. Dichas moléculas, altamente especificas deberían limitar sus interacciones con otros blancos no específicos y por lo tanto reduciendo los efectos secundarios de manera significativa. El conocimiento estructural de las proteínas y sus respectivos ligandos ha ayudado a mejorar la potencia y selectividad farmacológica; resultando en una rápida definición de las propiedades de unión de los fármacos y facilitando la identificación de compuestos "cabeza de serie" durante programas de cribado intensivo. A continuación solo consideramos un aspecto de este campo de estudio del descubrimiento de ligandos basado en la estructura, enfatizando el escaneo de quimiotecas usando la simulación computacional del acoplamiento proteína-ligando (docking). El docking ha sido utilizado en la predicción de nuevos ligandos para blancos moleculares. En dicha metodología, cada una de las moléculas orgánicas que constituyen una larga base de datos es acoplada contra un sitio de unión, típicamente de una proteína. Estas bases de datos están disponibles de instituciones académicas (por ejemplo la base de datos ZINC), de proveedores o colecciones internas de un grupo de investigación. Las moléculas de dichas bases de datos, son acopladas en múltiples conformaciones y orientaciones dentro del sitio de unión y a cada configuración se le asigna un puntaje, que representa su complementariedad al receptor. Los complejos proteína-ligando con mayores puntajes serán almacenados y ordenados de mayor a menor con respecto a los restantes de la base de datos en estudio. De tal manera 241

CAPÍTULO VIII. BIOINFORMÁTICA

que los mejores puntajes estarán en condiciones de ser probados experimentalmente. Existen algunos ejemplos exitosos de las aplicaciones de esta metodología. Así tenemos por ejemplo: 1) el descubrimiento de nuevos y potentes inhibidores de la casein quinasa II (CK2), la cual está relacionada con algunas neoplasias y otras patologías; 2) la identificación de inhibidores de la anhidrasa carbónica humana II; y 3) la identificación de moléculas líder para la trna-guanina transglicosilasa. Existen una amplia variedad de paquetes de cómputo que realizan el docking, para poder utilizar algunos de ellos es necesario pagar la respectiva licencia, mientras que otros son libres de pago para actividades con fines académicos no comerciales. Son ejemplos de paquetes de cómputo que realizan docking: Autodock, Dock, Gold, Flexx, ICM, MOE, eHiTs, etc. Actualmente siguen apareciendo nuevos paquetes para realizar el docking y se continúa de manera constante con el mejoramiento técnico y metodológico de los paquetes bien establecidos. Entre los diferentes cambios y mejoras metodológicas tenemos el adecuado muestreo de las múltiples configuraciones ligando-receptor y la evaluación exacta de su complementariedad. El tratamiento de las conformaciones y flexibilidad en el ligando, prácticamente ha sido incluido en la mayoría de los algoritmos de docking. Por otra parte, a pesar de los avances, el tratamiento de la flexibilidad en el receptor (ajuste inducido) sigue siendo una tarea pendiente para la mayoría de los algoritmos. Finalmente, otro aspecto importante en los paquetes de docking y que es un área activa de investigación, es lo referente a la funciones de puntaje. Estas funciones pueden ser agrupadas de manera general en tres categorías: las basadas en campos de fuerza, las basadas en conocimiento y las empíricas. Las basadas en campos de fuerza usan potenciales similares a los utilizados en mecánica molecular y por lo cual pueden ser vinculadas a metodologías de dinámica molecular e integración termodinámica. Actualmente, estas funciones de puntaje incluyen el efecto del solvente. Por otro lado, tanto las funciones de puntaje basadas en conocimiento y las empíricas se derivan de datos experimentales. Así mismo, han presentado refinamientos, tales como: mejoras en el balance entre interacciones polares y no polares; la consideración del efecto del solvente; y la corrección de los contactos intra-ligandos en las estructuras de las cuales se extrajeron los datos experimentales. En la actualidad no existe un consenso referente a cual función de puntaje es mejor. Es importante resaltar que con las tres aproximaciones se han alcanzado buenos resultados. Por lo tanto, aún con sus desventajas, la técnica de cribado mediante docking es lo suficientemente madura para ser considerada como una metodología de primera elección en el proceso de descubrimiento de fármacos. Uno de los pasos fundamentales para poder llevar a cabo el escaneo virtual es la construcción de una larga quimioteca de ligandos en 3D. Donde las moléculas candidatas a conformar la quimioteca deben satisfacer una serie de filtros que 242

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

aseguren su relevancia bioldgica, respecto a los grupos funcionales que presentan y sus prapiedades fisicoquimicas. Los protocolos de filtrado mas comunmente utilizados son "la regla del cinco" de Lipinski (1997) y sus variantes, los cuales evaluan el potencial de las moleculas candidato para ser activas cuando son administradas por via oral. Tomando en cuenta: el peso molecular (se ha observado una pobre absorcion si el peso molecular es superior a 500); la lipofilicidad mediante el calculo del coeficiente logP (coeficiente de partition octanol-agua, el cual deber ser < 5); los donadores (no mas de 5) y los aceptores (no mas de 10) de puente de hidrogeno. Otros descriptores que han sido incluidos en la preparation y filtrado de quimiotecas, son los relacionados con propiedades tal como la absorcion, distribution, metabolismo, excretion y toxicidad (ADMET), generalmente enfocados a la optimization de la farmacocinetica (lo que el organismo le hace al farmaco). Es importante remarcar que estos filtros no son absolutos, por tal motivo se permite cierta flexibilidad en los margenes principalmente en los descriptores del peso molecular y en el logP, de manera que nos permite trabajar quimiotecas con propiedades fisicoquimicas y biologicas aceptables o al menos consistentes con la mayoria de los farmacos conocidos actualmente; y sobre todo reducir de manera significativa la incertidumbre del proceso.

Perspectivas de la bioinformática Con toda la información disponible, ¿qué desafíos siguen estando vigentes en la bioinformática? La predicción de la estructura, el plegamiento y la función de una proteína a partir solo de su secuencia. Aunque el modelaje comparativo sigue siendo una opción viable para aproximar la función biológica de una secuencia, hay que tener en cuenta el proceso de anotación de la mayoría de secuencias, hoy conocidas, se ha realizado por estudios comparativos y no por experimentación directa. Muchas proteínas juegan distintos roles celulares aún cuando sus funciones en términos bioquímicos sean similares, por lo tanto es necesario desarrollar métodos para discriminar entre ellas. Muchas proteínas presentan varios dominios (multidominios) y consecuentemente son multifuncionales; sin embargo, solo han sido caracterizadas por una función. Seguramente, el análisis comparativo de secuencias y el reconocimiento de secuencias señal en el ADN seguirán siendo cruciales. Es evidente el cambio que están viviendo las ciencias biológicas. La comprensión del papel del genoma a partir de partes aisladas está cambiando hacia una aproximación más integral, más sistémica; esto es lo que ha dado lugar al surgimiento de nuevas aproximaciones para explicar 243

CAPÍTULO VIII. BIOINFORMÁTICA

el funcionamiento de los seres vivos, tal como la llamada biología de sistemas. Así, será posible generar modelos (in vitro e in silicó) que nos ayuden a comprender, por ejemplo, el comportamiento de cómo un gen afectara al de otros, tanto espacialmente como temporalmente. Rápidamente nos estamos moviendo de solo poder medir la variación genética de las poblaciones hasta comprender aquellos genes que podrían estar relacionados con una respuesta particular al ambiente. El enfoque sistémico en bioinformática es quizás el cambio más anticipado de las ciencias biológicas y de mayor impacto. La construcción de mapas dinámicos globales de las interacciones de los productos génicos es una realidad. Estos avances están permitiendo comprender enfermedades complejas como son el cáncer, la diabetes y diseñar mejores esquemas de tratamiento. Concluyendo, los avances en las diversas áreas de la bioinformática prometen revolucionar el entendimiento de los sistemas biológicos y por lo tanto contribuirán a la solución de diversos problemas, que van desde la investigación básica hasta aplicada.

Aplicaciones de la bioinformática en el Centro de Biotecnología Genómica del Instituto Politécnico Nacional Desarrollo de software para el análisis de datos genéticos poblacionales En el Centro de Biotecnología Genómica se desarrolló un programa computacional que lleva a cabo una serie de análisis de datos genéticos poblacionales. El desarrollo del programa se llevó a cabo empleando la metodología de programación orientada a objetos. Las pruebas de robustez y validación de los datos se realizan con las técnicas de remuestreo Bootstrap y Half Jacknife. Para llevar a cabo la estimación de la similitud y distancia entre individuos se emplean los coeficientes Jaccard (1901), Russel y Rao (1940), Ochiai (1957), Ochiai II (1957), apareamiento simple (1958), Phi de Pearson, Rogers y Tanímoto (1960), Sokal y Sneath (1963), Anderberg (1973), Nei y Li (1978), y Gower y Legendre (1986). La estimación de las distancias entre poblaciones se realiza aplicando la distancia genética Euclidiana, así como los métodos UPGMA y Neighbor Joining para construir dendrogramas. Además, se integraron al programa los métodos de Análisis de Componentes Principales y de Coordinados Principales. La estimación de la correlación entre matrices de distancia genéticas fenotipicas y morfológicas se realiza mediante los 244

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

coeficientes de Pearson y Spearman. En la evaluación de la informatividad del marcador se empleó el índice de Diversidad (DI) y el Contenido de Información Polimórfica (PIC). Toda esta biblioteca de métodos finalmente se implementa para darle seguimiento a la investigación de cada laboratorio de este centro en las actividades de tratamiento de información genética. Las actividades que realiza la aplicación consiste en estimar las distancias a partir de un patrón binario establecido (el cual representa la presencia o ausencia de bandas en un marcador molecular); los resultados son expuestos en una matriz binaria que indica la distancia que posee el individuo i con el j. Para poder interpretar esta información de mejor manera, los resultados son transportados a un formato gráfico que puede ser la construcción de un dendrograma o bien su despliegue en un eje de coordenadas de dos o tres dimensiones realizado mediante el análisis de coordenadas principales. La primer técnica consiste en crear una topología de árbol donde los elementos que permanecen en el mismo ciado son los que poseen entre ellos menor distancia genética, contrariamente los nodos más lejanos indican mayor diferencia entre los patrones genéticos. La misma analogía de distancia se aplica cuando se emplea un eje de coordenadas, puntos cercanos indican baja distancia genéticas y puntos lejanos indican lo contrario (veáse Figura 3).

Figura 3. Resultados graficos de las aplicaciones desarrolladas con datos moleculares y su analisis con programas computacionales desarrollados en el CBG-IPN. 245

CAPÍTULO VIII. BIOINFORMÁTICA

Diseño de agentes anti-tuberculosos mediante escaneo virtual intensivo basado en la estructura proteica Mycobacterium tuberculosis, agente causal de la tuberculosis en humanos, sigue representando un serio problema de salud pública, causando más de dos millones de muertes al año en todo el mundo. En nuestro país, más de dos mil personas mueren anualmente a causa de la tuberculosis. No obstante que dicha enfermedad puede ser curada, el tratamiento farmacológico consiste en combinar al menos cuatro fármacos, durante un periodo de entre seis y nueve meses; trayendo como consecuencia un alto grado de incumplimiento. Otros aspectos que dificultan el tratamiento de la enfermedad son la persistencia de las micobacterias y los crecientes casos de resistencia bacteriana. Estos inconvenientes remarcan la necesidad de desarrollar nuevos agentes anti-tuberculosos, que sean activos contra las formas resistentes, contra las formas persistentes y sobre todo que acorten el tiempo del tratamiento. Los recientes avances en genómica funcional y estructural de M. tuberculosis están proporcionando una gran cantidad de información referente a genes que son esenciales para la supervivencia del patógeno, así como también la estructura tridimensional de nuevos blancos farmacológicos. Esta información en conjunción con los avances en el campo de informática aplicada al diseño de fármacos, están generando un efecto sinérgico que posibilitan el desarrollo de fármacos más eficaces y seguros; y mejorando a corto plazo la calidad de vida de las personas afectadas por la enfermedad.

Elección del blanco farmacológico Para la elección del blanco farmacológico se tomaron en cuenta los siguientes aspectos: 1) que la proteína este lo menos relacionada evolutivamente con alguna proteína de humano; 2) la disponibilidad de una estructura tridimensional determinada con alta resolución; y 3) que la proteína elegida cumpla con el requisito de que por cualquier metodología experimental se haya demostrado que es esencial para el crecimiento y/o supervivencia de la bacteria. Con este propósito, se realizo una búsqueda en la base de datos Protein Data Bank (PDB) y en el sistema de búsqueda PubMed, mediante la utilización de las palabras clave "Mycobacterium tuberculosis", "drug design", "drug target". El resultado de esta etapa, fue la selección de la enzima Shikimato Kinasa como blanco farmacológico. 246

ALDO SEGURA-CABRERA Y MAURILIO GONZALEZ-PAZ

Construction de la quimiotecay escaneo mediante del acoplamiento proteina-ligando ("docking")

la simulation

Las moleculas de los ligandos que constituyen la quimioteca virtual en estudio fueron obtenidas via Internet del sistema FAF-Drugs. Disponible http://bioserv.rpbs. jussieu.fr/Help/FAFDrugs.html. El resultado fue un total de 214 492.00 ligandos con propiedades fisicoquimicas y funcionales favorables para un candidato a farmaco. En la tabla numero tres se enlistan las propiedades moleculares y sus valores asociados calculados, los cuales fueron utilizados como filtros en la construction de la quimioteca. Los estudios de Docking se realizaron con el paquete de compute "Electronic High Throughput Screening" eHiTS®, el cual considera al ligando como flexible; ademas, utiliza un algoritmo sistematico que proporciona una amplia y exhaustiva cobertura del espacio de busqueda conformacional. Para cada ligando, el sistema de eHiTS genera todos los posibles modos de acoplamiento que sean compatibles con las restricciones estericas y las propiedades quimicas de la cavidad del sitio de union del bianco. El archivo de salida de eHiTS consiste en un juego de multiples coordenadas 3D por compuesto, con un puntaje que puede ser configurado de acuerdo las necesidades de cada usuario. El valor del puntaje representa la energia de union del acoplamiento ligando-receptor y esta dado en unidades de logKd (tambien conocido como pKi). El programa eHiTS realiza un acercamiento unico al problema del docking scoring; para ello utiliza "eHiTS Puntaje", una funcion de puntaje derivada de forma empirica y estadistica, incluyendo la consideraci6n de los factores de temperatura de las estructuras cristalograficas. En adicion, la funcion de puntaje en eHiTS puede realizar un agrupamiento automatizado de la familia de estructuras conocidas para el receptor de interes, de manera que permite calibrar funciones de puntaje especifica para una familia de receptores, favoreciendo que las poses de los ligandos que sean similares a las encontradas dentro de la familia de estructuras tengan un alto ranking. Para la calibration de la funcion de puntaje, utilizamos la funcion "train" en el paquete eHiTS, asi como tambien todas las estructuras disponibles en el PDB, en donde la SkMt se encuentra formando un complejo con el shikimato (codigos de acceso al PDB: lu8a, lzyu, 2dfn, 2glk, 2iyq, 2iyr, 2iys, 2iyx y 2iyz). De estas estructuras, la que fue utilizada como molde para el docking fue la correspondiente a la estructura 2dfn, debido principalmente a su alta resolution (1.9 A). El primer escaneo de la quimioteca fue realizado con los parametros de exactitud y numero de poses generadas por ligando al minimo (orden: accuracy 1). Al dar esta orden, el programa aumenta la rapidez sin afectar de manera significativa la puntuacion final asignada a cada ligando. De los resultados obtenidos, todos aquellos ligandos con afinidad de union igual o mayor que el ligando natural (ligando control) fueron sometidos a un segundo escaneo donde los parametros de exactitud 247

CAPÍTULO VIII. BIOINFORMÁTICA

y generación de poses por ligando fueron ajustados al máximo (orden: accuracy 6) con el fin de encontrar un mayor número de poses y consecuentemente, mejorando los valores de energía de unión.

Inspección de la orientación e interacción entre los ligandos y el receptor Una inspección detalla de cómo se acoplan los mejores 500 ligandos fue realizada con la ayuda del programa de visualización Chevi®, el cual nos permite analizar los diferentes tipos de interacciones interatómicas presentes en el acoplamiento del receptor con cada uno de los ligandos. Posterior a ello se calculó la frecuencia de contacto (expresada en porcentaje), con el fin de encontrar algunas preferencias en los aminoácidos que participan en dicho acoplamiento y ayudar a comprender el posible mecanismo de inhibición enzimática. Un total de 644 ligandos con propiedades fisicoquímicas ideales para un fármaco fueron identificados como potenciales inhibidores. De éstos el 42% comparten similitud estructural con la familia de moléculas llamadas triazoles y tetrazoles, lo cual las hace candidatas para el desarrollo de medicamentos para esta enfermedad. En la Figura 4 se muestran algunas de las moléculas obtenidas en este estudio.

Figura 4. Cuatro de las moleculas propuestas como candidates a farmacos para el desarrollo de medicamentos para la tuberculosis.

248

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

Agradecimientos Se agradece al Instituto Politécnico Nacional por las facilidades brindadas para llevar a cabo el escaneo virtual. Así mismo, se agradece al Dr. Arturo Rojo Domínguez (Universidad Autónoma Metropolitana-Cuajimalpa) por las recomendaciones para optimizar el protocolo de escaneo virtual.

Bibliografia Altschul S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. (1990), Basic local alignment search tool, J. Mol. Biol., 215: 403-410. (1991), Amino acid substitution matrices from an information theoretic perspective, J. Mol. Biol., 219: 555-565. Armougom, R; Moretti, S.; Poirot, O.; Audic, S.; Dumas, R; Schaeli, B.; Keduas, V., Notredame, C. (2006), Expresso: automatic incorporation of structural information in multiple sequence alignments using iD-Coffee, Nucl. Acids Res., 34: W604-608. Baker, D.; Sali, A. (2001), Protein structure prediction and structural genomics, Science, 294:93-96. Bohm, H. J.; Schneider, G.; Kubinyi, H.; Mannhold, R.; Timmerman, H. (2000), Virtual Screening forBioactive Molecules. Methods and Principles in Medicinal Chemistry, Germany, Wiley-VCH: Weinheim. Campbell, S. R (2000), Since, art and drug discovery: a personal perspective, Clin. Sci., 99: 255-260. Cygler, M.; Hung, M. N.; Wagner, J.; Matte, A. (2008), Bacterial structural genomics initiative: overview of methods and technologies applied to the process of structure determination, Meth. Mol. Biol. 426: 537-59. Dayhoff, M. O.; Eck, R. V. (1966), Atlas of Protein Sequence and Structure, USA, NBRF Press, Silver Spring. Doolittle, R. R; Hunkapiller, M. W.; Hood, L. E.; Devare, S. G.; Robbins, K. C; Aaronson, S. A.; Antoniades, H. N. (1983), Simian sarcoma virus one gene, v-sis, is derived from the gene (or genes) encoding a platelet-derived growth factor, Science, 221: 275-277. Duarte-Moura, J.; Santos, J.; Cunha-Melo, L. (1999), Comparison of similarity coefficients based on RAPD markers in the common bean, Genet. Mol. Biol., 22: 427432. Felsenstein, J. (2003), Distance Matrix Methods, Bootstrap, jacknife. In: Inferring Phytogenies, New York, Sinauer Associates. 249

CAPiTULO V I I I . BlOINFORMATICA

Edgar, R. C. (2004), Muscle: multiple sequence alignment with high accuracy and high throughput, Nucl. Acids Res., 32: 1792-1797. Edgar, R. C; Batzoglou, S. (2006), Multiple sequence alignment, Curr. Opin. Struct. Biol, 16: 368-373. Eddy, S. R. (2004), Where did the BLOSUM62 alignment score matrix come from?, Nat. Biotechnol, 22: 1035-1036. ENCODE Project Consortium (2007), Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project, Nature 447: 799-816. Eswar, N.; Webb, B.; Marti-Renom, M. A.; Madhusudhan, M. S.; Eramian, D.; Shen, M. Y.; Pieper, U.; Sali, A. (2007), Comparative protein structure modeling using MODELLER, Curr. Protoc. Protein Sci., 2: 2-9. Fickett, J. W. (1996), Finding genes by computer: the state of the art, Trends Genet, 12: 316-320. Fitch, W. M.; Margoliash, E. (1967), Construction of phylogenetic trees. A method based on Mutation distances as estimated from cytochrome c sequences is of general applicability, Science, 155: 279-284. Gruuneberg, S.; Stubbs, M. T.; Klebe, G. (2002), Successful virtual screening for novel inhibitors of human carbonic anhydrase: strategy and experimental confirmation, J. Med. Chem., 45: 3588-3602. Henikoff, S.; Henikoff JG. (1991) Automated assembly of protein blocks for database searching. Nucl. Acids Res. 19: 6565-6572. (1992), Amino acid substitution matrices from protein blocks, USA, Proc. Natl. Acad. Sci., 89: 10915-10919. Hofmann, K.; Bucher, P.; Falquet, L.; Bairoch, A. (1999), The PROSITE database, its status in 1999, Nucl. Acids Res., 27: 215-219. Holtje, H. D.; Sippl, W.; Rognan, D.; Folkers, G. (2003), Molecular Modeling: Basic Principles and Applications, Weinheim, Germany, Wiley-VCH. Karlin, S.; Altschul, S. F. (1990), Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes, USA, Proc. Natl. Acad. Sci., 87: 2264-2268. Kendrew, J. C. (1958), The three-dimensional structure of a myoglobin, Nature, 181: 662-666. Mardia, K. V.; Kent, J. T.; Vivi, J. M. (2003), Principal Component Andlisis, in Multivariate Analysis, New York, Academic Press. Martinez, W. L.; Martinez, A. R. (2002), Computational Statistics Handbook with MATLAB, New York. Needleman, S.; Wunsch, C. (1970), A general method applicable to the search for similarities in the amino acid sequences of two proteins, J. Mol. Biol., 48: 444-453. 250

ALDO SEGURA-CABRERA Y MAURILIO GONZÁLEZ-PAZ

Notredame, C; Higgins, D. G.; Heringa, J. (2000), T-Coffee: A novel method for fast and accurate multiple sequence alignment, J. Mol. Biol., 302: 205-17. Ramirez-Guzman, M. E.; Lopez-Tirado, Q. (1993), Metodos estadisticos no parametricos, Chapingo, Mexico, Universidad Autonoma Chapingo. Pearson, W. R.; Lipman, D. J. (1988), Improved tools for biological sequence comparison, Proc. Natl. Acad. Sci., USA, 85: 2444-2448. Saitou, N.; Nei, M. (1987), The neighbor-joining method: a new method for reconstructing phylogenetic trees, Mol. Biol. Evol., 4: 406-425. Sanger, F. (1956), The structure of insulin, in Currents in Biochemical Research, New York, DE Green (Ed.), Interscience. Segura-Cabrera, A.; Rodriguez-Perez, M. A. (2008), Structure-based prediction of Mycobacterium tuberculosis shikimate kinase inhibitors by high-throughput virtual screening, Bioorg. Med. Chem. Lett., 18: 3152-3157. Slabinski, L.; Jaroszewski, L.; Rodrigues, A. P.; Rychlewski, L.; Wilson, I. A.; Lesley, S. A.; Godzik, A. (2007), The challenge of protein structure determinationlessons from structural genomics, Protein Sci., 16: 2472-2482. Smith, T.; Waterman, M. (1981), Identification of common molecular subsequences, J. Mol. Biol., 147: 195-197. Thompson, J. D.; Higgins, D. G.; Gibson, T. J. (1994), CLUSTALW: improving the sensitivity of progressive multiple sequence alignment through sequence weighting position specific gap penalties and weight matrix choice, Nucl. Acids Res., 22: 4673-4680. Villoutreix, B. O.; Bastard, K.; Sperandio, O.; Fahraeus, R.; Poyet, J. L.; Calvo, F.; Deprez, B.; Miteva, M. A. (2008), In silico-in vitro screening aofprotein-protein interactions: towards the next generation of therapeutics, Curr. Pharm. Biotechnol., 9:103-22. Wilbur, W. J.; Lipman, D. J. (1983), Rapid similarity searches of nucleic acid and protein data banks, USA, Proc. Natl. Acad. Sci., 80: 726-730. Zuckerkandl, E.; Pauling, L. (1965), Molecules as documents of evolutionary history, J. Theoret. Biol., 8: 357-358.

251

Capitulo IX Proteómica Xianwu Guo-Zhou Miguel A. Reyes-Lopez

Antecedentes

D

esde mediados del siglo xx, diversos investigadores apuntaban que el material genético responsable de la herencia eran las proteínas. Posteriores experimentos descartaron que las proteínas fueran las responsables, dándole ese "honor" a los ácidos nucleicos. Como se podrá observar, las proteínas han jugado un papel preponderante en el desarrollo de las diferentes facetas de las ciencias naturales y del desarrollo de las diferentes disciplinas, como la biotecnología genómica, la biología molecular, etc. Algunos rasgos distintivos de las proteínas, se han caracterizado a través de sus propiedades físico-químicas, logrando el aislamiento y purificación de ellas, lo cual ha permitido el estudio de su estructura, función y potencial función en las células o en diferentes organismos como bacterias, hongos, humanos o hasta en entidades diminutas y complejas como los virus o los priones. Las proteínas son macromoléculas formadas por cadenas lineales de aminoácidos. El nombre proteína proviene de la palabra griega "prota", que significa "lo primero" o del dios Proteo, por la cantidad de formas que pueden tomar el origen de la palabra. Para adentrarnos a la importancia de las proteínas veremos algunas características y diversas funciones que presentan. Las proteínas son parte esencial de los organismos. Un ejemplo se da en Escherichia coli, donde las proteínas constituyen más de la mitad del peso seco de célula, mientras que el ADN y ARN solo tienen 3% y 20%, respectivamente. Una característica importante es que las proteínas son las macromoléculas biológicas fundamentales. Exceptuando algunas categorías específicas de ARN, la 253

CAPÍTULO IX. PROTEÓMICA

mayoría de las otras moléculas biológicas tales como polisacáridos, lípidos y ADN, llevan al cabo su proceso metabólico dentro de las células, las cuales necesitan la participación de las proteínas. Dentro de las funciones de las proteínas tenemos que muchas de ellas funcionan como enzimas, las cuales catalizan reacciones bioquímicas y se conocen más de 4 mil reacciones catalizadas por ellas. Otra función es estructural, las proteínas del citoesqueleto, tales como la actina y tubulina, forman un sistema de andamiaje que mantiene la forma de células. Algunas otras proteínas se encuentran en las membranas y funcionan como receptores moleculares que podría transferir las señales del medio ambiente o transmitir las señales a través de los canales iónicos, los cuales controlan la permeabilidad de membrana celular, lo que permite la regulación de la concentración iónica (por ejemplo, calcio, sodio, magnesio y potasio) de las células. Otras proteínas actúan como hormonas (insulin) en el cuerpo humano. Dentro del sistema inmune, los anticuerpos son otra categoría importante de proteínas que participan en la respuesta inmunológica específica, lo anterior cuando un animal o humano es infectado por un antígeno (bacterias, virus, etc.) y se lleva al cabo dicha respuesta del cuerpo para combatir la "invasión" del agente extraño. En conclusión, las proteínas son importantes en la señalización celular, la respuesta inmune, la conformación de células y el ciclo celular, entre otros fenómenos. Así mismo, las proteínas también son necesarias en humanos y animales para su dieta, puesto que no pueden sintetizar todos los aminoácidos que necesitan y deben obtener aminoácidos esenciales de los alimentos. Lo anterior a través del proceso de la digestión, el cual descomponen a las proteínas en aminoácidos libres que se utilizan en el metabolismo. Por otra parte, desde el punto de vista químico, las proteínas son compuestos orgánicos grandes constituidos de aminoácidos dispuestos en una cadena lineal y unidas por enlaces peptidicos, éstos formados entre un grupo carboxilo y un grupo amino del o de los aminoácidos adyacentes. Por lo tanto, la secuencia de aminoácidos en una proteína se define por un gen y codificada por el llamado código genético. Si bien este código genético especifica 20 "combinaciones estándar" de los aminoácidos, existen excepciones como la seleno-cisteína en Olavius algarvensis (la cual es codificada por UGA) y la pirrolisina en algunos organismos del género Archaea (codificada por UAG). En el proceso de la traducción, los residuos en una proteína a veces son modificados químicamente postraduccionalmente en el aparato de Golgi. Ésto puede ocurrir antes que la proteína funcione en la célula o como parte de los mecanismos de control en el metabolismo de algún organismo. Las proteínas también pueden trabajar juntas, como un complejo, para lograr una función particular y a menudo están asociadas para formar complejos estables como las llamadas holoenzimas, que son un conjunto de proteínas que se unen para realizar diferentes funciones, tal es el caso de la ADN polimerasa que actúa en la replicación o de la ARN polimerasa que actúa en la transcripción, por citar algunos ejemplos. 254

XIANWU GUO-ZHOU Y MIGUEL A. REYES-LOPEZ

Constitution de las proteinas

Aminodcidos Un aminoácido es una molecula que contiene grupos funcionales, tanto amino como carboxilo, y su representation general es H2NCHRCOOH, donde R es algiin sustituyente organico o tambien llamada cadena lateral. Los grupos amino y carboxilo se adjuntan a la cadena de carbono-a-carbono en la molecula, llamado alfa aminoacidos. Los diversos alfa aminoacidos se diferencian en que el distinto grupo R (cadena lateral) se adjunta al a-carbono (Figura I). Ellos pueden variar en tamano, diferenciandose en tan solo un átomo de hidrogeno, como en la glicina, un grupo metilo en la alanina y hasta a un grupo grande heterociclico en el triptofano. Los aminoacidos son clasificados generalmente por las propiedades de la cadena lateral en cuatro grupos. La cadena lateral puede hacer que las proteinas se comporten como un acido débil (Asp, Glu), una base débil (Lysf,; Arg, Su), una proteina hidrofilica, si ellos son polares (Asp, Glu, Lys, Arg, Su, ASN, GLN, Ser, Thr, Tyr, CyS), e hidrofobicas (Ala, Val, Leu, Tie, Met, Phe, Trp, Tyr, Pro, Gly) si son no polares. De los veinte aminoacidos conocidos, todos elfos son codificados por el codigo genetico y se llaman aminoacidos proteinogenicos o«standares. Otros aminoacidos en las proteinas contenidas son generalmente formados por modification post-traduccional, que es la modification despues de la traduction en la sintesis de proteinas. Estas modificaciones son a menudo indispensables para la funcion o regulation de una proteina. Los enlaces que mantienen unidos a dos aminoacidos dentro de una proteina se llaman enlaces peptidicos (Figura 2), los cuales son formados mediante una reaction de deshidratacion. Una serie de aminoacidos unidos en la cadena de proteinas se llama residuo y la parte consistente en serie de atomos de carbono, nitrogeno, oxigeno se conoce como la principal cadena de proteinas o columna vertebral.

Estructura de proteínas Los aminoácidos son la unidad básica de proteínas. Debido principalmente a la estructura química de los aminoácidos, la cadena de proteínas es direccional. El final de la proteína con un grupo carboxilo libre es conocido como el extremo C-terminal o carboxilo terminal, mientras que el extremo final con un grupo amino libre se conoce como el extremo N-terminal o amino terminal. Las cadenas de proteínas pueden ser plegadas en una estructura tridimensional, simplemente a través de 255

CAPÍTULO IX. PROTEÓMICA

las propiedades químicas, tales como las interacciones hidrofílicas e hidrotbbicas de sus aminoácidos. Los bioquímicos a menudo se refieren a cuatro aspectos distintos en una estructura de proteína: a) Estructura primaria. En este nivel se indica la secuencia de aminoácidos a lo largo de su eje o estructura, estos aminoácidos se encuentran unidos por los llamados enlaces peptídico. En general, los polipéptidos son polímeros no ramificados. Sin embargo, las proteínas pueden convertirse en enlaces cruzados, más comúnmente por el enlace de disulfuro en la cisteína.

Figura 1. Estructura principal de los aminoacidos. I. Representa-ión de bolas y palos de la estructura principal de los aminoacidos. II. Formula desarrollada para la estructura principal de los aminoacidos. H: atomo de hidrogeno; N: atomo de nitrogeno; C: atomo de carbono; O: atomo de oxigeno; R: cadena lateral, la cual puede ser sustituida por otra molécula o grupos de moléculas. 256

Figura 2. Formacion de un enlace peptidico. Se muestra la formacion de un enlace peptidico a partir de la union de 2 aminoacidos (aa), con la adicional formacion de una molecula de agua. El enlace peptidico implica la perdida de una molecula de agua y la formacion de un enlace covalente CO-NH. Es en realidad, un enlace amida sustituido. La cadena de aminoacidos crecera siempre por el extremo C-terminal o carboxilo terminal "libre".

CAPÍTULO IX. PROTEÓMICA

c) Estructura terciaria. Es la forma y la relación espacial de las estructuras secundarias de una molécula completa de la proteína. La Estructura terciaria está generalmente estabilizada por interacciones no-locales, en la mayoría debido a la formación de un núcleo hidrofóbico, también a través de los puentes de sal, los enlaces por puente de hidrógeno, los enlaces disulfuro e incluso de modificaciones post-transduccionales. d) Estructura cuaternaria. Se indica a la forma o estructura que resulta de la interacción de más de una molécula de proteína, normalmente llamados subunidades de proteínas en este contexto, que se funcionan como partes de una estructura más grande o compleja de proteínas. Es necesario mencionar que el plegamiento de algunas proteínas requiere la ayuda de otras moléculas, llamadas chaperonas, para formar su estructura funcional, lo cual es llamado estado nativo de la proteína. Las proteínas pueden ser desnaturalizadas (cambio en alguna de sus estructuras antes mencionadas; por ejemplo, cambio en la estructura cuaternaria) por medios químicos o físicos; de los físicos está dada

Figura 3. Conformacion de la estructura de NikR de E. coli. Estructura en forma de dimero de la molecula NikR, presentado con diferentes colores, azul y amarillo, ios cuales muestran las diferentes estructuras secundarias. 258

XIANWU GUO-ZHOU Y MIGUEL Á. REYES-LÓPEZ

por el aumento de la temperatura o por medios químicos como por un descenso del pH, o la adición de los detergentes, la urea o Hidrocloruro de guanidina. La urea y el hidrocloruro de guanidina desnaturalizan las proteínas mediante el aumento de la solubilidad de las cadenas laterales hidrofóbicas en agua. Presumiblemente estos compuestos, que son polares, alteran la estructura del agua para que sea más fácil disolver las moléculas hidrofóbicas. La especificidad en la interacción entre una proteína y una pequeña molécula o entre las proteínas, tiene la exigencia de que las dos moléculas que interactúan deben ser complementarias en sus cargas, en los enlaces por puentes de hidrógeno, las interacciones hidrofóbicas y sus formas. Si cualquiera de estas condiciones no se cumplen, la fuerza de la interacción podría reducirse, lo que se traduciría en una proteína no funcional.

Métodos de estudio de proteínas Para estudiar a las proteínas debemos de determinar bajo que condiciones se llevarán al cabo los diferentes experimentos, pudiendo por lo tanto llevarse al cabo tanto in vitro, como in vivo. Experimentos in vivo proporcionan información acerca de las actividades de proteínas dentro de las células para responder algunas preguntas: ¿cómo, cuándo y en dónde trabaja una proteína baja una condición fisiológica dada? En los estudios in vitro, las proteínas se utilizan para explorar cómo una proteína lleva a cabo su función en los ambientes controlados, por ejemplo, el análisis de la estructura, identificación, cuantificación, modificaciones post-transducciónales; el mecanismo químico de la actividad catalítica de una enzima y búsqueda de drogas de proteínas blancos. Para llevar al cabo los diferentes experimentos y conocer la naturaleza de la proteína, sus componentes, su estructura y sus interacciones, es necesario purificarlas primero.

Técnicas de purificación de proteínas Con el fin de purificar una proteína de las células, a partir de las membranas y paredes celulares, éstas deben de ser liberadas de sus contenidos internos, mediante una solución, la cual se forma como un usado crudo. Para tal efecto, la purificación de proteínas membranales requiere de la eliminación de la membrana celular y la ruptura de la membrana de la célula para aislar a cualquier particular proteica en la misma membrana. Es necesario mencionar que en este proceso también se extraen las proteasas, proteínas con actividad enzimática, que empezarán a digerir las proteínas en la solución. Si la proteína es sensible a la proteólisis, por lo general 259

CAPÍTULO IX. PROTEÓMICA

será necesario proceder con el experimento de purificación rápidamente y/o guardar el extracto en frío, para disminuir la proteólisis lo más posible. A continuación, el Usado crudo o extracto de la célula puede ser purificado por varios métodos basados en las propiedades físicas o químicas de las proteínas, tales como peso molecular, carga neta y afinidad: Precipitación. En la purificación de proteínas, un primer paso para aislar a las proteínas es la precipitación con sulfato de amonio [(NH4) 2 SOJ. Esto se realiza mediante la adición de una seria de cantidades de sulfato de amonio y la recolección de las diferentes fracciones a precipitar las proteínas. Una ventaja de este método es que es barato y se obtienen grandes cantidades de la proteína. Centrifugación. Es un proceso que utiliza la fuerza centrífuga para separar las mezclas de partículas en suspensión en un líquido de diferentes masas moleculares o densidades. La fuerza hacia el exterior que "empuja" a cada partícula, es proporcional a la masa de las partículas, lo que permiten fraccionar los diferentes componentes celulares en segmentos como proteínas solubles, lípidos, proteínas de membrana, orgánulos celulares y los ácidos nucleicos. Gradiente de centrifugación. Para llevar al cabo este procedimiento, se requieren diferentes concentraciones de algún compuesto, generalmente se utilizan azúcares. Por ejemplo, un gradiente de concentración lineal de azúcar (normalmente sacarosa, glicerol, sílice, o a base de de un gradiente de densidad media, como Percoll) se genera en un tubo de tal manera que la mayor concentración se encuentra en la parte inferior y la más baja en la parte superior. La muestra se pone en capas en la parte superior de la gradiente y se ultracentrífuga a velocidades altas, entre 12 mil y 20 mil g. Si las muestras se centrifugan el tiempo suficiente, las partículas en el tubo llegan a un equilibrio en donde las partículas se acumulan en un punto concreto en el tubo cuando su densidad está equilibrada con la fuerza centrífuga. Después de la separación de la proteína / las partículas, la muestra se fracciona y guardada hasta su análisis. Electroforesis en gel. Es una técnica en la que las moléculas cargadas se separan de acuerdo con las propiedades físicas (cargas iónicas), cuando dichas moléculas migran a través de un gel debido principalmente a una corriente eléctrica. Alguno de los soportes por donde migran las proteínas, las proteínas se separan comúnmente mediante electroforesis en gel de poliacrilamida (PAGE, de sus siglas en inglés), este procedimiento caracteriza las proteínas individuales o complejas o para examinar las múltiples proteínas o complejos proteicos en una muestra, PAGE se utiliza como una herramienta preparativa para obtener una muestra de la proteína pura o como un instrumento analítico para proporcionar información sobre la masa, carga, la pureza o la presencia de una proteína. Existen variantes de PAGE, los 260

XIANWU GUO-ZHOU Y MIGUEL Á. REYES-LÓPEZ

cuales pueden proporcionar diferentes tipos de información acerca de la proteína. PAGE desnaturalizante, también llamada PAGE nativa, separa las proteínas debido a su masa: carga, PAGE-SDS (dodecil sulfato de sodio) es la técnica de electroforesis más utilizada y separa principalmente las proteínas debido a su masa, PAGE bidimensional (2-D PFGE, por sus siglas en inglés) separa las proteínas por el punto isoeléctrico en la primera dimensión y por su masa en la segunda dimensión. Métodos cromatográficos. El fundamento básico para usar la cromatografía es hacer fluir la solución que contiene a la proteína a través de una columna llenada de diferentes materiales. Las Diferentes proteínas interactúan con diferentes materiales de la columna, debido principalmente a sus propiedades físicas y químicas, por lo que pueden ser separadas por el tiempo que pasan a través de la columna o debido a las condiciones usadas para eluir a la proteína en la columna. Por lo general, las proteínas se detectan debido a su propiedad física de absorción de la luz, esta propiedad se mide a una absorbencia de 280 nm. Existen diferentes métodos de cromatografía: a) Cromatografía de exclusión. Este tipo de cromatografía se puede utilizar para separar las proteínas en solución o aquellas en condiciones de desnaturalización, debido principalmente a su paso a través de geles porosos. Esta técnica se conoce como cromatografía de exclusión. El principio se basa en que las moléculas más pequeñas tienden a recorrer una mayor distancia en la matriz porosa. En consecuencia, las proteínas de un cierto rango de tamaños requerirán una mayor distancia y por ende un mayor volumen variable de efluente antes de recogerlas en el otro extremo de la columna de gel. b) Cromatografía de intercambio iónico. Cromatografía de intercambio iónico es una herramienta muy poderosa para su uso en la purificación de proteínas. Esta técnica separa compuestos según la naturaleza y el grado de su carga iónica. La columna que se utiliza es seleccionada de acuerdo al tipo de purificación. Resinas de intercambio iónico con una carga positiva se utilizan para retener y separar los compuestos de carga negativa, mientras que las resinas de intercambio iónico con una carga negativa se utilizan para separar las moléculas de carga positiva. Antes de la separación, se inicia adicionando un regulador a través de la columna, para que ésta equilibre los iones con carga opuesta. Tras la inyección de la muestra, las moléculas de soluto se intercambian con los iones del regulador, ya que cada ion compite por los sitios de unión en la resina. Los compuestos más débilmente cargados se eluyen en primer lugar, seguidos sucesivamente de los mas fuertemente cargos. Actualmente, el pH, el tipo y la concentración de regulador, así como la temperatura juegan un papel importante en la separación de las proteínas, debido a la naturaleza del mecanismo de la separación. 261

CAPÍTULO IX. PROTEÓMICA

c) Cromatografía de afinidad. La cromatografía de afinidad es una técnica de separación basada en la conformación molecular, que se utiliza frecuentemente en resinas específicas. Estas resinas están ligadas adjunta a sus superficies, que son específicos para los compuestos a separar. La más frecuentemente, estos ligandos se funcionan con una manera similar a la de las interacciones antígeno-anticuerpo. La interacción asemeja al sistema de la "llave y cerradura", es decir existe una interacción entre el ligando y su compuesto blanco, los cuales son muy específicos, lo que se traducirá en la generación de un solo pico en la elución, mientras que todo lo demás en la muestra no es usada. d) Cromatografía de unión a Metal ("metal binding"). Es una técnica sencilla que implica integrar una secuencia de 6 a 8 histidinas en el extremo C-terminal de la proteína blanco. Normalmente la polihistidina se une firmemente a iones metálicos divalentes como el níquel y el cobalto. Posteriormente, la proteína con polihistidina es pasada a través de una columna que contiene los iones níquel inmovilizados en la columna, que se unen a la polihistidina. Todas las proteínas sin la etiqueta de polihistidina pasan a través de la columna, es decir no se retienen. La proteína que sí fue retenida, se obtiene posteriormente por elución con imidazol, que compite con la etiqueta de polihistidina unida a la columna; o por una disminución en el pH (normalmente a 4,5), que disminuye la afinidad de la etiqueta de polihistidina a la resina. Este procedimiento se utiliza generalmente para la purificación de proteínas recombinantes que presentan una etiqueta de afinidad (como una etiqueta 6xHis o la etiqueta HAT de la compañía Clontech); esta técnica también puede utilizarse para las proteínas naturales con una afinidad inherente por los cationes divalentes. e) Cromatografía de Inmunoafinidad. La cromatografía de Inmunoafinidad se utiliza la unión específica de un anticuerpo a la proteína blanca para la purificación selectiva de la proteína. El procedimiento implica una inmovilización de anticuerpos a una columna de material, que luego se une selectivamente la proteína, mientras que todo lo demás pasa la columna. La proteína puede ser que se eluye por el cambio del pH o la salinidad. Debido a que este método no implica la ingeniería de etiqueta, puede aplicarlo para las proteínas naturales. Sin embargo, esto requiere a menudo la producción de anticuerpos monoclonales o policlonales de alta afinidad y especificidad. f) Cromatografía líquida de alta resolución (HPLC O "high pressure liquid chromatography"). También llamada Cromatografía de líquidos de alto rendimiento o cromatografía líquida de alta presión, es una forma la 262

XIANWU GUO-ZHOU Y MIGUEL Á. REYES-LÓPEZ

cromatografía que utiliza la aplicación de alta presión para conducir los solutos a través de la columna con mayor rapidez. Debido a esto, se mejora la resolución o separación de las moléculas, en este caso las proteínas. La forma más común es la "fase inversa" del HPLC, esto ocurre cuando los materiales de la columna son hidrofóbicos. Por lo tanto, las proteínas se eluyen por un gradiente mayor, debido a las cantidades de disolventes orgánicos usados, como el acetonitrilo. Eluir las proteínas depende en su hidrofobicidad. Después de la purificación por HPLC la proteína está presente en una solución que sólo contiene compuestos volátiles y puede ser fácilmente liofilizada. Las proteínas purificadas por HPLC generalmente se encuentran en el estado de desnaturalización y por tanto, no es aplicable a las proteínas que se pliegan espontáneamente. Sin embargo, puede utilizarse para el análisis de la estructura de la proteína. Cabe mencionar que para purificar una proteína específica, normalmente se necesita la combinación de varias técnicas mencionadas previamente, que dependen de las propiedades de la proteína y de los objetivos que se persigan en la utilización de la proteína.

Estudio de las proteínas in vivo El estudio de las proteínas in vivo es a menudo relacionado con el tiempo de la síntesis y la localización de la proteína dentro de la célula. En microbiología, por lo general implica una serie de operaciones genéticas. Una técnica útil para evaluar la localización subcelular de las proteínas es usar la ingeniería genética, con lo que se logrará construir y expresar una proteína de fusión en la célula. Suele parecer muy complicado adicionar una proteína a una membrana; sin embargo, en la actualidad las técnicas y herramientas de ingeniería genética están muy adelantadas que el procedimiento que consiste en que la proteína blanco fusionada, consistirá en la proteína natural de interés, unida a un marcador, como la llamada proteína verde fluorescente (GFP, por sus siglas en inglés). Por lo que, la posición de la proteína fusionada en la célula se visualizará mediante microscopía. Asimismo, se puede usar un anticuerpo con algún marcador conocido, este procedimiento es mucho más simple para identificar la localización de una proteína de interés. Por ejemplo, la inmunofluorescencia indirecta permitirá conocer la localización y la demostración de la ubicación de la proteína de interés. Si esta técnica se combina con otra técnica poderosa, como la alteración de la secuencia de la proteína por Mutagénesis Sitio-Dirigida, se puede estudiar la estructura, localización subcelular y la susceptibilidad a la regulación de proteína en célula. 263

CAPÍTULO IX. PROTEÓMICA

La Proteómica La proteómica es el estudio a gran escala de las proteínas, en particular de sus estructuras y funciones. El término proteómica fue establecido para hacer una analogía con la genómica, el estudio de los genes. La palabra proteóma es una mezcla de las palabras proteína y genoma. Esto significa el total de proteínas presentes en un momento dado en una célula o en un tipo celular. Lo anterior puede variar con el tiempo y debido a distintas condiciones o al estrés de la célula o de un organismo dado. El requisito clave en la comprensión de la función de las proteínas, es aprender a relacionar la amplia cantidad de proteínas y sus posibles modificaciones en un escenario fenotípico particular y después determinar sí esa proteína o sus modificaciones post-transduccionales se requieren para llevar al cabo una función particular en célula. La proteómica es una herramienta útil para aclarar las funciones de las proteínas. Los científicos están muy interesados en la proteómica, ya que ella ofrece algunas ventajas para el mejor entendimiento de las funciones de un organismo. En primer lugar, el nivel de la transcripción de un gen, da sólo una estimación aproximada del nivel de expresión de una proteína. Un ARNITI (ARN mensajero) producido en abundancia es posible que se degrade rápidamente antes la traducción, lo que resultará en una pequeña cantidad de proteína. En segundo lugar, como ya se ha mencionado antes, muchas proteínas necesitan de modificaciones post-transduccionales que perturban profundamente sus actividades, por ejemplo, algunas proteínas no se activan hasta que se convierten en proteínas fosforiladas. Métodos como la fosfoproteómica y glicoproteómica se utilizan para estudiar las modificaciones post-traduccionales. En tercer lugar, muchas transcripciones producen más de una proteína. Por último, muchas proteínas forman complejos con otras proteínas o con las moléculas de ARN, y sólo funcionan en presencia de esas otras moléculas.

Electroforesis bidimensional o electroforesis 2-D La electroforesis bidimensional o electroforesis 2-D, es aquella electroforesis que utiliza más de una de las propiedades fisicoquímicas de las proteínas para su separación o identificación de otras proteínas. Inicia con una electroforesis unidimensional o electroforesis 1-D, la cual se basa en utilizar alguna propiedad fisicoquímica de la proteína a evaluar, a continuación se separan las moléculas por una segunda propiedad de dicha proteína, mediante una segunda electroforesis en una dirección de 90 grados a partir del punto donde se detuvo la proteína en la primera parte de la electroforesis usando su primera propiedad fisicoquímica. En la electroforesis unidimensional las proteínas se separan en una sola dimensión, todas las proteínas se encuentran a lo 264

XIANWU GUO-ZHOU Y MIGUEL Á. REYES-LÓPEZ

largo de un carril pero separados entre sí por una propiedad fisicoquímica (por ejemplo, punto isoeléctrico). En la electroforesis bidimensional, por ejemplo las proteínas se separan en un gel de SDS-PAGE por el tamaño de la masa. El resultado es que las proteínas están diseminadas por todo el gel de SDS-PAGE. Debido a que es poco probable que dos proteínas sean similares en dos propiedades, las proteínas se separan de manera más eficaz en la electroforesis bidimensional, que en electroforesis unidimensional. Una propiedad que se utiliza con mucha frecuencia ahora es la propiedad que separa a las proteínas por punto isoeléctrico, esta propiedad es llama isoelectroenfoque (IEF), normalmente se aplica en la primera dimensión de gel. Por lo tanto, un gradiente de pH se utiliza y un potencial eléctrico se genera a través del gel, creando un lado más positivo que el otro. Las proteínas se mueven a lo largo del gel y se acumulan en su punto isoeléctrico, es decir, el punto en el que la carga global de la proteína es 0 (una carga neutra). Para la separación de las proteínas puede usarse la electroforesis en gel de poliacrilamida (PAGE, de las siglas del inglés), que es una separación unidimensional. En el PAGE, las proteínas permanecen en su estado complejo. La migración en este tipo de técnicas se produce porque la mayoría de las proteínas llevan una carga negativa neta, esto a un pH ligeramente básico. La mayor densidad de carga negativa (mayor cantidad de cargas en las proteínas o complejos de proteínas), resulta en una mayor migración de una proteína o complejo proteico. Al mismo tiempo, la fuerza de fricción de la matriz del gel, crea un efecto de tamizado (sieving) o separación, lo cual retarda el movimiento de ciertas proteínas, dependiente de su tamaño. Las proteínas más pequeñas se enfrentan a una fuerza de fricción pequeña, mientras que las proteínas grandes se enfrentan a una mayor fuerza de fricción. De este modo en el PAGE se separan proteínas basadas sobre todo en su carga y masa. Después de la terminación de la separación en una dimensión, se destruyen casi todos los complejos proteicos mediante la aplicación de la SDS-PAGE desnaturalizante, lo cual sería la segunda separación y a lo cual le llamaríamos segunda dimensión. En esta dimensión, las proteínas y algunos complejos restantes son separados por su masa. Otra característica es aquella que se debe de tomar en cuenta para separar o purificar a una proteína por su longitud. La longitud (cuando ésta despliega) es aproximadamente proporcional a su masa, puede decirse que el número de moléculas de SDS es aproximadamente proporcional a la masa de la proteína. Debido principalmente a que la molécula SDS cuenta con carga negativa, la unión de proteína-SDs formará un complejo que resultará en que todas las moléculas de las proteínas tendrán aproximadamente la misma masa-carga entre sí. Además, las proteínas que no migran en una dimensión es debido a que no presentan carga total o parcial (resultando en la obtención del isoelectroenfoque); por otro lado, el recubrimiento de la proteína con SDS (carga negativa), permitirá la migración de dicha proteína en una segunda dimensión. Cuando estas muestras se corren por electioforesis, las proteínas se separan según la masa. 265

CAPÍTULO IX. PROTEÓMICA

Purificación por Afinidad en Tándem (PAT) La técnica de Purificación por Afinidad en Tándem (PAT) es una técnica de purificación de proteínas que se ha adecuado especialmente para la purificación de proteínas complejas y para la identificación de proteínas que interactúan entre ellas. El PAT implica la fusión de 2 componentes, el PAT marcada y la proteína de interés. Para lograr esto el PAT marcada se une al extremo C-terminal o N-terminalo de la proteína de estudio. A su vez el PAT marcada consiste de una molécula de calmodulina (CBP, por sus siglas en inglés), seguido el sitio de escisión o ruptura de la proteasa TEV (por sus siglas en inglés), la cual proviene del virus Etch del tabaco y la tercera parte es la proteína A, que se une fuertemente a la inmunoglobulina IgG. Es necesario notar lo que la proteína A debe estar en el extremo contrario de la proteína de fusión, con el fin de que todo el complejo se pueda unir a la matriz de IgG y lograr su captura y posterior purificación (véase Figura 4). El uso de PAT para purificar proteínas complejas implicó la creación de una proteína de fusión, con la consecuente interacción de PAT marcada en un extremo de la proteína que se expresa y la cual es buscada o investigada en una célula huésped natural u organismo. Los extractos preparados a partir de estas células u organismos, se procesan en dos etapas para recuperar la proteína de estudio y si fuera el caso a los diferentes complejos a los cuales está unida y con los que interactúan. El material purificado consistirá en la proteína de fusión y en sus diferentes proteínas de interacción, las cuales se fraccionan por SDS-PAGE y las proteínas co-purificadas se identifican por espectrometría de masas, otra técnica de la cual no hablaremos en este capítulo. Para la purificación de una proteína mediante PAT marcada de un extracto crudo, se involucran cuatro pasos principales: 1. Unión de la proteína de interés a la IgG sobre microesferas. 2. Lavado y elución de los materiales unidos con la ayuda de la proteasa TEV. 3. Unión de la proteína presente en el primer eluato a microesferas recubiertas con calmodulina en presencia de calcio. Es necesaria para eliminar la proteasa TEV, así como huellas de los contaminantes restantes después de la primera etapa de afinidad. 4. Lavado final y elución de los materiales unidos con la ayuda de ácido etilenglicol tetra-acético (EGTA, de sus siglas en inglés). Ventajas. Determinación cuantitativa real de proteínas de los complejos in vivo sin el previo conocimiento de la composición del complejo. También es fácil de realizar y a menudo proporciona un alto rendimiento (producto). Se mejora mucho 266

XIANWU GUO-ZHOU Y MIGUEL Á. RKYES-LÓPEZ

la especificidad de la interacción de proteínas entre los complejos después de dos etapas de purificación. Desventajas. Existe la posibilidad de que una marca o etiqueta que se añade a una proteína pueda enmascarar la unión de las proteínas que interactúan con sus complejos, afectando los niveles de expresión de proteínas o que no exista suficiente espacio expuesto en la microesferas de afinidad. Por otro lado, la proteína de interés puede contar con un sitio de digestión de la proteasa TEV, aunque esto es poco probable y no se ha observado. También, existe pérdida de las interacciones transitorias de las proteínas, debido a que se llevan al menos 2 lavados. Pero la reciente modificación del PAT in vivo, de la hibridación antes de purificación, ha mejorado mucho esta purificación. Aunque la estrategia de PAT tiene algunas limitaciones, es aplicable a una amplia variedad de proteínas. De hecho, la estrategia de PAT ha demostrado que es muy útil como un método genérico y rápido de purificación de proteínas y complejos de proteínas asociadas, sin la limitación con que tiene el método de espectrometría de masas en el análisis de la interacción de proteínas.

Figura 4. Estructura de PAT marcada. Se muestran los diferentes componentes de PAT marcada, la cual esta unida a la proteina de interes que se estudia.

267

CAPÍTULO IX. PROTEÓMICA

Espectrometría de masas La espectrometría de masas es un instrumento analítico utilizado para medir la masa molecular de una muestra y el análisis de la estructura de proteínas. Para muestras grandes, tales como proteínas, las masas moleculares se pueden medir con una precisión de 0.01% de masa molecular total de la muestra. Esto es suficiente para permitir detectar cambios menores de masa, por ejemplo, en la sustitución de un aminoácido por otro o en alguna modificación post-transduccional. El equipo de espectrómetro de masa se puede dividir en tres partes fundamentales: la fuente de ionización, el analizador y el detector. El procedimiento básico es el siguiente: la muestra debe ser introducida en la fuente de ionización del instrumento y las moléculas de la muestra serán ionizadas dentro de la fuente de ionización. La ionización es necesaria porque los iones son más fáciles de manipular que las moléculas neutras. Muchos métodos de ionización están disponibles, pero en la mayoría de los mayormente utilizados son la ionización de electro-spray (ESI, de sus siglas en inglés) y Desabsorción/lonización por láser asistida por una matriz (MALDI, Matrix Assisted Láser Desorption Ionisation). La principal función del analizador de masas, es separar o resolver los iones formados en la fuente de ionización del espectrómetro de masas según su proporción masa-carga (m / z) (Figura 5). Hay una seria de analizadores de masas actualmente disponibles. El más conocido incluye los analizadores de quadrupolos, tiempo de vuelo (TOF, de sus siglas en inglés), sectores magnéticos, transformadas de Fourier y las trampas de iones de cuadrupolos. Se han incorporado en tándem (MS-MS) espectrómetros de masas desde dos, tres o cuatro analizadores. El detector examina la corriente de iones, se amplifica y la señal se transmite al sistema de datos donde se registran en forma de espectros de masa. La proporción de valores m/z de los iones, se anota gráficamente en función de su intensidad, lo cual muestra el número de componentes, la masa molecular de cada componente y la abundancia relativa de los diversos componentes de una muestra dada. El analizador y el detector del espectrómetro de masas, junto

Figura 5. Representación Esquemática del proceso funcionario de una espectrometria de masas.

268

XIANWU GUO-ZHOU Y MIGUEL A. REYES-LÓPEZ

con la fuente de ionización, a menudo se mantienen bajo alto vacío; lo anterior para proporcionar iones en una buena condición de viajar de un extremo al otro del instrumento, sin ningún obstáculo de moléculas en el aire.

Microarreglos de proteínas Los microarreglos de proteínas o chips de proteínas, son constituidos, normalmente, de un soporte de vidrio en el que diferentes moléculas de proteína se han colocado en diferentes lugares conocidos, de una manera ordenada, formando un conjunto microscópico de sondas. Los microarreglos de proteínas han surgido como un enfoque prometedor para una amplia variedad de aplicaciones, incluyendo la identificación de las interacciones proteína-proteína, interacciones proteína-fosfolípidos, de los blancos proteicos para moléculas pequeñas y de los sustratos de las proteínas, como las cinasas. También se pueden utilizar para diagnósticos clínicos y la vigilancia de estados de enfermedades. Los dos tipos más común de microarreglos de proteínas que se utilizan actualmente para estudiar las actividades bioquímicas de las proteínas son: a) los microarreglos analíticos y b) los microarreglos funcional. a) Los microarreglos analíticos se usan típicamente para analizar el perfil de una mezcla compleja de proteínas, con el fin de medir las afinidades, especificidades, los niveles de expresión de la proteína en dicha mezcla. Los microarreglos de anticuerpos son los más comúnmente usados. En esta técnica, se elabora previamente una biblioteca de anticuerpos, la cual es agrupada en un orden determinado sobre un portaobjetos de vidrio; entonces la matriz es cubierta con una solución de proteína. Algunas desventajas observadas en esta técnica, es que no hay anticuerpos en la mayoría de las proteínas y también se presentan problemas con la especificidad de algunos anticuerpos en preparaciones comerciales. Sin embargo, los anticuerpos siguen siendo los más caracterizados y eficaces agentes para capturar las proteínas en microarreglos de proteínas. b) Los microarreglos funcionales se diferencian de los microarreglos analíticos, en que los microarreglos funcionales se componen de arreglos que contienen a las proteínas funcionales de longitud completa o con los dominios funcionales de proteínas. Estos microarreglos de proteínas, se utilizan para estudiar la bioquímica de las actividades en todo el proteóma en un solo experimento. Para esto se utilizan en el estudio numerosas interacciones de proteínas, como la proteína-proteína, proteína-ADN, proteína-ARN, proteínas-fosfolípidos y las interacciones proteínas-moléculas pequeñas. 269

CAPÍTULO IX. PROTEÓMICA

Sistema de dos híbridos (Y2H) El Sistema de dos híbridos en levadura es una técnica de biología molecular usada para encontrar proteínas que interactúan mutuamente (Y2H, de sus siglas en inglés), lo que permite la exploración sistemática de las interacciones de proteínas. El principio de la prueba se basa en aprovechar un factor de transcripción unido a una secuencia de activación (UAS, de sus siglas en inglés) río arriba antes del marco abierto de lectura (ORF, de sus siglas en inglés) del gene, con lo cual se activará un gen reportero. Dicho factor de transcripción contiene dos fragmentos, uno llamada el dominio de unión (BD) y el dominio de activación (AD). El BD es el dominio responsable de la unión a la uas y el AD es el dominio responsable de la activación de la transcripción (Figura 6). Estos dos dominios pueden funcionar en estrecha proximidad uno a otro sin una unión directa. Esto significa que a pesar de que el factor de transcripción se divida en dos fragmentos, se puede activar la transcripción aún cuando dichos fragmentos estén indirectamente relacionados. Para lo cual es necesario construir dos plásmidos. En un plásmido, el fragmento BD se une a una proteína conocida que el investigador utiliza para identificar nuevos complejos de interacción, como un "cebo" de proteína. En otro plásmido, el fragmento de AD se une a otra proteína conocida, a una biblioteca de proteínas conocidas o en otros casos a proteínas desconocidas, la cual actúa como la cazador de proteínas. Entonces, las plásmidos de cazador y de cebo se introducen simultáneamente en la mutante cepa de levadura. Si las proteínas de cebo y de cazador interactúan (es decir, se unen), la transcripción del gen reportero (s) puede ocurrir, recordemos que AD y BD del factor de transcripción están indirectamente conectadas, con lo que el AD se encontrará en la proximidad al sitio de inicio de transcripción. En el caso de que las dos proteínas (AD y BD) no interactúen, no habrá transcripción del gen reportero. De esta manera, el éxito de la interacción entre las proteínas unidas está relacionado a un cambio en el fenotipo de células observables (por ejemplo, un cambio en el color de reacción). Este análisis se ha aplicado ampliamente en el estudio de la interacción de proteínas. Helicobacter pylori es una de las pocas bacterias, a la cual se le ha estudiado su red de interacción de proteínas en gran escala. Se probó la técnica de Y2H para detectar 261 proteínas de H. pylori en un biblioteca del polipéptidos codificados en su genoma y 1 200 interacciones involucradas en un 46.6% del proteoma. Además, este método también puede aplicarse en la identificación de la interacción entre proteínas y ADN. El organismo en el que se lleva al cabo este sistema no es una levadura, se puede adaptar a una bacteria como lo es E. coli. Esta técnica ha proporcionado algunas ventajas: 1) no es necesario purificar las proteínas para la detección de la interacción entre ellas; 2) esta interacción se realiza bajo condiciones fisiológicas, 270

XIANWU GUO-ZHOU Y MIGUEL A. REYES-LOPEZ

Dominios AD y BD, necesarios para que la transcripción se lleve al cabo

Dos dlferentes protelnas complementings se unen al dominio AD y BD y se forma un complejo

Solo si el complejo se une al AON, se llevari al Cabo la transcrlpcidndel gen reportero.

Figura 6. Componentes principales del Sistema de dos hibridos (Y2H). a) Dominios AD y BD, necesarios para que la transcripcion se lleve al cabo; b) Dos diferentes proteinas complementarias se unen al dominio AD y BD, respectivamente para la formacion de un complejo; c) Solo si el complejo se une al ADN, se lleva al cabo la transcripcion del gen reportero.

aunque la reacción se produce en células heterogéneas; 3) las interacciones transitorias e inestables pueden ser detectadas; 4) si esta técnica se combina con otro sistema denominado Sistema Gateway de Expresión, se puede aplicar para buscar las interacciones de proteínas por un ensayo llamado de alto rendimiento. Sin embargo, también existen algunas limitaciones: 1) no puede utilizar esta técnica para estudiar la auto-activación de las proteínas; 2) un alta taza de falsos positivos, debido a la sobre-expresión de proteínas, proteínas de fusión, expresión en el sistema heterólogo (levaduras) y a la sólo detección de la interacción de proteínas en el núcleo; 3) algunas proteínas pueden interactuar específicamente cuando están co-expresados en la levadura, pero en realidad nunca ocurren en la misma célula al mismo tiempo ni en el mismo lugar. 271

CAPÍTULO IX. PROTEÓMICA

Aplicaciones en el CBG-IPN En el laboratorio de Biomedicina Molecular del CBG-IPN, una de las propuestas de investigación, es analizar la interacción de proteínas en bacterias. El material experimental en el laboratorio es el uso de Helicobacter pylori, que es una bacteria patógena que infecta a más de la mitad de la población mundial. Muchas de sus proteínas están implicadas en esa patogénesis. Para comprender el mecanismo de estos genes de virulencia en los procesos de patogénesis, es necesario estudiar la función de proteínas específicas, que por lo general exige las investigaciones, tanto in vivo como in vitro. Las técnicas más comunes incluyen aquellas que se usan en el área de la ingeniería genética, como lo son: a) la purificación de proteínas; b) la electroforesis en gel de poliacrilamida; c) la electroforesis bi-dimensional; d) la purificación de afinidad tándem; e) la espectrometría de masas yf) el sistema de la dos-híbrido. Cada técnica tiene sus propias ventajas como se describió previamente en este capítulo, lo cual depende de las propiedades de las proteínas de interés y el objetivo de la investigación en particular. En muchos casos, se combinan varios métodos juntos en un proyecto para obtener un buen resultado, ese es el caso en este trabajo de investigación.

272

XIANWU GUO-ZHOU Y MIGUEL Á. REYES-LÓPEZ

Conclusiones Las proteínas son los actores de la función fisiológica celular. Información sobre la estructura y función de proteínas es la base para entender el mecanismo de la vida. Sin embargo, un fenotipo necesita una gran cantidad de proteínas que participen, cooperen, de su conformación, de su modificación y de su localización subcelular, con lo cual es posible afrontar los diferentes procesos o actividades de la célula. Por lo que se puede observar que el proteóma de una célula es mucho más complicado que el genoma y por lo tanto más difícil de estudiar. La proteómica es un campo en rápido desarrollo en la Biología. No sólo es aplicado en la investigación en ciencias básicas de la vida, sino también es una de las herramientas más eficaces para buscar biomarcadores de enfermedades, como el cáncer, y búsqueda de proteínas blanco para la detección de potenciales fármacos. Muchas técnicas se han desarrollado para las investigaciones en proteómica. Sin embargo, cada una de las técnicas tiene sus propios méritos en la práctica y un método general como el caso de la investigación genómica no se tiene. Por lo tanto, es importante, no sólo para desarrollar nuevas tecnologías, sino también el poder utilizar la combinación de tecnologías existentes. Además, la proteómica entrecruzada con la genómica, la metabolómica y la bioinformática, importantes elementos del contenido de la biología de un sistema vivo, proporciona un nuevo modelo de investigación.

273

CAPÍTULO IX. PROTEÓMICA

Bibliografia Berth, M.; Moser, F. M.; Kolbe, M.; Bernhardt, J. (2007), The state of the art in the analysis of two-dimensional gel electrophoresis images, Appl. Microbiol. Biotechnol,76:1223-1243. Bohm, H. J.; Schneider, G.; Mannhold, R.; Kubinyi, H.; Folkers, G. (2003), ProteinLigand Interactions: From Molecular Recognition to Drug Design (Methods and Principles in Medicinal Chemistry), New York, Wiley-VCH. Creighton, T. E. (1992), Proteins: Structures and Molecular Properties, 2da Ed., San Francisco, USA, W. H. Freeman. Doyle, S. A. (2008), High Throughput Protein Expression and Purification: Methods and Protocols (Methods in Molecular Biology), New York, Humana Press. Hall, D. A.; Ptacek, J.; Snyder, M. (2007), Protein microarray Technology, Mech. Ageing Dev., 128: 161-167. Howard, J. (2001), Mechanics of Motor Proteins and the Cytoskeleton, New York, Sinauer. Khalsa-Moyers, G.; Hayes, W. (2006), Developments in mass spectrometry for the analysis of complex protein mixtures, Brieffings Funct. Genomics and Proteomics, 5: 98>-lll. Lesk, A. M. (2004), Introduction to Protein Science: Architecture, Function, and Genomics, New York, Oxford University Press. Patthy, L. (2007), Protein Evolution, 2nd Ed., New York, Wiley-Blackwell. Puig, O.; Caspary, F.; Rigaut, G.; Rutz, B.; Bouveret, E.; Bragado-Nilsson, E.; Wilm, M.; Seraphin, B. (2001), The tandem affinity purification (TAP) method: a general procedure of protein complex purification, Methods, 24: 218-229. Roe, S. (2001), Protein Purification Techniques: A Practical Approach (Practical Approach Series), 2nd Ed., New York, Oxford University Press. Scopes, R. K. (1993), Protein Purification: Principles and Practice, 3rd Ed., London. Seraphin, B.; Puig, O.; Bouveret, E.; Rutz, B.; Caspary, F. (2002), Tandem Affinity Purification to Enhance Interacting Protein Identification. Protein—Protein Interactions: A Molecular Cloning Manual, Cold Spring Harbor Laboratory Press, Chapter 17, pp. 313-328. Simpson, R. J.; Adams, P. D.; Golemis, E. A. (2008), Basic Methods in Protein Purification and Analysis: A Laboratory Manual, Cold Spring, USA, Cold Spring Harbor Laboratory Press. Tropp, B. E. (2007), Molecular Biology: Genes to Proteins, 3rd Ed., New York, Jones & Bartlett Publishers. Van Criekinge, W.; Beyaert, R. (1999), Yeast Two-Hybrid: State of the Art, Biol. Proc. Online, 2: 1-38. Walsh, G. (2001), Proteins: Biotechnology and Biochemistry, 2nd Ed., New York, Wiley. Whitford, D. (2005), Proteins: Structure and Function, New York, Wiley. 274

Resumen del libro de fundamentos de la biotecnología genómica

L

a biotecnología, una de las áreas de mayor interés y desarrollo de la ciencia en México, normalmente tiene como bibliografía a los artículos y libros en idioma Inglés. Cabe resaltar que el acervo de estos temas de biotecnología y genómica, no se abordan comúnmente en el idioma Español, lo que trae como consecuencia, que varios niveles de la educación en México, tengan contratiempos en la forma de "traducir" y entender el concepto de los términos, definiciones, métodos y técnicas en esta área. Debido a esta carencia de textos, en este libro los temas abarcan desde la estructura de los ácidos nucleicos, de las proteínas y otras macromoléculas, pasando por sus principales descubrimientos, principios, los aportes en esas áreas y finalizando con las técnicas de estudio tradicionales de la biología molecular y de ejemplos de la ingeniería genética. Un área que se consideró, fue la naciente área de Bioinformática, que en nuestro país se desarrolla cada día con mayor interés y de lo cual este libro aborda sus puntos principales. Sobre todo las aplicaciones y principios que rigen los modelos matemáticos usados en la biotecnología genómica. Finalmente, el libro se establece como un esfuerzo del Estado de Tamaulipas a través de su órgano de ciencia y tecnología, que es el Cotacyt, unidos al Centro de Biotecnología Genómica (CBG) del Instituto Politécnico Nacional en Reynosa, Tamaulipas y Plaza y Valdés Editores, para contribuir al entendimiento y promoción de las bases de la biotecnología genómica en México. Además sirva el libro como una contribución de los 10 años del CBG en la frontera de la biotecnología.

275

Autores Miguel Ángel Reyes López Es profesor titular de tiempo completo y exclusivo del Centro de Biotecnología Genómica del Instituto Politécnico Nacional en Reynosa, Tamaulipas. Es Químico Bacteriólogo y Parasitólogo de la Escuela Nacional de Ciencias Biológicas (ENCB) del IPN. Maestría en Bioquímica y Doctorado en Ciencias Químico-Biológicas ambos de la ENCB-IPN. SU estancia doctoral de 1998 a 2000, la realizó en Oak Ridge National Laboratrory, Oak Ridge, TN, USA, dependiente del Departamento de Energía de los Estados Unidos de América. Dentro de sus cargos destacan los cargos de Subdirector Académico y de Investigación y la Jefatura de Gestión de Proyectos, ambos del CBG-IPN. Coordinó los trabajos conducentes al programa de maestría y su ingreso al mp-Conacyt en 2005. Ha dirigido tesis de maestría en Cinvestav y doctorado en la ENCB-IPN (2 con mención honorífica). Actualmente es encargado del Laboratorio de Medicina de Conservación y coordinador de la materia de posgrado presencial y a distancia "Introducción a la bioética". Su investigación ha sido financiada por instancias de México y el extranjero. Becario COFAA y EDI del IPN. Miembro de la Academia Tamaulipeca de Investigación Científica y Tecnológica A. C, miembro fundador de la Asociación Mexicana de Bioseguridad, Miembro fundador de International Foundation For Biotechnology Research & Early Stimulation In The Culture Of Health, Nutrition, Sport, Art, Science, Technology & Society., miembro Fundador de la Red de Biotecnología del IPN.

José Luis Hernández Mendoza Es biólogo egresado de la Facultad de Ciencias Biológicas de la UANL y tiene un doctorado en Ciencias en Ciencias Biológicas, otorgado por la Universidad de Ciencias y Técnicas del Languedoc, Montpellir, Francia. 277

FUNDAMENTOS DE LA BIOTECNOLOGÍA GENÓMICA

Labora desde el año 2001 el Centro de Biotecnología Genómica del IPN en Reynosa, Tamps, donde es profesor titular B, del cual fue Subdirector de Vinculación (20012003) y Director (2003-2007). Ha dirigido y dirige tesis de licenciatura posgrado dentro y fuera del IPN. Ha colaborado en el establecimiento y actualización de programas de maestría y doctorado y diversos proyectos de investigación aplicada en el área de la incorporación de desarrollos biotecnológicos en agricultura. Ha participado en la difusión de la ciencia, programa "emprendedores" y la creación de nuevas empresas de base tecnológica. Actualmente es profesor titular de tiempo completo y exclusivo del Centro de Biotecnología Genómica del Instituto Politécnico Nacional en Reynosa, Tamaulipas y responsable del Laboratorio de Biotecnología experimental.

Netzahualcóyotl Mayek Pérez Es maestro y doctor en ciencias especialista en Genética por el Colegio de Posgraduados en Ciencias Agrícolas de Montecillo, México y es profesor titular de tiempo completo y exclusivo del Centro de Biotecnología Genómica del Instituto Politécnico Nacional en Reynosa, Tamaulipas. Su investigación se enfoca principalmente a la aplicación de marcadores moleculares de ADN para el análisis de plantas y hongos de interés económico así como al estudio de la interacción planta-mircoorganismo, con énfasis en hongos fitopatógenos del frijol común. Pertenece al Sistema Nacional de Investigadores nivel 1 desde 1998 y actualmente es becario COFAA-IPN y EDI-IPN. ES autor/coautor de 64 artículos científicos en revistas indizadas; 24 notas científicas; 93 participaciones en congresos nacionales/internacionales y ocho artículos in extenso en eventos científicos. Además es coautor de dos capítulos de libro y co-editor de un libro de memorias de congreso nacional así como de un libro. Es editor/arbitro de revistas científicas nacionales e internacionales y ha sido evaluador de proyectos de investigación de diversos fondos de México y el extranjero. Su investigación ha sido financiada por donativos de instancias de México y el extranjero. Ha dirigido/ codirigido la tesis de dos licenciados, ocho maestros y un doctor en ciencias de diferentes instituciones y, actualmente, dirige la tesis de un alumno de licenciatura, dos de maestría y seis de doctorado. Profesor a nivel pregrado (17 cursos), especialidad médica (dos cursos) y posgrado (37 cursos), ha ganado el premio Ramón Naranjo Jiménez 2005 otorgado por la Academia Tamaulipeca de Investigación Científica y Tecnológica A. C. y el Premio a la Investigación 2007 del Instituto Politécnico Nacional. Una tesis de licenciatura y cuatro de maestría dirigidas por él han sido premiadas por ATICTAC como las mejores en Tamaulipas en 2008 y de 2005 a 2009, respectivamente. Una tesis de maestría además ganó el premio Agrobio 2007 a las mejores tesis en Biotecnología en México. 278

FUNDAMENTOS DE LA BIOTECNOLOGÍA GENÓMICA Miguel Ángel Reyes-López se terminó de imprimir en mayo de 2011, en los talleres de Grupo H Impresores, Sabino #12, Col. El Manto, Iztapalapa, C.P. 09830, México, D.F.

Su tiraje fue de 1 000 ejemplares, más sobrantes de reposición.

ERRNVPHGLFRVRUJ