Portada | Archivo | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones

La determinación de la estructura de proteínas
en la era genómica

Modesto Orozco 05/07/00

Biomedia (Barcelona). La historia recogerá que en junio del año 2000, con la presentación del primer borrador del genoma humano se abrió la era genómica*. Toda la prensa ha enfatizado la relevancia de este logro, lo que enmascara el hecho de que, en realidad, la secuenciación del genoma humano per se tiene un limitado impacto científico. La verdadera transcendencia del proyecto genoma vendrá del procesado de la ingente cantidad de información obtenida. El salto cuantitativo en nuestra capacidad de comprensión del ser humano se producirá cuando se caractericen los genes y se determinen las estructuras primarias y terciarias de las proteínas por ellos codificadas.

La localización de genes*, regiones intrónicas* (sin significado) y exónicas* (con significado) en la secuencia del DNA* es una tarea titánica, pero sin duda más sencilla que trasladar la información lineal de la secuencia génica en información estructural (tridimensional) de las proteínas*. Sabemos que la estructura tridimensional de una proteína está codificada en su secuencia de aminoácidos*, pero después de décadas hemos sido incapaces de descifrar este código. Es decir, no podemos, por simple inspección de la secuencia polipeptídica*, determinar la estructura, función y pautas de interacción de una proteína. No somos capaces, por lo tanto, de diseñar pautas para la modulación de las posibles actividades anómalas de una proteína, lo que limita enormemente nuestra capacidad de diseñar nuevos fármacos.

Ante la dificultad de descifrar la segunda parte del código genético* (la que traslada secuencia en estructura tridimensional*), la genómica estructural está adoptando dos estrategias paralelas. Por un lado se están potenciando iniciativas para la obtención masiva de estructuras tridimensionales por técnicas de difracción de rayos X y resonancia magnético-nuclear de muy alto campo. Por otro lado, la bioinformática* está perfeccionado técnicas teóricas que permitan obtener aproximaciones razonables a la estructura tridimensional de las proteínas a partir de su secuencia. Estos modelos tridimensionales teóricos, aun no siendo totalmente correctos, pueden representar herramientas útiles en áreas como la del desarrollo farmacéutico, donde la propia dinámica de la investigación hace imposible asumir el tiempo necesario para la resolución experimental de una estructura.

Las técnicas bioinformáticas de predicción de estructuras se basan en dos aproximaciones diferentes, pero complementarias. Los métodos físicos y los métodos estadísticos. Los primeros aplican las leyes básicas de la fisicoquímica para predecir trayectorias de plegamiento de las proteínas. El método físico más potente es, sin duda, la dinámica molecular, una técnica basada en una aplicación rigurosa de las leyes de la mecánica newtoniana, que tiene la capacidad teórica de predecir el plegamiento de las proteínas basándose en primeros principios. Desgraciadamente, en la práctica, el método está limitado por la necesidad de representar simultáneamente movimientos de escalas temporales muy diversas (desde 10-12 hasta 102 segundos). Esto complica su uso en el estudio de trayectorias largas como las necesarias para representar el plegamiento de proteínas. Los trabajos más sofisticados publicados hasta la fecha presentan trayectorias que cubren solo la primera milésima del proceso de plegamiento. Este período es reducido, pero aún así mil veces mayor que el que se podía estudiar hace solo tres años. Este aumento en la capacidad de simulación, y el hecho que el plegamiento ab initio de proteínas sea considerado como el reto de la futura generación de superordenadores, hace ser optimista sobre el futuro de estas metodologías de cálculo riguroso masivo.

Las técnicas estadísticas están basadas en la observación empírica de que secuencias polipeptídicas similares adoptan estructuras tridimensionales muy simulares. Así, analizando las bases de datos de estructuras se pueden extraer reglas que permiten obtener una primera aproximación a la estructura tridimensional a partir de la secuencia. Por ejemplo, si conocemos las estructuras tridimensionales de un enzima en una serie de simios se podrá inferir con cierta confianza cuál será la estructura del enzima en humanos. Si tras el análisis de las bases de datos tridimensionales de proteínas se constata que un determinado residuo se encuentra casi siempre en una hélice* a, es muy probable que también sea el caso en la proteína problema. Si tras un análisis de las bases de datos descubrimos que una cierta secuencia de aminoácidos se encuentra siempre formado un determinado motivo estructural, es razonable pensar que la presencia de esa misma secuencia en una proteína problema debe implicar la existencia del correspondiente motivo estructural.

Al emplear una compleja serie de reglas empíricas se puede llegar a predecir con mucha precisión la estructura de proteínas homólogas, o bien detalles a menudo importantes de elementos estructurales. No obstante, las técnicas estadísticas no son tan potentes para determinar estructuras globales de proteínas que muestran bajos niveles de homología con las proteínas de estructura conocida. La expansión de las bases de datos de estructuras tridimensionales de proteínas permitirá, sin duda, aumentar la precisión y marco de actuación de esta familia de técnicas. Por último, la combinación de métodos y algoritmos físicos con potenciales estadísticos está abriendo una nueva frontera en la predicción teórica del plegamiento de las proteínas. Estas técnicas mixtas, en plena fase de desarrollo, pueden convertirse en la herramienta final para atacar uno de los problemas más difíciles, pero a la vez más apasionantes que se vislumbra en el horizonte de la era genómica.

Modesto Orozco es profesor del departamento de Bioquímica y Biología Molecular, de la Facultad de Química de la Universidad de Barcelona

* Para obtener la definición de los términos marcados, ver el glosario de Biomedia.

Arriba

Portada


Archivo | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones

(C) BIOMEDIA es una publicación del OCC (UPF) y RUBES EDITORIAL