Portada | Dossier | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones

El genoma humano y la medicina del siglo XXI

Manuel Palacín 25/05/01

Biomedia (Barcelona). Con motivo de la exposición “Gente y genes”, coorganizada entre el Instituto de Cultura de Barcelona, el Consorcio Residencia de Investigadores CSIC-Generalitat de Catalunya y Novartis, se organizó un ciclo paralelo de conferencias. La primera fue impartida por el profesor Manuel Palacín, catedrático de Bioquímica de la Universidad de Barcelona.

El descubrimiento de la estructura del DNA* por James Watson y Francis Crick en 1953, fue el primer paso para la era de la secuenciación del genoma humano*. Este camino se ha seguido casi hasta el final, en junio del año 2000. Se puede fijar la fecha de 1985 como inicio de este largo camino: el Departamento de Estado de Ciencia y Energía de Estados Unidos realiza una reunión en Santa Cruz donde se propone como objetivo plausible la secuenciación del genoma humano. En 1991 se comienza a destinar fondos públicos para este fin. Entre 1992 y 1995 se realizan mapas físicos y de recombinación* genética con marcadores situados en los cromosomas humanos (22 cromosomas autosómicos más los dos que confieren el carácter sexual, los cromosomas X e Y); un buen símil de estos marcadores genéticos* es el de los mojones de una carretera, ya que identifican una determinada posición en la misma. El 98% del mapa físico del genoma humano se logra en 1997. La secuenciación a gran escala del genoma comienza alrededor de 1996 con la incorporación de la bioinformática*, que permite el desarrollo de paquetes informáticos para el ensamblaje de secuencias genómicas. Simultáneamente se comienza a coleccionar genes* (fragmentos del genoma que se expresan), a posicionarlos en los cromosomas y a estudiar en qué tejidos se expresan. Actualmente se han descrito unos 40 000. Alrededor de 1999 se comienza a desarrollar a gran escala la descripción de las variantes polimórficas de la secuencia humana: cambios de secuencia de un nucleótido* (SNP*) que son la base molecular de la variabilidad del genotipo* de nuestra especie. Entre 1999 y 2000 se logra la secuenciación completa de los dos cromosomas más pequeños, el 22 y el 21. Tras el borrador de la secuencia del genoma humano anunciado durante el 2000, se espera la finalización de este proceso para finales de este año.

En la tarea de secuenciación del genoma humano han participado directamente más de 1000 investigadores. Los personajes más importantes han sido James Watson (quien inició el proyecto público), Francis Collins (director actual del proyecto público), Eric S. Lander (director del Whitehead Institute/ MIT Center for Genome Research, Cambridge, MA, EEUU) (este instituto ha secuenciado el 30% del genoma) y Craig Venter (de Celera Genomics). Finalmente, merece especial mención la gran protagonista de esta historia, la humanidad. No olvidemos que estamos hablando de la secuenciación del genoma de nuestra especie.

La estrategia del proyecto público del genoma humano (HGP) ha sido parsimoniosa, exhaustiva; primero se seleccionan los segmentos solapantes a secuenciar, después se dividen los cromosomas en pequeños trozos, y, finalmente, se secuencia cada uno de los fragmentos. Con la ayuda de mapas genéticos*, se ensambla la secuencia total. La estrategia de Celera ha sido más rápida: se rompen los cromosomas en fragmentos muy pequeños y solapantes, se secuencian sólo los extremos de estos fragmentos (shotgun) y, con una enorme capacidad de cálculo y de comparación de secuencias informativas, se ensamblan los trozos, y se obtiene la secuencia completa.

En el tránsito para secuenciar el genoma humano completo, se han alcanzado ya ciertos hitos, como puede ser la identificación de algunos genes de enfermedades monogénicas* o el desarrollo de herramientas y estrategias de investigación. Tanto el programa público como la actividad privada han contribuido a este enriquecimiento. Así, el proyecto público ha desarrollado marcadores a lo largo de todo el genoma, que han servido, por ejemplo, para localizar los genes responsables de casi 400 enfermedades hereditarias. La estrategia de Venter aplicada a los fragmentos de genoma que se expresan en las células (mRNA*; véase más adelante) ha permitido conocer en forma de borrador la secuencia de 30 000 a 40 000 genes. Estas secuencias borrador se conocen como EST (Expressed Sequence Tags). El otro gran desarrollo tecnológico originado a causa de la secuenciación de genomas es el de la bioinformática. Así, paquetes informáticos permiten identificar genes en las bases de datos por comparación de secuencias, y de esta forma conocer rápidamente su posición en el genoma y su expresión en determinados tejidos o células. Últimamente ya es frecuente identificar de esta manera el gen responsable de una enfermedad hereditaria. Podemos decir, pues, de forma coloquial que “el gen de la lisinuria con intolerancia proteica se identificó en la red”.

Los SNP, antes mencionados, son otra de las herramientas que debemos a la secuenciación del genoma humano, en realidad a la secuenciación del genoma de varias personas. La secuenciación en paralelo del genoma de distintas personas ha permitido identificar variantes en la secuencia. Los genes son secuencias de bases nucleicas y una mutación* supone una variación en una de estas bases. El código genético combina tres bases, que se traducen a un aminoácido*. Y no es lo mismo que varíe la primera, la segunda o la tercera base; un cambio en la secuencia puede cambiar la forma de la proteína* o no, según varíe la primera, la segunda o la tercera base. Es decir, no por fuerza el cambio de una base genera lesión, puede generar también un polimorfismo*. Las personas no somos idénticas en nuestro genoma (además de tampoco serlo en el ambiente en que hemos crecido). Se calcula que la diferencia genética entre dos personas es menor del 99,9%. Como nuestro genoma tiene aproximadamente 3000 millones de bases, el 0,01% de diferencia representa 3 millones de potenciales variantes entre dos personas. Estos SNP son la base molecular de la farmacogenómica (véase más adelante).

La secuencia del genoma humano es una colección de letras (las que representan a las bases nucleicas). Si las escribimos en Times cuerpo 6, en una hoja A4 caben 3*103 bases, por tanto, para completar el genoma humano, se necesita un millón de hojas A4 de papel, que terminan llenas de letras. ¿Qué sentido tiene toda esta información?

El gran axioma de la biología molecular simplificado es el paso de un gen a una proteína*, pero los genes no están reconocidos claramente en el genoma. En realidad, en la totalidad de la secuencia en la que se inscribe un gen, hay fragmentos con sentido (exones*) y fragmentos sin sentido (intrones*). El paso intermedio es la obtención del mRNA* por un proceso de transcripción (copia del DNA a RNA) y de ayustamiento ( eliminación de los intrones y unión de los exones; “splicing” en inglés). Para pasar del mRNA a la proteína, la molécula realmente funcional, se sigue un proceso de traducción* según el código genético. Finalmente, la proteína se pliega, adopta su forma funcional; no en vano su nombre deriva del dios griego Proteus (el de las mil formas), porque lo más importante de una proteína es su estructura tridimensional, que condiciona su interacción con otras moléculas, incluidas otras proteínas.

Todas las células tienen la misma información, pero en cada una ellas se expresa solamente una parte del genoma; los cabellos son muy distintos de las neuronas o de los fibroblastos de la piel. A pesar de disponer de un borrador de la secuencia del genoma humano, todavía quedan muchos problemas por resolver, no conocemos todavía cuántos genes tenemos en el genoma (el panorama puede oscilar desde 30 000 hasta 100 000), dónde y cuando se expresan, cuál es la estructura de las proteínas que codifican, y cuál es su función.

La bioinformática va a jugar un papel clave en la resolución de estos problemas. En los años setenta, el artículo bibliográfico más citado era el que describía el método de Lowry para determinar y cuantificar proteínas de preparaciones. Con el tiempo, otra técnica tomó el relevo: el método de Western blot, por el que, entre un conjunto de proteínas se identifica una sola. Ahora, el artículo más citado es el que describe un paquete informático, un algoritmo (BLAST, de Basic Local Alignment Search Tool), que nos permite, a partir de una determinada secuencia de un gen, encontrar otras parecidas en las bases de datos genéticas. Porque, si se parecen mucho, es probable que actúen igual, que sean genes de la misma familia de los que ya conozcamos algunas características. Otros paquetes informáticos intentan predecir la estructura de proteínas o si una determinada secuencia del genoma es un gen. Hoy los mejores predictólogos confiesan que cuando intuyen en qué fragmento de genoma hay un gen, aciertan en el 50% de las veces.

Para saber qué función tienen determinados genes (e intentar responder a nuestra segunda gran cuestión), podemos utilizar modelos celulares o modelos animales que se parezcan mucho a nosotros. Podemos utilizar, por ejemplo, un gusano que se ha hecho famosísimo, Caenorhabditis elegans; de él se conocen todas las células que componen su organismo, están contadas. Además conocemos el genoma de este gusano desde 1998. Desde el pasado mes de marzo, conocemos el genoma de la mosca de la fruta (Drosophila melanogaster). ¿Dónde reside la importancia de estos modelos?

Una tercera parte de las proteínas de los genes del gusano son similares a las humanas, se puede eliminar un gen del gusano y estudiar qué pasa. Hoy en día conocemos la base molecular de 300 enfermedades monogénicas, de las 6000 que se pueden calcular. El 60% de estos genes está representado en el genoma de la mosca. La secuencia de la levadura (Saccharomyces cerevisiae) se conoce desde 1996, el 38% de sus genes también tienen su homólogo en humanos. Con el ratón compartimos el 90% de los genes. No cabe duda que estudiar el genoma de estos organismos puede ser muy útil para conocer el genoma humano.

Antes hemos hablado de 30 000 a 100 000 genes, 3 millones de SNP, etc. Son cifras que marean. Para afrontar con eficacia el estudio del genoma humano tras su secuenciación necesitamos estrategias de análisis masivas. Algunas de estas estrategias como la genómica funcional* o la proteómica* ya son operativas. La genómica funcional nos permite estudiar la expresión de los genes en las células o en los tejidos de forma masiva, no de uno en uno, sino de miles en miles. Para ello utilizamos miles de genes inmovilizados en una matriz (DNA microarrays o DNA chips* en inglés). Esto permite mostrar el patrón del nivel de expresión de miles de genes en un tejido en particular, de una persona, en particular en un momento particular. Alguien ha comparado esta nueva visión (el nivel de expresión de miles de genes en un tejido) con la visión de Galileo de miles de estrellas en el firmamento a través del telescopio. ¿Qué información útil podemos extraer del patrón de expresión de miles de genes al unísono?.

Este patrón deviene la “firma génica” del estado de una célula o un tejido. Un ejemplo de la genómica funcional en 1999 ha sido revelador. Su aplicación al estudio de unos tipos de cáncer de células sanguíneas (linfomas) ha permitido su reclasificación en subtipos. Antes, estas clasificaciones se basaban en estudios morfológicos y de la expresión de unos pocos genes. La clasificación basada en la genómica funcional permite una predicción del pronóstico del curso de la enfermedad muy superior a las clasificaciones anteriores. Otro ejemplo, se ha descubierto que en los tumores de mama se expresan aproximadamente unos cuatro mil genes, trescientos exclusivamente en el tumor. El conocimiento de estos genes específicos del tumor abre las puertas a nuevas terapias basadas en la inhibición de la acción de estos genes.

Si al estudio masivo de los genes de un genoma lo llamamos genómica*, al estudio masivo de las proteínas lo llamamos proteómica. A partir de la secuenciación del genoma humano, ahora se pretende estudiar la estructura y función de todas las proteínas codificadas por el genoma. De los 40 000 que se han identificado, solamente se conoce la función y estructura de las proteínas de menos de un 10%. De una tercera parte de los genes conocemos la función de sus proteínas, de otra tercera parte sospechamos la función, y del tercio restante lo desconocemos todo. Conocer la estructura y función de las proteínas significa poder diseñar moléculas que activen o inactiven una proteína. Si esta proteína es una diana terapéutica podemos diseñar fármacos nuevos. Realicemos un pequeño cálculo. Supongamos que tenemos unos 100 000 genes; como muchos genes dan lugar a variantes (por ejemplo, variantes en el ordenamiento de los exones del gen), si calculamos que tenemos tres variantes de media por gen, podemos suponer que tendremos 300 000 proteínas distintas en nuestro proteoma*. Las proteínas interactúan unas con otras para realizar sus funciones. Si cada proteína puede realizar 8 interacciones de promedio, tenemos casi 3 millones de interacciones entre proteínas. Cada interacción es una diana farmacológica potencial. Se han desarrollado estrategias como la del “doble híbrido” que identifica interacciones entre proteínas. De hecho, esta estrategia ya se ha utilizado de forma masiva para identificar todas las interacciones del proteoma de la bacteria que provoca úlcera gástrica. Estas estrategias son pues muy útiles, pero generan mucha información. En el futuro se va a generar una inmensa cantidad de datos sobre proteínas.

Con la farmacogenética* (o “farmacología a la carta”), que también deriva del conocimiento del genoma humano y se incluye en las posibilidades médicas previstas para el siglo XXI, se pretende mejorar toxicidad y eficacia del tratamiento. Ya hemos mencionado que existen 3 millones de polimorfismos SNP. ¿Qué importancia tienen estos polimorfismos? Se puede tomar una población humana y estudiar qué diferencias presentan las personas individualmente frente al tratamiento con un determinado fármaco. Se puede administrar una misma dosis y ver qué genotipo (qué variantes de SNP) de la población se asocia con determinado riesgo de toxicidad, y así ajustar la dosis según los grupos de población. En realidad, no pertenece tanto al futuro, las empresas farmacéuticas ya trabajan activamente en este campo. Los SNP también van a ser la herramienta que permita identificar los genes que confieren susceptibilidad a padecer enfermedades de origen multigénico, las enfermedades que más preocupan a nuestra sociedad: diabetes, enfermedades coronarias, obesidad, etc. De nuevo todos estos estudios van a generar mucha información. ¿Cómo manejarla?

La bioinformática es la materia llamada a resolver el problema derivado de la ingente cantidad de información en la era posgenoma. Se necesitan paquetes informáticos para tratar esta gran cantidad de datos que nos ayuden a conocer la secuencia del genoma, la estructura de las proteínas, la función de las proteínas, y algo que comienza a ser cada vez más importante, la lectura de la bibliografía. En efecto, en publicaciones de biomedicina, se están alcanzando datos notables: se han publicado once millones de artículos biomédicos. En consecuencia, empieza a ser relevante poder distinguir los artículos que se publican sobre cada tema concreto, y un paquete informático de gestión bibliográfica integrado con las bases de datos de la era posgenoma (genes, estructura de proteínas, interacción entre proteínas, SNP, etc.) es cada vez más necesario.

¿Cómo es que España no intervino en la secuenciación del genoma humano? Por falta de interés político. A pesar de ello, grupos de investigación españoles han participado en el proyecto de la secuenciación de la levadura (Saccharomyces cerevisiae) y en el de la planta Arabidopsis, y también se han descrito diez genes de enfermedades hereditarias. Es de esperar que España sí participe en la revolución posgenoma, la del genoma humano y de otras especies de interés patológico o industrial.

La medicina ha pasado de ser un arte a ser preventiva; ahora se pretende que sea predictiva. A lo largo de la historia de la humanidad, la esperanza de vida ha cambiado; en el primer tercio del siglo XX había barrios en Madrid con una gran mortalidad infantil (grupos que seguían la estrategia de la r*), mientras que había otros barrios que tenían pocos hijos y la mayoría sobrevivían (seguían la estrategia de la K*). Unos barrios y otros tenían curvas de mortalidad características de especies distintas. En pocos años se ha conseguido estirar esta curva de mortalidad hacia la supervivencia máxima, cada vez menos poblaciones humanas siguen la estrategia de la r. Sólo la siguen los desheredados de la tierra. Con la aplicación de nuevas tecnologías, como la posibilidad de utilizar stem cells para producir órganos y realizar transplantes, todavía se va a estirar más la curva hacia el límite de máxima supervivencia, disminuyendo la mortalidad. Y aún hay quien se hace la siguiente pregunta: ¿estiraremos la esperanza de vida hasta alcanzar el límite de la inmortalidad?

Según Eudald Carbonell, paleontólogo del equipo director de la excavación de Atapuerca, lo que define a la humanidad es la técnica; cuánta más técnica hemos tenido, más humanos hemos sido. Hay que implicar a la sociedad en todos sus niveles en la revolución biotecnológica, ya que las nuevas técnicas nos atañen a todos y nos hacen más humanos. Además es perentorio extender esta revolución a toda la humanidad.

Manuel Palacín es catedrático de Bioquímica de la Universidad de Barcelona

* Glosario de Biomedia

Más información en Biomedia:
Dossier: Genética y genoma humano
Ordenadores para descifrar el secreto de la vida. Miriam Peláez (2/02/01)
Los alimentos transgénicos: miel o veneno. Maria Roura (08/11/00)
Organismos clónicos: ¿qué diferencia hay entre Dolly y una oveja que pasta en los prados de los Pirineos? Míriam Peláez (13/12/00)
Las nuevas vacunas del siglo XXI: inocuas y eficaces. Miriam Peláez (22/11/00)
Genes, herencia y salud. Miriam Peláez (19/01/01)

Más información en la red:
Genoma humano, proyecto público: http://www.ornl.gov/hgmis/project/about.html

Arriba

Portada


Dossier | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones

(C) BIOMEDIA es una publicación del OCC (UPF) y RUBES EDITORIAL