|
|||
| Portada | Dossier | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones El genoma humano y la medicina del siglo XXI
Biomedia (Barcelona).
Con
motivo de la exposición “Gente y genes”, coorganizada entre el Instituto de Cultura de Barcelona, el Consorcio
Residencia de Investigadores CSIC-Generalitat de Catalunya y Novartis, se organizó un ciclo paralelo de
conferencias. La primera fue impartida por el profesor Manuel Palacín,
catedrático de Bioquímica de la Universidad de
Barcelona. El descubrimiento
de la estructura del DNA* por James Watson y
Francis Crick en 1953, fue el primer paso para la era de la secuenciación del
genoma humano*. Este camino se ha
seguido casi hasta el final, en junio del año 2000. Se puede fijar la fecha de
1985 como inicio de este largo camino: el Departamento de Estado de Ciencia
y Energía de Estados Unidos realiza una reunión en Santa Cruz donde se propone como
objetivo plausible la secuenciación del genoma humano. En 1991 se comienza a
destinar fondos públicos para este fin. Entre 1992 y 1995 se realizan mapas
físicos y de recombinación* genética
con marcadores situados en los cromosomas humanos (22 cromosomas autosómicos
más los dos que confieren el carácter sexual, los cromosomas X e Y); un buen
símil de estos marcadores genéticos*
es el de los mojones de una carretera, ya que identifican una determinada
posición en la misma. El 98% del mapa físico del genoma humano se logra en
1997. La secuenciación a gran escala del genoma comienza alrededor de 1996 con
la incorporación de la bioinformática*,
que permite el desarrollo de paquetes informáticos para el ensamblaje de
secuencias genómicas. Simultáneamente se comienza a coleccionar genes* (fragmentos del genoma que se expresan), a
posicionarlos en los cromosomas y a estudiar en qué tejidos se expresan.
Actualmente se han descrito unos 40 000. Alrededor de 1999 se comienza a
desarrollar a gran escala la descripción de las variantes polimórficas de la
secuencia humana: cambios de secuencia de un nucleótido* (SNP*) que
son la base molecular de la variabilidad del genotipo* de nuestra especie. Entre 1999 y 2000 se
logra la secuenciación completa de los dos cromosomas más pequeños, el 22 y el
21. Tras el borrador de la secuencia del genoma humano anunciado durante el 2000,
se espera la finalización de este proceso para finales de este año. En la tarea de
secuenciación del genoma humano han participado directamente más de 1000
investigadores. Los personajes más importantes han sido James Watson (quien
inició el proyecto público), Francis Collins (director actual del proyecto público), Eric
S. Lander (director del Whitehead Institute/ MIT Center for Genome Research,
Cambridge, MA, EEUU) (este instituto ha secuenciado el 30% del genoma) y Craig
Venter (de Celera Genomics). Finalmente,
merece especial mención la gran protagonista de esta historia, la humanidad. No
olvidemos que estamos hablando de la secuenciación del genoma de nuestra
especie. La estrategia del
proyecto público del genoma humano (HGP) ha sido parsimoniosa, exhaustiva;
primero se seleccionan los segmentos solapantes a secuenciar, después se
dividen los cromosomas en pequeños trozos, y, finalmente, se secuencia cada uno
de los fragmentos. Con la ayuda de mapas genéticos*, se ensambla la secuencia total. La
estrategia de Celera ha sido más
rápida: se rompen los cromosomas en fragmentos muy pequeños y solapantes, se secuencian
sólo los extremos de estos fragmentos (shotgun) y, con una enorme capacidad
de cálculo y de comparación de secuencias informativas, se ensamblan los
trozos, y se obtiene la secuencia completa. En el tránsito para
secuenciar el genoma humano completo, se han alcanzado ya ciertos hitos, como
puede ser la identificación de algunos genes de enfermedades monogénicas* o el desarrollo de herramientas
y estrategias de investigación. Tanto el programa público como la actividad
privada han contribuido a este enriquecimiento. Así, el proyecto público ha
desarrollado marcadores a lo largo de todo el genoma, que han servido, por
ejemplo, para localizar los genes responsables de casi 400 enfermedades hereditarias.
La estrategia de Venter aplicada a los fragmentos de genoma que se expresan en
las células (mRNA*; véase más adelante) ha permitido
conocer en forma de borrador la secuencia de 30 000 a 40 000 genes. Estas
secuencias borrador se conocen como EST (Expressed Sequence Tags). El otro
gran desarrollo tecnológico originado a causa de la secuenciación de genomas es
el de la bioinformática. Así, paquetes informáticos permiten identificar genes
en las bases de datos por comparación de secuencias, y de esta forma conocer
rápidamente su posición en el genoma y su expresión en determinados tejidos o
células. Últimamente ya es frecuente identificar de esta manera el gen
responsable de una enfermedad hereditaria. Podemos decir, pues, de forma
coloquial que “el gen de la lisinuria con intolerancia proteica se identificó
en la red”. Los SNP, antes
mencionados, son otra de las herramientas que debemos a la secuenciación del
genoma humano, en realidad a la secuenciación del genoma de varias personas. La
secuenciación en paralelo del genoma de distintas personas ha permitido
identificar variantes en la secuencia. Los genes son secuencias de bases
nucleicas y una mutación* supone una variación
en una de estas bases. El código genético combina tres bases, que se traducen a
un aminoácido*. Y no es lo mismo que
varíe la primera, la segunda o la tercera base; un cambio en la secuencia puede
cambiar la forma de la proteína* o no,
según varíe la primera, la segunda o la tercera base. Es decir, no por fuerza
el cambio de una base genera lesión, puede generar también un polimorfismo*. Las personas no somos idénticas en
nuestro genoma (además de tampoco serlo en el ambiente en que hemos crecido).
Se calcula que la diferencia genética entre dos personas es menor del 99,9%.
Como nuestro genoma tiene aproximadamente 3000 millones de bases, el 0,01% de
diferencia representa 3 millones de potenciales variantes entre dos personas.
Estos SNP son la base molecular de la farmacogenómica (véase más adelante). La secuencia del
genoma humano es una colección de letras (las que representan a las bases
nucleicas). Si las escribimos en Times cuerpo 6, en una hoja A4 caben 3*103
bases, por tanto, para completar el genoma humano, se necesita un millón de
hojas A4 de papel, que terminan llenas de letras. ¿Qué sentido tiene toda esta
información? El gran axioma de
la biología molecular simplificado es el paso de un gen a una proteína*, pero los genes no están reconocidos
claramente en el genoma. En realidad, en la totalidad de la secuencia en la que
se inscribe un gen, hay fragmentos con sentido (exones*) y fragmentos sin sentido (intrones*). El paso intermedio es la obtención del mRNA* por un proceso de transcripción (copia del DNA a
RNA) y de ayustamiento ( eliminación de los intrones y unión de los exones;
“splicing” en inglés). Para pasar del mRNA a la proteína, la molécula realmente
funcional, se sigue un proceso de traducción*
según el código genético. Finalmente, la proteína se pliega, adopta su forma
funcional; no en vano su nombre deriva del dios griego Proteus (el de las mil formas), porque lo más importante de una
proteína es su estructura tridimensional, que condiciona su interacción con
otras moléculas, incluidas otras proteínas. Todas las células
tienen la misma información, pero en cada una ellas se expresa solamente una
parte del genoma; los cabellos son muy distintos de las neuronas o de los
fibroblastos de la piel. A pesar de disponer de un borrador de la secuencia del
genoma humano, todavía quedan muchos problemas por resolver, no conocemos
todavía cuántos genes tenemos en el genoma (el panorama puede oscilar desde 30 000
hasta 100 000), dónde y cuando se expresan, cuál es la estructura de las
proteínas que codifican, y cuál es su función. La bioinformática
va a jugar un papel clave en la resolución de estos problemas. En los años setenta,
el artículo bibliográfico más citado era el que describía el método de Lowry
para determinar y cuantificar proteínas de preparaciones. Con el tiempo, otra
técnica tomó el relevo: el método de Western blot, por el que, entre un
conjunto de proteínas se identifica una sola. Ahora, el artículo más citado es
el que describe un paquete informático, un algoritmo (BLAST, de Basic Local
Alignment Search Tool), que nos permite, a partir de una determinada secuencia
de un gen, encontrar otras parecidas en las bases de datos genéticas. Porque,
si se parecen mucho, es probable que actúen igual, que sean genes de la misma
familia de los que ya conozcamos algunas características. Otros paquetes
informáticos intentan predecir la estructura de proteínas o si una determinada
secuencia del genoma es un gen. Hoy los mejores predictólogos confiesan que
cuando intuyen en qué fragmento de genoma hay un gen, aciertan en el 50% de las
veces. Para saber qué
función tienen determinados genes (e intentar responder a nuestra segunda gran
cuestión), podemos utilizar modelos celulares o modelos animales que se
parezcan mucho a nosotros. Podemos utilizar, por ejemplo, un gusano que se ha
hecho famosísimo, Caenorhabditis elegans;
de él se conocen todas las células que componen su organismo, están contadas.
Además conocemos el genoma de este gusano desde 1998. Desde el pasado mes de
marzo, conocemos el genoma de la mosca de la fruta (Drosophila melanogaster). ¿Dónde reside la importancia de estos
modelos? Una tercera parte
de las proteínas de los genes del gusano son similares a las humanas, se puede
eliminar un gen del gusano y estudiar qué pasa. Hoy en día conocemos la base
molecular de 300 enfermedades monogénicas, de las 6000 que se pueden calcular.
El 60% de estos genes está representado en el genoma de la mosca. La secuencia
de la levadura (Saccharomyces cerevisiae)
se conoce desde 1996, el 38% de sus genes también tienen su homólogo en
humanos. Con el ratón compartimos el 90% de los genes. No cabe duda que
estudiar el genoma de estos organismos puede ser muy útil para conocer el
genoma humano. Antes hemos hablado
de 30 000 a 100 000 genes, 3 millones de SNP, etc. Son cifras que marean. Para
afrontar con eficacia el estudio del genoma humano tras su secuenciación
necesitamos estrategias de análisis masivas. Algunas de estas estrategias como
la genómica funcional* o la
proteómica* ya son operativas. La
genómica funcional nos permite estudiar la expresión de los genes en las células
o en los tejidos de forma masiva, no de uno en uno, sino de miles en miles.
Para ello utilizamos miles de genes inmovilizados en una matriz (DNA
microarrays o DNA chips* en
inglés). Esto permite mostrar el patrón del nivel de expresión de miles de
genes en un tejido en particular, de una persona, en particular en un momento
particular. Alguien ha comparado esta nueva visión (el nivel de expresión de
miles de genes en un tejido) con la visión de Galileo de miles de estrellas en
el firmamento a través del telescopio. ¿Qué información útil podemos extraer
del patrón de expresión de miles de genes al unísono?. Este patrón deviene
la “firma génica” del estado de una célula o un tejido. Un ejemplo de la genómica
funcional en 1999 ha sido revelador. Su aplicación al estudio de unos tipos de
cáncer de células sanguíneas (linfomas) ha permitido su reclasificación en
subtipos. Antes, estas clasificaciones se basaban en estudios morfológicos y de
la expresión de unos pocos genes. La clasificación basada en la genómica
funcional permite una predicción del pronóstico del curso de la enfermedad muy
superior a las clasificaciones anteriores. Otro ejemplo, se ha descubierto que
en los tumores de mama se expresan aproximadamente unos cuatro mil genes,
trescientos exclusivamente en el tumor. El conocimiento de estos genes
específicos del tumor abre las puertas a nuevas terapias basadas en la
inhibición de la acción de estos genes. Si al estudio
masivo de los genes de un genoma lo llamamos genómica*, al estudio masivo de las proteínas lo
llamamos proteómica. A partir de la secuenciación del genoma humano, ahora se
pretende estudiar la estructura y función de todas las proteínas codificadas
por el genoma. De los 40 000 que se han identificado, solamente se conoce la
función y estructura de las proteínas de menos de un 10%. De una tercera parte
de los genes conocemos la función de sus proteínas, de otra tercera parte
sospechamos la función, y del tercio restante lo desconocemos todo. Conocer la
estructura y función de las proteínas significa poder diseñar moléculas que
activen o inactiven una proteína. Si esta proteína es una diana terapéutica
podemos diseñar fármacos nuevos. Realicemos un pequeño cálculo. Supongamos que
tenemos unos 100 000 genes; como muchos genes dan lugar a variantes (por
ejemplo, variantes en el ordenamiento de los exones del gen), si calculamos que
tenemos tres variantes de media por gen, podemos suponer que tendremos 300 000
proteínas distintas en nuestro proteoma*.
Las proteínas interactúan unas con otras para realizar sus funciones. Si cada
proteína puede realizar 8 interacciones de promedio, tenemos casi 3 millones de
interacciones entre proteínas. Cada interacción es una diana farmacológica
potencial. Se han desarrollado estrategias como la del “doble híbrido” que
identifica interacciones entre proteínas. De hecho, esta estrategia ya se ha
utilizado de forma masiva para identificar todas las interacciones del proteoma
de la bacteria que provoca úlcera gástrica. Estas estrategias son pues muy
útiles, pero generan mucha información. En el futuro se va a generar una
inmensa cantidad de datos sobre proteínas. Con la farmacogenética* (o “farmacología a la carta”), que
también deriva del conocimiento del genoma humano y se incluye en las
posibilidades médicas previstas para el siglo XXI, se pretende mejorar
toxicidad y eficacia del tratamiento. Ya hemos mencionado que existen 3
millones de polimorfismos SNP. ¿Qué importancia tienen estos polimorfismos? Se
puede tomar una población humana y estudiar qué diferencias presentan las
personas individualmente frente al tratamiento con un determinado fármaco. Se
puede administrar una misma dosis y ver qué genotipo (qué variantes de SNP) de
la población se asocia con determinado riesgo de toxicidad, y así ajustar la
dosis según los grupos de población. En realidad, no pertenece tanto al futuro,
las empresas farmacéuticas ya trabajan activamente en este campo. Los SNP
también van a ser la herramienta que permita identificar los genes que
confieren susceptibilidad a padecer enfermedades de origen multigénico, las
enfermedades que más preocupan a nuestra sociedad: diabetes, enfermedades
coronarias, obesidad, etc. De nuevo todos estos estudios van a generar mucha
información. ¿Cómo manejarla? La bioinformática
es la materia llamada a resolver el problema derivado de la ingente cantidad de
información en la era posgenoma. Se necesitan paquetes informáticos para
tratar esta gran cantidad de datos que nos ayuden a conocer la secuencia del
genoma, la estructura de las proteínas, la función de las proteínas, y algo que
comienza a ser cada vez más importante, la lectura de la bibliografía. En
efecto, en publicaciones de biomedicina, se están alcanzando datos notables: se
han publicado once millones de artículos biomédicos. En consecuencia, empieza a
ser relevante poder distinguir los artículos que se publican sobre cada tema
concreto, y un paquete informático de gestión bibliográfica integrado con las
bases de datos de la era posgenoma (genes, estructura de proteínas,
interacción entre proteínas, SNP, etc.) es cada vez más necesario. ¿Cómo es que España
no intervino en la secuenciación del genoma humano? Por falta de interés
político. A pesar de ello, grupos de investigación españoles han participado en
el proyecto de la secuenciación de la levadura (Saccharomyces cerevisiae) y en el de la planta Arabidopsis, y también se han descrito diez genes de enfermedades
hereditarias. Es de esperar que España sí participe en la revolución
posgenoma, la del genoma humano y de otras especies de interés patológico o
industrial. La medicina ha
pasado de ser un arte a ser preventiva; ahora se pretende que sea predictiva. A
lo largo de la historia de la humanidad, la esperanza de vida ha cambiado; en
el primer tercio del siglo XX había barrios en Madrid con una gran mortalidad
infantil (grupos que seguían la estrategia de la r*), mientras que había otros barrios
que tenían pocos hijos y la mayoría sobrevivían (seguían la estrategia de la K*). Unos barrios y otros tenían
curvas de mortalidad características de especies distintas. En pocos años se ha
conseguido estirar esta curva de mortalidad hacia la supervivencia máxima, cada
vez menos poblaciones humanas siguen la estrategia de la r. Sólo la siguen los desheredados
de la tierra. Con la aplicación de nuevas tecnologías, como la posibilidad de
utilizar stem cells para producir
órganos y realizar transplantes, todavía se va a estirar más la curva hacia el
límite de máxima supervivencia, disminuyendo la mortalidad. Y aún hay quien se
hace la siguiente pregunta: ¿estiraremos la esperanza de vida hasta alcanzar el
límite de la inmortalidad? Según Eudald
Carbonell, paleontólogo del equipo director de la excavación de Atapuerca, lo
que define a la humanidad es la técnica; cuánta más técnica hemos tenido, más
humanos hemos sido. Hay que implicar a la sociedad en todos sus niveles en la
revolución biotecnológica, ya que las nuevas técnicas nos atañen a todos y nos
hacen más humanos. Además es perentorio extender esta revolución a toda la
humanidad.
Manuel Palacín es catedrático de Bioquímica
de la Universidad de Barcelona * Glosario de Biomedia Más información en Biomedia: Más información en la red: |
|||
|
|
|||