Portada | Archivo | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones

Entrevista a Roderic Guigó, investigador del Institut Municipal d'Investigació y profesor asociado de la Universitat Pompeu Fabra, Barcelona

Annia G. Domènech 12/04/00

Biomedia (Barcelona). El Proyecto Genoma Humano está en una fase muy avanzada: se ha partido el genoma en múltiples fragmentos, que han sido secuenciados, pero para completar el proyecto es necesario ensamblar todos los fragmentos. Cuando estén todos los fragmentos ensamblados habrá que encontrar las secuencias con sentido, es decir, los genes. Hasta ahora se ha podido comparar fragmentos de la secuencia del genoma humano con genomas de otros animales.

 

Ahora que la empresa Celera Genomics ya ha secuenciado todo el genoma humano, ¿ha llegado el momento de la informática para el ensamblaje?

En todo el proceso de secuenciación del genoma humano, la informática juega un papel esencial. Primero, porque permite almacenar los múltiples datos que genera y, segundo, porque los problemas que presenta sólo pueden ser resueltos con técnicas computacionales. La biología, en general, ha cambiado mucho este último decenio no sólo por la mejora de las técnicas de laboratorio, sino porque ha pasado de ser una ciencia básicamente descriptiva a convertirse en una ciencia que genera mucha información. Este es el caso de la secuenciación del genoma o del desarrollo de técnicas que permiten estudiar simultáneamente el funcionamiento de miles de genes; y del progreso de la biología estructural, que permite determinar la estructura e interacción de diversas proteínas.

¿Qué proceso ha seguido la empresa Celera Genomics para secuenciar el genoma?

La estrategia que utiliza Celera para secuenciar el genoma de los organismos se denomina Shot Gun. Primero el DNA se rompe aleatoriamente en trozos muy pequeños, ya que las máquinas sólo pueden secuenciar fragmentos de 500 o 1000 nucleótidos. En el caso del genoma humano, se han generado 50 millones de fragmentos, lo que supone que cada nucleótido se halla en promedio en 10 fragmentos distintos. Así, los distintos trozos se pueden superponer por los fragmentos comunes, lo que permite la reconstrucción lineal del genoma. Cada uno de los fragmentos se secuencia en unas máquinas que, básicamente, utilizan el método químico de secuenciación de Sanger de los años setenta, sólo que lo hacen automáticamente mediante robots.

¿Se ha utilizado esta técnica en otros organismos?

Esta técnica ha funcionado bien en los genomas de bacterias, que tienen unos pocos centenares de miles de bases. En Drosophila, la mosca del vinagre, cuyo genoma se ha secuenciado recientemente utilizando el Shot Gun, se ha contado con la ayuda de mapas físicos de genes que ya existían. En el caso del genoma humano, que contiene 3000 millones de nucleótidos, también existe el esqueleto de un mapa de genes, pero como contiene muchas regiones repetitivas, no se sabe exactamente dónde colocar algunos fragmentos.

Cuando se procede a secuenciar el genoma de un organismo, ¿se hace exhaustivamente?

En el caso de la mosca Drosophila no ha sido secuenciada una tercera parte de su genoma, la llamada heterocromatina, donde se cree que no hay genes. La heterocromatina de Drosophila está muy localizada en unos determinados fragmentos del genoma, como los centrómeros (puntos de unión de los cromosomas) y los telómeros (extremos de los cromosomas); y es difícil clonar estas regiones por la estructura que el DNA adopta en ellas.

Sólo el 2% del genoma humano codifica para proteínas, lo que implica que un gen está separado de otro por centenares de miles de bases que, en principio, no tienen ninguna funcionalidad. Las regiones repetitivas están entre los genes y, a su vez, las secuencias que controlan la actividad de los genes están situadas justamente en el DNA basura, así que no es cierto que este no tenga ninguna función.

En el Proyecto Genoma Humano se utilizan clones de muchos individuos distintos. Celera ha utilizado los genomas de unas personas determinadas. ¿Qué diferencia hay?

Si se encuentra el cambio de un nucleótido en dos secuenciaciones diferentes del DNA de un mismo individuo, probablemente se deba a un error de secuenciación. Ahora bien, si se comparan las secuencias de dos individuos diferentes, no se sabe si se trata de un error de secuenciación o de un polimorfismo (es decir, un gen que presenta formas distintas). Secuenciar el DNA de individuos determinados, como hace Celera, permite ver dónde hay variaciones dentro del DNA.

¿Qué paso viene después del ensamblaje de los fragmentos de DNA secuenciados?

Después del ensamblaje de la secuencia de DNA, se debe determinar dónde se encuentran los genes en dicha secuencia. Nuestro grupo investiga las señales de la secuencia de DNA que definen dónde se encuentran los genes y, a partir de dichas señales, se desarrollan programas informáticos que, dada una secuencia de DNA, sitúen los genes que codifiquen una proteína. Actualmente estamos desarrollando la versión para el genoma humano, llamada Geneid, que prevemos hacerla pública en los próximos dos meses. Al margen de esto, hemos hecho un programa llamado Gff2ps que permite visualizar estas anotaciones. Cuando se ha predeterminado dónde están los genes, este programa hace un mapa. Este programa informático se hizo público a inicios de año y ya ha sido utilizado para interpretar el genoma de la mosca Drosophila publicado recientemente en la revista Science.

¿Cómo se puede determinar dónde hay un gen, es decir, un trozo de DNA codificante?

Determinadas secuencias de nucleótidos son señales de la célula que indican dónde hay un gen. Por desgracia, estas señales aparecen con mucha más frecuencia de la que son utilizadas por la célula. Sin embargo, las regiones del DNA donde se encuentran los genes tienen unas características en su composición diferente de aquellas regiones donde no se encuentran los genes. Estas características  pueden ser detectadas estadísticamente porque los genes tienden a aparecer más en regiones en las que predominan los nucleótidos G y C que en las que hay más A y T. Por otra parte, se puede comparar una secuencia de DNA con bases de datos de genes conocidos; si coinciden, se determina que la secuencia es codificante.

¿Cuáles son estas bases de datos con genes secuenciados?

Las bases de datos llamadas EST (Expression Sequence Tags) contienen una gran parte de los genes humanos, que han sido obtenidos a partir de la secuenciación de los RNA mensajeros. Es así porque durante la transcripción de DNA en mRNA se eliminan las partes del DNA que no codifican. Estas bases de datos contienen más de 3 millones de secuencias que pertenecen a distintas especies y han sido muy útiles para la secuenciación del genoma humano. No se sabe si estas bases de datos cubren el 50%, el 70% o el 90% de los genes humanos. Seguramente cubren, como mínimo, el 50% de los genes humanos.

Económicamente, ¿es el genoma humano un valor en alza?

La importancia económica de la secuenciación del genoma humano deriva de que hará posible identificar los genes codificados y, en consecuencia, las proteínas que vienen codificadas en esos genes. En el genoma humano hay entre 80000 y 100000 genes codificados. Muchas enfermedades tienen un componente genético muy importante; conocer el genoma humano permitiría mejorar el tratamiento de algunas enfermedades. Con ello las compañías farmacéuticas podrían obtener muchos beneficios. Además, la secuenciación de especies de interés agrícola o ganadero permitirá aumentar su rendimiento.

¿Genoma patentado o de libre uso?

En principio, los mecanismos de  protección de la propiedad intelectual favorecen que las empresas farmacéuticas inviertan grandes cantidades de recursos en el desarrollo de nuevos medicamentos. Si las patentes se conceden sobre el resultado de investigación esencialmente básica, sin embargo, el resultado puede ser contraproducente, pues se desincentiva la inversión de otras compañías en la investigación de posibles aplicaciones de aquella investigación básica. Es decir, si las patentes se conceden al final de la cadena del proceso de investigación que va de lo básico a lo aplicado, pueden incentivar el interés económico de la compañía, pero si se conceden al principio, puede ocurrir exactamente lo contrario. A eso es a lo que podría conducir la patente indiscriminada de genes. En cualquier caso, no puede ser que las patentes condicionen la investigación básica en los centros de investigación públicos o sin animo de lucro; no creo que ello ocurra porque son precisamente las compañías farmacéuticas las primeras interesadas en que esa investigación se produzca libremente. - Annia G. Domènech es licenciada en biología

Arriba

Portada


Archivo | Búsqueda | Agenda | Enlaces | Créditos | Suscripciones

(C) BIOMEDIA es una publicación del OCC (UPF) y RUBES EDITORIAL