Una-tecnica-de-big-data-predice-el-12

Un hito en la modelización predice 100 nuevos plegamientos de proteínas

January 19, 2017 | A version of this story appeared in Volume 95, Issue 4

Credit: AAAS/Science

La modelización de proteínas in-silicoha resuelto la estructura de 600 familias de proteínas desconocidas, que incluyen un componente de la RNA helicasa, una transportadora de hierro y más de 100 nuevos giros (de los que se muestran cuatro arriba).

Investigadores han presentado la conformación tridimensional del 12% de las familias de proteínas que, hasta ahora, tenían una estructura desconocida. Esto supone un enorme hito para el campo de la modelización de estructuras proteicas por ordenador. Las 600 familias de proteínas recién elucidadas incluyen 100 pliegues que todavía no existían en el Protein Data Bank y 200 proteínas de membrana (Science 2017, DOI: 10.1126/science.aah4043)

[+]Enlarge

Credit: AAAS/Science

Un equipo liderado por David Baker de la Universidad de Washington modeló las estructuras de estas proteínas usando su algoritmo Rosetta en una red de ordenadores personales que, cedidos por voluntarios, participan en computación distribuida. El equipo de Baker depositó algunas de las estructuras predichas en bases de datos públicas. En los meses siguientes, otros biólogos resolvieron de manera fortuita –y confirmaron– la estructura tridimensional de 6 de estas familias desconocidas.

“La similitud es alucinante,” comenta Johannes Söding del Instituto Max Planck de Química Biofísica, que no estuvo implicado en el estudio. “Y no se trata de proteínas pequeñas, sencillas. La mayoría tienen cientos de aminoácidos y giros complicados,” dice Söding.

Durante más de dos décadas, los investigadores han desarrollado modelos computacionales para predecir la estructura de una proteína a partir de su secuencia de aminoácidos, consiguiendo niveles de acierto muy poco consistentes. El método de Baker y su equipo está basado en una idea de hace 20 años.

[+]Enlarge

Credit: AAAS/Science

En aquel entonces, Chris Sender, actualmente en el Instituto Broad del MIT y la Universidad de Harvard (Massachusetts, EE.UU.), propuso que la homología de proteínas –el hecho de que organismos muy diferentes tienen proteínas provenientes de una proteína ancestro común– podría usarse para predecir estructuras. Proteínas homólogas tienen secuencias de aminoácidos similares, hacen tareas parecidas en las células y, generalmente, tienen también estructuras parecidas.

Si las cadenas laterales de dos aminoácidos en una proteína se tocan, siempre querrán tocarse a lo largo de la Evolución, explica Baker. “Así que si uno muta para tener una cadena más larga, es probable que su complementario mute para tener una cadena más corta [y seguir encajando].”

Los algoritmos de ordenador identifican estos aminoácidos “complementarios” alineando secuencias de proteínas análogas y estadística avanzada. Como esos aminoácidos suelen estar espacialmente cerca, la información puede usarse para predecir estructuras tridimensionales.

Para usar esta estrategia in-silico –un algoritmo que requiere de aprendizaje automático– Baker y sus colaboradores necesitaron muchas secuencias ya conocidas: cuantas más secuencias pudiera comparar el algoritmo, más fiable sería el resultado. Para ampliar el tamaño de su base de datos, los investigadores sacaron parte de los datos de un sitio poco usual: los proyectos de investigación en metagenómica microbiana. En esos proyectos, los científicos secuencian DNA de bacterias de todas partes (suelo, océano, sistema digestivo…). “Nadie había pensado en usar esos datos para predecir estructuras,” dice Baker, pero los proyectos de metagenómica ayudaron al equipo a mejorar la precisión de sus cálculos.

“Es una estrategia que combina ‘big-data’ y fuerza bruta, pero parece funcionar mucho mejor que cualquier otra aproximación hasta la fecha,” apunta Söding.

Traducción al español producida por Fernando Gomollón Bel de Divulgame.org para C&EN. La versión original (en inglés) del artículo está disponible aquí.
Para ver las traducciones en español, visita http://cen.acs.org/espanol.html.

Chemical & Engineering News

ISSN 0009-2347

Advertisement

LATEST

TOPICS

MAGAZINE

FEATURES

COLLECTIONS

PODCASTS

CHEMPICS

JOBS

LATEST

TOPICS

MAGAZINE

FEATURES

COLLECTIONS

PODCASTS

CHEMPICS

JOBS

Biological Chemistry

Una técnica de ‘big-data’ predice el 12% de las estructuras desconocidas de proteínas

Un hito en la modelización predice 100 nuevos plegamientos de proteínas

by Sarah Everts

January 19, 2017 | A version of this story appeared in Volume 95, Issue 4

Advertisement

You might also like...

Join the conversation

Advertisement

TOPICS

MAGAZINE

FEATURES

COLLECTIONS

Grab your lab coat. Let's get started

Welcome!

Welcome!

Create an account below to get 6 C&EN articles per month, receive newsletters and more - all free.

It seems this is your first time logging in online. Please enter the following information to continue.

As an ACS member you automatically get access to this site. All we need is few more details to create your reading experience.

The key to knowledge is in your (nitrile-gloved) hands

Access more articles now. Choose the ACS option that’s right for you.

Thank you!

Una técnica de ‘big-data’ predice el 12% de las estructuras desconocidas de proteínas

Un hito en la modelización predice 100 nuevos plegamientos de proteínas

by Sarah Everts

January 19, 2017 | A version of this story appeared in Volume 95, Issue 4

Advertisement

You might also like...

Join the conversation

The power is now in your (nitrile gloved) hands

Sign up for a free account to get more articles. Or choose the ACS option that’s right for you.

Option 1

Create a free account To read 6 articles each month from

Option 2

BEST VALUE

Join ACS To get even more access to

Create a free account
To read 6 articles each month from

Join ACS
To get even more access to