Información

¿Cómo editar estructuras pdb manualmente?


Me gustaría mover manualmente algunas hojas B de una estructura 3D de mi proteína PDF para representar un cambio en su estructura. ¿Hay alguna herramienta que pueda hacer?


Si mal no recuerdo, pymol puede editar estructuras pdb (así como visualizarlas).

Sin embargo, he usado una versión para estudiantes (que es una versión completa gratuita) y no estoy muy seguro de si es posible usar pymol sin comprar una licencia hoy en día (aunque el código fuente sigue siendo de código abierto, por lo que, en principio, siempre se puede instalar es de eso)


Introducción a los datos PDB

El archivo PDB es un depósito de coordenadas atómicas y otra información que describe proteínas y otras macromoléculas biológicas importantes. Los biólogos estructurales utilizan métodos como la cristalografía de rayos X, la espectroscopia de RMN y la microscopía crioelectrónica para determinar la ubicación de cada átomo en relación con los demás en la molécula. Luego depositan esta información, que luego es anotada y publicada públicamente en el archivo por la wwPDB.

El PDB en constante crecimiento es un reflejo de la investigación que se lleva a cabo en los laboratorios de todo el mundo. Esto puede hacer que sea emocionante y desafiante utilizar la base de datos en la investigación y la educación. Hay estructuras disponibles para muchas de las proteínas y ácidos nucleicos involucrados en los procesos centrales de la vida, por lo que puede ir al archivo de PDB para encontrar estructuras para ribosomas, oncogenes, dianas de fármacos e incluso virus completos. Sin embargo, puede ser un desafío encontrar la información que necesita, ya que la PDB archiva tantas estructuras diferentes. A menudo encontrará múltiples estructuras para una molécula determinada, o estructuras parciales, o estructuras que han sido modificadas o inactivadas de su forma nativa.

Guía para comprender los datos de PDB está diseñado para ayudarlo a comenzar a trazar un camino a través de este material y ayudarlo a evitar algunos errores comunes. Estos capítulos están entrelazados entre sí. Para comenzar, seleccione un tema del menú de la derecha o seleccione uno de los siguientes:

La información primaria almacenada en el archivo PDB consiste en archivos de coordenadas para moléculas biológicas. Estos archivos enumeran los átomos de cada proteína y su ubicación 3D en el espacio. Estos archivos están disponibles en varios formatos (PDB, mmCIF, XML). Un archivo con formato PDB típico incluye una gran sección de texto de "encabezado" que resume la proteína, la información de la cita y los detalles de la solución de estructura, seguida de la secuencia y una larga lista de los átomos y sus coordenadas. El archivo también contiene las observaciones experimentales que se utilizan para determinar estas coordenadas atómicas.

Si bien puede ver archivos PDB directamente usando un editor de texto, a menudo es más útil usar un programa de exploración o visualización para verlos. Las herramientas en línea, como las del sitio web de RCSB PDB, le permiten buscar y explorar la información bajo el encabezado de PDB, incluida información sobre métodos experimentales y la química y biología de la proteína. Una vez que haya encontrado las entradas PDB que le interesan, puede usar programas de visualización que le permitan leer el archivo PDB, mostrar la estructura de la proteína en su computadora y crear imágenes personalizadas de la misma. Estos programas también suelen incluir herramientas de análisis que le permiten medir distancias y ángulos de enlace, e identificar características estructurales interesantes.

Cuando comience a explorar las estructuras en el archivo PDB, necesitará saber algunas cosas sobre los archivos de coordenadas. En una entrada típica, encontrará una mezcla diversa de moléculas biológicas, moléculas pequeñas, iones y agua. A menudo, puede utilizar los nombres y los ID de cadena para ayudar a resolverlos. En estructuras determinadas a partir de cristalografía, los átomos están anotados con factores de temperatura que describen su vibración y ocupaciones que muestran si se ven en varias conformaciones. Las estructuras de RMN a menudo incluyen varios modelos diferentes de la molécula.

Puede encontrarse con varios desafíos mientras explora el archivo PDB. Por ejemplo, muchas estructuras, en particular las determinadas por cristalografía, solo incluyen información sobre parte del ensamblaje biológico funcional. Afortunadamente, el PDB puede ayudar con esto. Además, a muchas entradas de PDB les faltan porciones de la molécula que no se observaron en el experimento. Estos incluyen estructuras que incluyen solo posiciones de carbono alfa, estructuras con bucles faltantes, estructuras de dominios individuales o subunidades de una molécula más grande. Además, la mayoría de las entradas de la estructura cristalográfica no tienen información sobre los átomos de hidrógeno.

Acerca de PDB-101

PDB-101 ayuda a profesores, estudiantes y al público en general a explorar el mundo 3D de proteínas y ácidos nucleicos. Conocer sus diversas formas y funciones ayuda a comprender todos los aspectos de la biomedicina y la agricultura, desde la síntesis de proteínas hasta la salud y la enfermedad hasta la energía biológica.

¿Por qué PDB-101? Investigadores de todo el mundo hacen que estas estructuras 3D estén disponibles gratuitamente en el archivo Protein Data Bank (PDB). PDB-101 crea materiales introductorios para ayudar a los principiantes a iniciarse en la materia ("101", como en un curso de nivel de entrada), así como recursos para el aprendizaje extendido.


Veinte años de moléculas

Theodosius Dobzhansky dijo la famosa frase: "Nada en biología tiene sentido excepto a la luz de la evolución", y el archivo PDB tiene muchos ejemplos en los que puedes ver esa conexión de primera mano. Alguna evolución ocurre a lo largo de milenios, por ejemplo, al comparar las secuencias de proteínas como las globinas, podemos descubrir los pedigrí detallados de organismos relacionados.En la resistencia bacteriana a los medicamentos, podemos ver la evolución que ocurre en años, a medida que las bacterias desarrollan nuevos métodos para evadir medicamentos a través de la mutación y la selección de su biomáquina existente.

Las estructuras que se muestran aquí revelan que la evolución ocurre en cuestión de días. Los investigadores sometieron un cultivo de células infectadas por el VIH a un inhibidor de la proteasa del VIH y observaron cómo evolucionaban versiones cada vez más resistentes a través de la mutación y la selección. La enzima de tipo salvaje en la parte superior (entrada PDB 2az8) está fuertemente bloqueada por el inhibidor. Al cambiar una leucina a una alanina más pequeña, la enzima central (entrada PDB 2az9) elimina una interacción favorable y es 4 veces resistente al inhibidor. El que está en la parte inferior (entrada PDB 2azc) sintoniza aún más la actividad de la enzima con cinco sitios más de mutación y es 30 veces más resistente. Para explorar estas estructuras con más detalle, haga clic en la imagen para ver un JSMol interactivo.

Temas para mayor discusión

  1. ¿Cuál es tu molécula favorita?
  2. Si está interesado en leer acerca de mis objetivos y métodos para estas columnas de la Molécula del mes, eche un vistazo a este artículo en el boletín de RCSB.

Recursos relacionados con el PDB-101

Referencias

  1. 6j4y: Ehara, H., Kujirai, T., Fujino, Y., Shirouzu, M., Kurumizaka, H., Sekine, S.I. (2019) Información estructural sobre la transcripción de nucleosomas por la ARN polimerasa II con factores de elongación. Ciencia 363: 744-747
  2. 6mam: Oeste, BR, Wec, AZ, Moyer, CL, Fusco, ML, Ilinykh, PA, Huang, K., Wirchnianski, AS, James, RM, Herbert, AS, Hui, S., Goodwin, E., Howell , KA, Kailasan, S., Aman, MJ, Walker, LM, Dye, JM, Bukreyev, A., Chandran, K., Saphire, EO (2019) Base estructural de la neutralización amplia del virus del ébola por un anticuerpo superviviente humano. Nat. Struct. Mol. Biol. 26: 204-212
  3. 6by7: Dong, Y., Chen, S., Zhang, S., Sodroski, J., Yang, Z., Liu, D., Mao, Y. (2018) Plegado de ADN en un nanobarril conjugado con lípidos para la reconstitución controlada de proteínas de membrana. Angew. Chem. En t. Ed. Engl. 57: 2072-2076
  4. 6cfz: Jenni, S., Harrison, S.C. (2018) La estructura del complejo DASH / Dam1 muestra su papel en la interfaz cinetocoro-microtúbulos de levadura. Ciencia 360: 552-558
  5. 5j7v: Klose, T., Reteno, D.G., Benamar, S., Hollerbach, A., Colson, P., La Scola, B., Rossmann, M.G. (2016) Estructura de faustovirus, un gran virus de dsDNA. Proc.Natl.Acad.Sci.USA 113: 6206-6211
  6. 3j2u: Asenjo, AB, Chatterjee, C., Tan, D., Depaoli, V., Rice, WJ, Diaz-Avalos, R., Silvestry, M., Sosa, H. (2013) Modelo estructural para el reconocimiento de tubulina y deformación por depolimerasas de microtúbulos de Kinesin-13. Representante de celda 3: 759-768
  7. 3nir: Schmidt, A., Teeter, M., Weckert, E., Lamzin, V.S. (2011) Estructura cristalina de una pequeña proteína crambin con una resolución de 0,48 A. Acta Crystallogr., Sección F 67: 424-429
  8. 2az8, 2az9, 2acz: Heaslet, H., Kutilek, V., Morris, G.M., Lin, Y.-C., Elder, J.H., Torbett, B.E., Stout, C.D. (2006) Perspectivas estructurales sobre los mecanismos de resistencia a los fármacos en la proteasa NL4-3 del VIH-1. J.Mol.Biol. 356: 967-981
  9. 1plq: Krishna, T.S., Kong, X.P., Gary, S., Burgers, P.M., Kuriyan, J. (1994) Estructura cristalina del factor de procesividad de la ADN polimerasa eucariota PCNA. Celda 79: 1233-1243

Enero de 2020, David Goodsell

Acerca de PDB-101

PDB-101 ayuda a profesores, estudiantes y al público en general a explorar el mundo 3D de proteínas y ácidos nucleicos. Conocer sus diversas formas y funciones ayuda a comprender todos los aspectos de la biomedicina y la agricultura, desde la síntesis de proteínas hasta la salud y la enfermedad hasta la energía biológica.

¿Por qué PDB-101? Investigadores de todo el mundo hacen que estas estructuras 3D estén disponibles gratuitamente en el archivo Protein Data Bank (PDB). PDB-101 crea materiales introductorios para ayudar a los principiantes a iniciarse en la materia ("101", como en un curso de nivel de entrada), así como recursos para el aprendizaje extendido.


Priones

En el estado mal plegado, los priones forman una fibrilla resistente. Un primer vistazo a una de estas fibrillas está disponible en la entrada PDB 2rnm, que incluye parte de la proteína HET-s fúngica. Se incluyen seis cadenas de proteínas en el archivo PDB, apiladas para formar una estructura solenoidal larga. Los aminoácidos hidrofóbicos (en blanco) están empaquetados dentro de un bolsillo triangular, estabilizando toda la estructura. Para explorar esta estructura con más detalle, haga clic en la imagen para ver un JSmol interactivo.

Recursos relacionados con el PDB-101

Referencias

  1. D. M. Fowler, A. V. Koulov, W. E. Balch y J. W. Kelley (2007) Amiloide funcional: de bacterias a humanos. Tendencias en ciencias bioquímicas 32, 217-224.
  2. D. A. Harris y H. L. True (2006) Nuevos conocimientos sobre la estructura y la toxicidad de los priones. Neuron 50, 353-357.
  3. J. Collinge (2005) Neurología molecular de la enfermedad priónica (2005) Revista de Neurología, Neurocirugía y Psiquiatría 76, 906-919.
  4. J. Collinge (1999) Variante de la enfermedad de Creutzfeldt-Jakob. Lancet 354, 317-323. (una revisión de la infección de los seres humanos por la enfermedad de las vacas locas)
  5. S. B. Prusiner, M. R. Scott, S. J. DeArmond y F. E. Cohen (1998) Biología de la proteína prión. Cell 93, 337-348.

Acerca de PDB-101

PDB-101 ayuda a profesores, estudiantes y público en general a explorar el mundo 3D de proteínas y ácidos nucleicos. Conocer sus diversas formas y funciones ayuda a comprender todos los aspectos de la biomedicina y la agricultura, desde la síntesis de proteínas hasta la salud y la enfermedad hasta la energía biológica.

¿Por qué PDB-101? Investigadores de todo el mundo hacen que estas estructuras 3D estén disponibles gratuitamente en el archivo Protein Data Bank (PDB). PDB-101 crea materiales introductorios para ayudar a los principiantes a iniciarse en la materia ("101", como en un curso de nivel de entrada), así como recursos para el aprendizaje extendido.


¿Cómo puedo depurar expresiones y declaraciones escritas manualmente en pdb?

En pdb (o ipdb) podemos ejecutar sentencias y evaluar expresiones con el! o comandos p:

p expresión
Evalúe la expresión en el contexto actual e imprima su valor.

[!]declaración

Ejecute la instrucción (de una línea) en el contexto del marco de pila actual. El signo de exclamación se puede omitir a menos que la primera palabra de la declaración se parezca a un comando de depuración. Para establecer una variable global, puede prefijar el comando de asignación con un comando global en la misma línea

Entonces, por ejemplo, puedo escribir p reddit.get_subreddits () mientras depuro en ipdb y el código se ejecutará en el contexto actual y veré el valor de retorno.

¿Hay alguna forma de depurar la ejecución de tales expresiones "escritas manualmente"?

Básicamente, me gustaría hacer s reddit.get_subreddits (), pero eso solo ejecuta el comando de paso e ignora la expresión.

EDITAR: Un ejemplo trivial

Toma esta sencilla función:

Lo cual tiene errores debido a que, si no, weekday_index (debería verificar que weekday_index no sea None).

Supongamos que noto que obtengo 10 la mitad de las veces que esperaba. Así que agregué una importación ipdb ipdb.set_trace () antes de la llamada a la función para intentar depurar el código.

Así que estoy en la consola ipdb y de repente tengo la idea de que tal vez el problema sea cuando paso 0 como weekday_index. Puedo probar mi hipótesis directamente en ipdb:

Ok, me doy cuenta de que algo anda mal cuando weekday_index = 0.
Lo que me gustaría hacer ahora es depurar paso a paso la llamada a get_value_for_weekday (0), de modo que pueda ver que entro erróneamente en el bloque if.

Obviamente, podría salir de ipdb, detener el script, cambiar el código para que siempre pase 0, reiniciar el script y, cuando entro en ipdb, depurar la llamada con el comando ipdb step (s).
¿Pero no sería más fácil si pudiera hacer s get_value_for_weekday (0) de la misma manera que pude hacer p get_value_for_weekday (0)?


Coordenadas y conjuntos biológicos faltantes

Debido a las características de los métodos de determinación de la estructura, la mayoría de las entradas no incluyen coordenadas para cada átomo de la molécula identificada. En algunos casos, el método experimental puede no observar ciertos átomos. Por ejemplo, las regiones flexibles y los átomos de hidrógeno no se observan en los experimentos cristalográficos de rayos X y, por lo tanto, no se incluyen en los archivos de coordenadas PDB. En otros casos, solo una parte de la molécula puede incluirse en la entrada PDB. Por ejemplo, en estructuras cristalográficas de rayos X de moléculas simétricas, la entrada PDB a menudo incluye solo una subunidad del complejo, y las coordenadas para el ensamblaje biológico completo deben calcularse a partir de las coordenadas de la subunidad. Al buscar en el archivo PDB, es importante considerar qué partes de una estructura se incluyen en cada entrada en particular.

Algunas de las situaciones comunes que puede encontrar se describen a continuación.

Conjuntos asimétricos y biológicos

En cristales usados ​​para cristalografía de rayos X, múltiples copias de la proteína y / o ácido nucleico se apilan simétricamente en una matriz. Por lo general, la estructura de la porción única más pequeña de esta matriz, llamada unidad asimétrica, se deposita en el archivo PDB. Dependiendo de la simetría en el cristal, la unidad asimétrica puede tener una o más copias de la proteína y / o ácido nucleico.

El ensamblaje biológicamente relevante de una molécula puede ser completamente diferente de la estructura de unidad asimétrica incluida en la entrada PDB. En el caso de la hemoglobina, que actúa como tetrámero, la unidad asimétrica incluye solo 2 cadenas (la mitad del tetrámero funcional) en algunas entradas de AP y 8 o más cadenas (que representan varios tetrámeros funcionales) en otras. Los virus icosaédricos son otro ejemplo común: por lo general, solo se deposita una sola cadena, por lo que es necesario generar coordenadas para las 60 cadenas en la cápside. Las operaciones de simetría necesarias para generar o seleccionar cadenas para los conjuntos biológicos se proporcionan en los archivos de entrada, si desea realizar el cálculo usted mismo, o puede descargar las coordenadas del conjunto biológico desde el archivo.

Para obtener un tutorial detallado sobre ensamblajes biológicos, haga clic aquí.

Unidad asimétrica Ensamblaje biológico
La entrada de PDB 1hho contiene dos cadenas, como se muestra en la parte superior. Las coordenadas para el tetrámero biológicamente activo están disponibles en el archivo de ensamblaje biológico, como se muestra en la parte inferior.

Sugerencia: Las coordenadas de los conjuntos biológicos se incluyen en el menú & quotDescargar archivos & quot.

Archivos de coordenadas alfa-carbono

En algunos casos, los experimentos arrojan solo una imagen de baja resolución de una proteína, como en el caso de estructuras de microscopía electrónica o cristalografía de rayos X con cristales que no están bien ordenados. En estos casos, los datos experimentales no son suficientes para resolver todos los átomos, y el investigador puede optar por incluir una sola coordenada para cada aminoácido de la proteína. Muy a menudo, se incluye la posición de la posición del carbono alfa. Estas estructuras muestran el plegamiento de la cadena proteica.

Esta estructura del canal de potasio KscA de longitud completa (entrada PDB 1f6g) se resolvió mediante una serie de técnicas espectroscópicas y de etiquetado de espín. Dado que el método no determinó la ubicación de cada átomo, solo los alfa-carbonos se enviaron al PDB.

Sugerencia: si intenta mostrar un diagrama de estructura alámbrica de una entrada PDB y obtiene una pantalla en blanco o solo un montón de pequeños puntos, es posible que esté viendo una estructura con solo alfa-carbonos. Los diagramas de estructura alámbrica normalmente aparecerán en blanco con estos archivos porque las posiciones del carbono alfa están demasiado separadas para mostrar enlaces. En su lugar, intente usar un diagrama de cinta o un tubo principal grueso para mostrar la molécula. Un diagrama de relleno de espacio con esferas artificialmente grandes (5 y radio de Aringngstrom) también funciona bien, si su programa de gráficos moleculares permite esferas de ese tamaño.

Faltan bucles y colas

Dado que la cristalografía de rayos X se basa en la obtención de cristales con muchas, muchas proteínas en posiciones exactamente idénticas, las proteínas flexibles causan problemas. Las regiones de una proteína que se mueven generalmente no se observan en las estructuras de rayos X, por lo que las coordenadas de estas regiones no se incluyen en las entradas de la AP. Los verá como roturas en la cadena y, a menudo, como segmentos faltantes al principio y al final de la cadena. Las estructuras derivadas de la RMN normalmente no tienen este problema. Los conjuntos de estructuras de RMN a menudo incluyen varias conformaciones muy diferentes para regiones flexibles, por lo que puede elegir una o usarlas todas.

Desafortunadamente, no existe una solución simple para este problema aparte del modelado de coordenadas para las partes faltantes (vea la lista de enlaces para programas de modelado molecular). Este problema puede ser significativo, ya que los bucles flexibles a menudo están involucrados en el sitio activo o sitio de unión de la proteína.

La estructura de la proteasa SIV resuelta sin su sitio activo (entrada PDB 1az5) tenía dos bucles que eran demasiado flexibles para ser vistos en el experimento (mostrados con estrellas en la imagen superior). Sin embargo, cuando la proteína se cristalizó con inhibidores, los bucles adoptaron una estructura estable que puede verse (entrada PDB 1yti). (Esta imagen fue creada con MBT Simple Viewer).

Consejo: a menudo es útil buscar otras estructuras que incluyan ligandos o compañeros de unión. En esos casos, el bucle puede cerrarse alrededor del ligando en una conformación estable y, por lo tanto, se verá en el experimento cristalográfico.

Fragmentos y dominios

Muchas proteínas grandes, especialmente proteínas con varias partes móviles, han resultado imposibles de cristalizar como un todo. En estos casos, los investigadores han adoptado un enfoque por partes. Cortaron la proteína en trozos manejables y luego resolvieron la estructura de cada trozo. Para obtener una imagen de la proteína completa, las piezas han tenido que volver a ensamblarse en la orientación adecuada.

Desafortunadamente, no existe un recurso completo que lo ayude a reconstruir la molécula funcional en estos casos. Deberá observar los datos de la secuencia junto con los informes de la biología molecular para clasificar la forma general.

La ATP sintasa está compuesta por dos motores moleculares conectados por un eje y un estator. Ha resultado imposible (al menos hasta ahora) cristalizar todo, pero hay estructuras disponibles para ambos motores (entradas PDB 1c17 y 1e79) y varias de las partes de conexión (entradas PDB 1l2p y 2a7u). (Esta imagen fue creada con QuickPDB)

Sugerencia: Al buscar entradas PDB, es importante prestar atención a lo que realmente se incluye en cada archivo de coordenadas. Esté atento a palabras como & quot; dominio de unión a ligando & quot y & quot; fragmento & quot en el título de la PDB para darle pistas de que está viendo solo una parte de la molécula funcional.

¿Dónde están los átomos de hidrógeno?

La mayoría de los experimentos cristalográficos no resuelven átomos de hidrógeno, por lo que la mayoría de los archivos de coordenadas cristalográficas en el archivo PDB solo incluyen posiciones para los átomos que no son de hidrógeno. En algunos casos, se incluyen los átomos de hidrógeno polares (los átomos de hidrógeno polares son aquellos que están unidos al nitrógeno, oxígeno y azufre, que pueden participar en enlaces de hidrógeno) cuando se utilizan durante el refinamiento de la estructura. Las estructuras determinadas por RMN, por otro lado, suelen incluir todos los átomos de hidrógeno de la estructura, ya que gran parte de la información experimental obtenida en estos experimentos consiste en la distancia entre estos átomos de hidrógeno.

Dado que los experimentos cristalográficos generalmente no ven átomos de hidrógeno, y dado que los átomos de oxígeno y nitrógeno tienen un número similar de electrones y, por lo tanto, se ven similares en los mapas cristalográficos de densidad electrónica, a menudo es difícil determinar la identidad exacta de los átomos en cadenas laterales como asparaginas y glutaminas. En algunos casos, si observa detenidamente el patrón de enlace de hidrógeno con los aminoácidos vecinos, puede encontrar una mejor coincidencia al cambiar el nitrógeno y el oxígeno en una cadena lateral de amida.

Estas dos estructuras de insulina se resolvieron mediante diferentes técnicas experimentales. El de la parte superior (entrada PDB 2ins) se resolvió mediante cristalografía de rayos X, que no proporciona datos para las posiciones de los átomos de hidrógeno. El de la parte inferior (entrada PDB 2hiu) se resolvió mediante espectroscopía de RMN e incluye coordenadas de hidrógeno. (Esta imagen fue creada con MBT Simple Viewer)

Consejo: el programa Reducir es útil para agregar átomos de hidrógeno que faltan en proteínas y ácidos nucleicos, y para determinar el mejor patrón de enlaces de hidrógeno en una proteína.

Acerca de PDB-101

PDB-101 ayuda a profesores, estudiantes y público en general a explorar el mundo 3D de proteínas y ácidos nucleicos. Conocer sus diversas formas y funciones ayuda a comprender todos los aspectos de la biomedicina y la agricultura, desde la síntesis de proteínas hasta la salud y la enfermedad hasta la energía biológica.

¿Por qué PDB-101? Investigadores de todo el mundo hacen que estas estructuras 3D estén disponibles gratuitamente en el archivo Protein Data Bank (PDB). PDB-101 crea materiales introductorios para ayudar a los principiantes a iniciarse en la materia ("101", como en un curso de nivel de entrada), así como recursos para el aprendizaje extendido.


¿Cómo editar estructuras pdb manualmente? - biología

De los cuatro archivos mencionados anteriormente, normalmente se obtendrá un archivo pdb inicial a través del Protein Data Bank, y los archivos de parámetros y topología para una clase determinada de molécula se pueden obtener a través de Internet en

1 Vaya al directorio 1-1-build. En una ventana de Terminal, puede cambiar de directorio usando el comando cd. Escriba cd 1-1-build. Puede ver el contenido del directorio en el que se encuentra escribiendo ls. En esta carpeta, encontrará muchos archivos que utilizará más adelante.

Primero, eliminará las moléculas de agua de 1UBQ.pdb y creará un archivo pdb de la proteína sola.

2 Abra VMD escribiendo vmd en la ventana Terminal.

namd-tutorial-files / 1-1-build & gt vmd

3 Cargue 1UBQ.pdb haciendo clic en Archivo Nueva molécula. elemento de menú en la ventana principal de VMD. En el Explorador de archivos de moléculas, utilice Examinar. para buscar el archivo 1UBQ.pdb. Cárguelo presionando el botón Cargar.

Tenga en cuenta que la estructura de rayos X del Protein Data Bank no contiene los átomos de hidrógeno de la ubiquitina. Esto se debe a que la cristalografía de rayos X generalmente no puede resolver los átomos de hidrógeno. El archivo pdb que generará con psfgen junto con psf contendrá coordenadas adivinadas para los átomos de hidrógeno de la estructura. Más tarde, la minimización de energía de la proteína asegurará que sus posiciones sean razonables.

4 Elija el elemento de menú Extensions Tk Console y en la ventana VMD TkCon. Asegúrese de estar en el directorio de compilación 1-1. Si no es así, navegue hasta allí usando el comando ls para listar archivos y directorios y el comando cd para cambiar directorios. Luego, escriba los siguientes comandos:

set ubq [atomselect top protein]
$ ubq writepdb ubqp.pdb

(Presione la tecla Retorno después de cada comando).

En el paso anterior, creó el archivo ubqp.pdb, que contiene las coordenadas de la ubiquitina sola sin hidrógenos, en el directorio 1-1-build.

5 Salga de VMD seleccionando Archivo Salir.

6 Ahora, creará el archivo psf de ubiquitin. Tenga en cuenta que VMD ofrece un generador automático de archivos psf a través del menú principal de VMD haciendo clic en Extensions Modeling Automatic PSF Builder. Crearemos el archivo psf manualmente para enseñarle exactamente cómo se hace. El paquete psfgen de VMD es muy útil en este sentido. Para crear un archivo psf, primero creará un archivo pgn, que será el destino de psfgen.

En una ventana de Terminal, escriba nedit para abrir el editor de texto. Escriba las siguientes líneas:

el paquete requiere psfgen
topología top_all27_prot_lipid.inp
residuo de pdbalias HIS HSE
pdbalias atom ILE CD1 CD
segmento U
coordpdb ubqp.pdb U
adivinar
writepdb ubq.pdb
writepsf ubq.psf

7 Después de escribir esto, guarde el archivo haciendo clic en Archivo Guardar. Asegúrese de estar en el directorio de construcción 1-1 e ingrese el nombre del archivo como ubq.pgn. Salga del editor de texto haciendo clic en Archivo Salir.

  • Línea 1: ejecutará psfgen dentro de VMD. Esta línea requiere que el paquete psfgen esté disponible para ser llamado por VMD.
  • Línea 2: cargue el archivo de topología top_all27_prot_lipid.inp
  • Línea 3: cambie el nombre del residuo de histidina por el nombre adecuado que se encuentra en el archivo de topología. HSE es uno de los tres nombres para la histidina, basado en el estado de protonación de su grupo lateral. Consulte el cuadro de ciencia a continuación para obtener más información.
  • Línea 4: El átomo llamado "CD1" (carbono) en los residuos de isoleucina se renombra como "CD", su nombre propio del archivo de topología. Dado que la isoleucina contiene solo un átomo de carbono, el archivo psf no usa la etiqueta de número después de "CD".
  • Línea 5: Se crea un segmento llamado U, que contiene todos los átomos de ubqp.pdb. El comando de segmento también agrega átomos de hidrógeno.
  • Línea 6: las coordenadas se leen de ubqp.pdb y los nombres de residuos y átomos coinciden. Las etiquetas de segmento antiguas se anularán con la nueva etiqueta de segmento "U".
  • Línea 7: Las coordenadas de los átomos faltantes (como los hidrógenos) se adivinan según las definiciones de residuos del archivo de topología.
  • Línea 8: Se escribe un nuevo archivo pdb con las coordenadas completas de todos los átomos, incluidos los hidrógenos.
  • Línea 9: Se escribe un archivo psf con la información estructural completa de la proteína.

8 En una ventana de Terminal (nuevamente, asegúrese de estar en el directorio 1-1-build), escriba el siguiente comando:

vmd -dispdev texto -e ubq.pgn

Esto ejecutará el paquete psfgen en el archivo ubq.pgn y generará el archivo psf y pdb de ubiquitina con hidrógenos.

En su pantalla verá diferentes mensajes. Las advertencias están relacionadas con los extremos de su molécula y son normales. Su sistema debe tener 1231 átomos y 631 con coordenadas adivinadas.


Pymol tiene algunos fragmentos incorporados (aminoácidos y grupos funcionales simples). Puede agregar sus propios fragmentos, por ejemplo. azúcares, de esta manera:

Crea la molécula que quieras usar como fragmento. Guárdelo como un archivo .pkl en & ltpymol_path & gt / data / chempy / fragments.

Elija el átomo (ctrl-medio) donde desea agregar el fragmento. Por lo general, será un átomo de hidrógeno (que se eliminará). Luego usa el comando:

donde my_fragment_name es el nombre del archivo pkl (sin extensión .pkl) y 11 es el número del átomo de conexión (hidrógeno) en el fragmento. Para determinar este número, presione '[L] abel' - & gt 'identificadores de átomo' - & gt 'índice' y elija el átomo de hidrógeno que desee.

Si desea un elemento de menú para su fragmento, probablemente pueda ponerlo en & ltpymol_path & gt / modules / pmg_tk / skins / normal / __ init__.py, pero no lo he probado.


Contenido

Dos fuerzas convergieron para iniciar el AP: una colección pequeña pero creciente de conjuntos de datos de estructura de proteínas determinados por difracción de rayos X y la pantalla de gráficos moleculares recientemente disponible (1968), Brookhaven RAster Display (BRAD), para visualizar estas estructuras de proteínas en 3-D. En 1969, con el patrocinio de Walter Hamilton en el Laboratorio Nacional de Brookhaven, Edgar Meyer (Texas A & ampM University) comenzó a escribir software para almacenar archivos de coordenadas atómicas en un formato común para que estén disponibles para evaluación geométrica y gráfica. En 1971, uno de los programas de Meyer, SEARCH, permitió a los investigadores acceder de forma remota a la información de la base de datos para estudiar las estructuras de proteínas sin conexión. [8] SEARCH fue fundamental para permitir la creación de redes, lo que marcó el comienzo funcional de la AP.

El Protein Data Bank se anunció en octubre de 1971 en Nature New Biology [9] como una empresa conjunta entre el Cambridge Crystallographic Data Center, Reino Unido y el Laboratorio Nacional Brookhaven, EE. UU.

Tras la muerte de Hamilton en 1973, Tom Koeztle asumió la dirección de la AP durante los siguientes 20 años. En enero de 1994, Joel Sussman, del Instituto de Ciencias Weizmann de Israel, fue nombrado director del AP. En octubre de 1998, [10] el AP fue transferido al Laboratorio de Investigación en Bioinformática Estructural (RCSB) [11] la transferencia se completó en junio de 1999. La nueva directora fue Helen M. Berman de la Universidad de Rutgers (una de las instituciones gestoras de el RCSB, el otro es el San Diego Supercomputer Center en UC San Diego). [12] En 2003, con la formación de la wwPDB, la AP se convirtió en una organización internacional. Los miembros fundadores son PDBe (Europa), [2] RCSB (EE.UU.) y PDBj (Japón). [3] El BMRB [5] se incorporó en 2006. Cada uno de los cuatro miembros de wwPDB puede actuar como centro de depósito, procesamiento de datos y distribución de datos PDB. El procesamiento de datos se refiere al hecho de que el personal de wwPDB revisa y anota cada entrada enviada. [13] A continuación, se comprueba automáticamente la plausibilidad de los datos (el código fuente [14] de este software de validación se ha puesto a disposición del público de forma gratuita).

La base de datos de la AP se actualiza semanalmente (UTC + 0 el miércoles), junto con su lista de existencias. [16] A 1 de abril de 2020 [actualización], el AP incluía:

Experimental
Método
Proteínas Ácidos nucleicos Proteína / ácido nucleico
complejos
Otro Total
difracción de rayos X 135170 2097 6945 4 144216
RMN 11337 1325 264 8 12934
Microscopio de electrones 3475 35 1136 0 4646
Híbrido 155 5 3 1 164
Otro 286 4 6 13 309
Total: 150423 3466 8354 26 162269
134,146 estructuras en el PDB tienen un archivo de factor de estructura. 10,289 estructuras tienen un archivo de restricción de RMN. 4.814 estructuras en el PDB tienen un archivo de cambios químicos. 4.718 estructuras en el PDB tienen un archivo de mapa 3DEM depositado en EM Data Bank

La mayoría de las estructuras se determinan mediante difracción de rayos X, pero aproximadamente el 10% de las estructuras se determinan mediante RMN de proteínas. Cuando se usa la difracción de rayos X, se obtienen aproximaciones de las coordenadas de los átomos de la proteína, mientras que con la RMN se estima la distancia entre pares de átomos de la proteína. La conformación final de la proteína se obtiene a partir de RMN resolviendo un problema de geometría de distancia. Después de 2013, se determina un número creciente de proteínas mediante microscopía crioelectrónica. Al hacer clic en los números de la tabla externa vinculada, se muestran ejemplos de estructuras determinadas por ese método.

Para las estructuras PDB determinadas por difracción de rayos X que tienen un archivo de factor de estructura, se puede ver su mapa de densidad electrónica. Los datos de tales estructuras se almacenan en el "servidor de densidad de electrones". [17] [18]

Históricamente, el número de estructuras en la AP ha crecido a un ritmo aproximadamente exponencial, con 100 estructuras registradas en 1982, 1.000 estructuras en 1993, 10.000 en 1999 y 100.000 en 2014. [19] [20]

El formato de archivo utilizado inicialmente por la PDB se denominó formato de archivo PDB. El formato original estaba restringido por el ancho de las tarjetas perforadas de computadora a 80 caracteres por línea. Around 1996, the "macromolecular Crystallographic Information file" format, mmCIF, which is an extension of the CIF format was phased in. mmCIF became the standard format for the PDB archive in 2014. [21] In 2019, the wwPDB announced that depositions for crystallographic methods would only be accepted in mmCIF format. [22]

An XML version of PDB, called PDBML, was described in 2005. [23] The structure files can be downloaded in any of these three formats, though an increasing number of structures do not fit the legacy PDB format. Individual files are easily downloaded into graphics packages from Internet URLs:

  • For PDB format files, use, e.g., http://www.pdb.org/pdb/files/4hhb.pdb.gz or http://pdbe.org/download/4hhb
  • For PDBML (XML) files, use, e.g., http://www.pdb.org/pdb/files/4hhb.xml.gz or http://pdbe.org/pdbml/4hhb

The " 4hhb " is the PDB identifier. Each structure published in PDB receives a four-character alphanumeric identifier, its PDB ID. (This is not a unique identifier for biomolecules, because several structures for the same molecule—in different environments or conformations—may be contained in PDB with different PDB IDs.)

The structure files may be viewed using one of several free and open source computer programs, including Jmol, Pymol, VMD, and Rasmol. Other non-free, shareware programs include ICM-Browser, [24] MDL Chime, UCSF Chimera, Swiss-PDB Viewer, [25] StarBiochem [26] (a Java-based interactive molecular viewer with integrated search of protein databank), Sirius, and VisProt3DS [27] (a tool for Protein Visualization in 3D stereoscopic view in anaglyph and other modes), and Discovery Studio. The RCSB PDB website contains an extensive list of both free and commercial molecule visualization programs and web browser plugins.


The UNC-45 Myosin Chaperone

3.3 Overall Bent Shape of UCS Proteins

Each of the three UCS protein crystal structures presents a molecule with an overall bent structure, although the angle of the bend differs ( Figure 4.5(c) ). They are roughly 32°, 30°, and 84° for Drosophila, C. elegans, y S. cerevisiae respectivamente. The smaller angles of the fly and worm structures result from the proteins traversing more than 200° on a circular plane back toward the direction of the N-terminus. The bent shape is at odds with previous experiments that suggested a more extended form of the protein, based on the protein envelope obtained through small angle X-ray scattering (SAXS) ( Lee et al., 2011a ) and electron microscopy of rotary shadowed molecules ( Srikakulam et al., 2008 ). SAXS further suggested that the extended conformation results from significant conformational flexibility, even within the UCS domain. Recent molecular dynamic simulations also suggest a more planar conformation ( Fratev et al., 2013 ). This raises the question as to whether the severe bend is an artifact of the crystallization conditions and does not play a role in UNC-45’s biological function. In addition, even the same protein can show differences in the bend angle for instance, the crystal structure of the Drosophila Leu63Met mutant agrees with the native protein crystal structure, but its unit cell is slightly different from that of the native construct ( Lee et al., 2011a ). Their comparison suggests some degree of relative motion between the central and the UCS domains. Overall, investigating whether the protein’s flexibility has functional importance is critical.