Universidad Peruana Cayetano Heredia
Departamento de Bioquímica, Biología Molecular y Farmacología

Bioinformática I: Análisis de Secuencias
Introducción a la Bioinformática

2008-I

Profesor:  Mirko Zimic  PhD

Creditaje: (4 horas crédito)

Horario de clases
Lunes y Miércoles de 10:00-12:00 pm                 Aula Interactiva - LID
Inicio de clases: Lunes 24 de Marzo

 

Jefe de Práctica:  MSc(c). Daniel Velasquez
                      

NOTAS FINALES 


Horas de consulta
Jueves, 12:00 - 1:00pm,  Unidad de Bioinformática LID

Resumen
Este curso proveerá un panorama global de los principales tópicos de la Bioinformática, haciendo énfasis en el análisis de secuencias de ADN y proteínas así como en el modelamiento y análisis estructural de biomoléculas.

Prerequisitos: Bioquímica.

Evaluación: La evaluación de los estudiantes estará basada en:
Exámenes 1, 2, 3 y 4 (el promedio simple representa el 40% de la nota final). Los exámenes serán aplicados de 10:00 a 11:30, seguidos de la discusión del mismo.
Prácticas (el promedio simple representa el 30% de la nota final)
Presentaciones/exposiciones (15%)
Proyecto  (15%)
Libro Tex
to:   Bioinformatics, Sequence and Genome Análisis. David W. Mount.
                        Bioinformatics for dummies. J.M. Claverie, Cedric Notredame (CN)



Descargar syllabus

Grupos asignados

 


Cronograma de clases: 

 

Clase 1 (Lu 24 Mar): Introducción general.

Referencia: (Mount introducción) (CN introducción)
Herramientas: PubMed, NCBI books

Actividad: Identificar y descargar referencias bibliográficas

(slides)

 

Clase 2 (Mi 26 Mar): Bancos de Datos Biológicos I: NCBI (genbank), EMBL.
Referencia:
(Mount cap 1) (CN cap1, cap2, cap3:74-94)
Herramientas: DNAwin

Actividad: Identificar y descargar secuencias de ADN y proteína

(slides) 

 

Clase 3 (Lu 31 Mar): Bancos de Datos Biológicos II: Swissprot.
Referencia:
(Mount cap 1) (CN cap1, cap2, cap3:74-94)
Herramientas: Swissprot proteomic tools
Actividad: Predicción de péptido señal, PM, PI, localización celular
(slides)
 

 

Clase 4 (Mi 2 Abr): Bancos de Datos Biológicos III: Protein Data Bank.:]

Referencia: (Mount cap9) (CN cap 11)

Herramientas: SwissPdbviewer

Actividad: Alineamiento estructural, mutagénesis dirigida  (guía)

(slides 1,  2)

 

Clase 5 (Lu 7 Abr): Bancos de Datos Biológicos IV: Drug Data Bank.

Referencia: (Mount cap9) (CN cap 11)

Herramientas: SwissPdbviewer, Servidores de protonación, STATA

Actividad: Determinación de la estabilidad de proteínas; determinación de la varianza posicional   (expo. PZAsa mutaciones)

 

Clase 6 (Mi 9 Abr): Alineamiento simple de secuencias I: Matrices de transición

Referencia: (Mount cap3) (CN cap 8: 267-278)
Herramientas: Clustal (guía) (clustalX)

Actividad: Identificación de dominios similares, similitud global y polimorfismos de secuencias

(slides 1, 2

Clase 7 (Lu 14 Abr): Alineamiento simple de secuencias II: Alineamiento global vs. Local.

Referencia: (Mount cap3) (CN cap 8: 267-278)
Herramientas: Clustal, Macaw, Servidores de alineamiento en línea (guía)   (expo. matrices de sustitución)

Actividad: Identificación de dominios similares, similitud global y polimorfismos de secuencias

(slides 1, 2

 

Clase 8 (Mi 16 Abr): EXAMEN I / discusión examen I  (descargar examen práctico)

 

Clase 9 (Lu 21 Abr): Alineamiento múltiple de secuencias.
Referencia: (Mount cap 4) (CN cap 8, cap 9)

Herramientas: Clustal, Macaw, Servidores de alineamiento en línea (guía)

Actividad: Identificación de secuencias cercanas y distantes. Identificación de dominios comunes similares y de secuencias blanco para primers.

(slides 1)
                       

Clase 10 (Mi 23 Abr): Alineamiento matricial

Referencia: (Mount cap 7) (CN cap 7).
Herramientas: DotPlot (guía)

Actividad: Identificación de estructura secundaria, y secuencias repetitivas (zonas de baja complejidad)

(slides 1

Clase 11 (Lu 28 Abr): BLAST: Búsqueda de secuencias similares

Referencia: (Mount cap 7) (CN cap 7).
Herramientas: NCBI BLAST (blastn, blastp, blastx, etc.) (guía)   (expo. cadenas de Markov)

Actividad: Identificación de dominios y secuencias homólogas en distintas especies

(slides 1

Clase 12 (Mi 30 Abr): Análisis de genomas. Bases de datos de genomas.

Referencia: (Mount cap 10) (CN cap3:95-115, cap5:141-148, 160-172, cap6:173-189)
Herramientas:
NCBI base de datos de genomas, COG (cluster of orthologous genes), TaxPlot

Actividad: Secuencias únicas y repetitivas. Manejo del servidor TaxPlot, COG. Código genético (universal y particulares). Transcripción y traducción, ORF, intrones cDNA. (guía)    (expo. COG)   (expo. COG & resistencia PZA TB)

(slides 1

 

Clase 13 (Lu 5 May): Estructura secundaria de ácidos nucleicos.

Referencia: (Mount cap 5) (CN cap 12)
Herramientas: RNAStructure, mfold

Actividad: Predicción de estructuras secundarias de secuencias de DNA, RNA (guía)

(slides 1) 

 

Clase 14 (Mi 7 May): Características termodinámicas del ADN. Hibridización de oligonucleótidos. Cinéticas de hibridación de oligonucleótidos complementarios. Criterios para el diseño de primers.

Referencia: (Mount cap 5)
Herramientas:
Servidores en línea para diseño de primers

Actividad: Diseño de primers  (guía)

(slides 1

 

Clase 15 (Lu 12 May): Evolución molecular. Teoría Neutral, Teoría Seleccionista, Teoría Mutacionalista, Teoría de la Presión Termodinámica.
Referencia: Artículos selectos (Evolución in-vitro)
Herramientas:
DNAwin, herramientas online (Swissprot: proteomic tools)

Actividad: Determinación del codon usage

(slides 1, 2)


Clase 16 (Mi 14 May): EXAMEN II / discusión examen II

 

Clase 17 (Lu 19 May): Presentación de avances de proyectos

 

Clase 18 (Mi 21 May): Reconstrucción filogenética I.
Referencia: (Mount cap6) (CN cap 13)
Herramientas:
Phylip, Paup, Dambe

Actividad: Reconstrucción filogenética a partir de secuencias de ADN  (guia) (manuales) (secuencias pncA) (datos RFLP) (secuencias DAMBE)

(slides 1, 2)

 

Clase 19 (Lu 26 May): Reconstrucción filogenética II.

Referencia: (Mount cap6) (CN cap 13)
Herramientas:
Phylip, Paup, Dambe

Actividad: Reconstrucción dedrogramas a partir de patrones RFLP, SSCP, spoligotyping. (guia) (manuales) (secuencias pncA) (datos RFLP) (secuencias DAMBE)

 (slides 1, 2)

 

Clase 20 (Mi 28 May):

Predicción de genes.

Referencia: (Mount cap 8)
Herramientas:
Artemis

Actividad: Predicción de secuencias codantes

(slides)

 

Clase 21 (Lu 2 Jun): Interacción radiación-materia. Métodos experimentales de predicción de estructuras moleculares.
Referencia: (Mount cap9) (CN cap 11)
Herramientas:
Swisspdbviewer
Actividad: Los archivos PDB y sus características. Factor beta. Perfiles de hidrofobicidad y de otras características físicoquímicas.

(slides)

 

Clase 22 (Mi 4 Jun): EXAMEN III / discusión examen III

 

Clase 23 (Lu 9 Jun): Modelamiento por homología I.
Referencia: (Mount cap9)
Herramientas: Servidor SwissModel,
Swisspdbviewer
Actividad: Predecir estructuras de proteínas a partir de la secuencia de aminoácidos

(slides 1, 2)

 

Clase 24 (Mi 11 Jun): Modelamiento por homología II
Referencia: (Mount cap9)
Herramientas: Servidor SwissModel,
Swisspdbviewer
Actividad: Predecir estructuras de proteínas a partir de la secuencia de aminoácidos

(slides 1, 2)

 

Clase 25 (Lu 16 Jun): Modelamiento por homología III
Referencia: (Mount cap9)
Herramientas: Servidor SwissModel,
Swisspdbviewer
Actividad: Predecir estructuras de proteínas a partir de la secuencia de aminoácidos

(slides 1, 2)

 

Clase 26 (Mi 18 Jun): Modelamiento por threading. Rosetta. Threading local y global.
Referencia: (Mount cap9)
Herramientas: Fugue, SUSOI, 3Dpssm, Rosetta
Actividad: Predecir estructuras de proteínas a partir de la secuencia de aminoácidos

(slides)

 

Clase 27 (Lu 23 Jun): Refinamiento de estructuras: Dinámica molecular
Referencia: Lecturas selectas
Herramientas: Hyperchem, Ghemical
Actividad: Refinar estructuras de proteínas

(slides 1, 2)

 

Clase 28 (Mi 25 Jun): Refinamiento de estructuras: Minimización de energía
Referencia: Lecturas selectas
Herramientas: Hyperchem, Ghemical
Actividad: Refinar estructuras de proteínas

(slides)

 

Clase 29 (Lu 30 Jun): Validación de estructuras moleculares. Diseño de drogas y vacunas
Referencia: Lecturas selectas
Herramientas: Servidores Validate, What If. Autodock
Actividad: Validar estructuras de proteínas. Realizar docking proteína-droga

(slides 1, 2)

 

Clase 30 (Mi 2 Jul): Presentación final de proyectos

 

Clase 31 (Lu 7 Jul): EXAMEN  IV / discusión examen IV

 

Clase 32 (Mi 9 Jul): Exámene sustitutorio

---------------------------------------------------------------------------------------------------

 

 

Prácticas
Las prácticas se entregarán impresas, en un documento de no más de 4 páginas, a simple espacio, en typo Times New Roman, 11.
El criterio de evaluación de las prácticas se basará fundamentalmente en la adecuada interpretación y discusión de los resultados obtenidos, debiendo seguirse el orden definido para la presentación de un informe científico (título, introducción, objetivos, métodos, resultados, discusión, bibliografía)

Práctica 1: Fecha de entrega: Lunes 21 de Abril
Práctica 2: Fecha de entrega: Lunes 26 de Mayo
Práctica 3: Fecha de entrega: Miércoles 2 de Julio

Proyecto. 
Fecha de entrega del proyecto: Se entregarán avances de acuerdo al cronograma, y el proyecto final se entregará durante la última semana de clases.
Se entregará una copia impresa. El proyecto debe mantener el formato estándar de una publicación científica, debiendo incluir las siguientes secciones:

Título
Resumen
Objetivos
Fundamento Teórico
Materiales y Métodos
Resultados
Discusión
Bibliografía

 


---------------------------------------------------------------------------------------------------

Libros de consulta: (Biblioteca de la Unidad de Bioinformática)
-
Bioinformatics, A Practical Guide to tthe Análisis of Genes and Proteins. Andreas D. Baxevanis.
-Phylogenetics Charles Semple)
-Phylogenetics Trees made easy: A how to maanual for molecular biologists
-Inferring Phylogenetics (Joseph Felsensteiin)
-Protein structure prediction (Igor F. Tsiggelny)
-Protein Engineering and Design  (Paull A. Carey)
-Mechanisms of protein folding (R.H. Pain)<
-Molecular Structure Bioinformatics
-Structure determination by X-Ray crystalloography (M.F.C. Ladd)
-Biophysics: An introduction (Rodney Coterrrill)
-Molecular Biophysics: Structures in motionn (Michel Daune)
-Biological Thermodynamics  (Donlad Haaynie)
-Vaccine Design:  The role of cytokinee networks (Gregory Gregoriadis)
-Statistical methods for bioinformatics&nbssp; (Warren J. Ewens)
-Microarray: Gene Expression Data Analysis<
-Phylogenetic Analysis Using Parsimony and Other Methods. David L. Swofford.
-Physical Approaches to Biological Evolution. Mikhail V. Volkenstein.        
-Dynamics of Proteins and Nucleic Acids. J. Andrew McCammon and Stephen C. Harvey.
-Molecular Structures Bioinformatics
-Beginning Perl for bioinformatics (James Tisdall)
-Genomic Perl (Rex A. Dwyer)

 

Otros libros interesantes

 

Revistas
Advances in Biophysics Full text journal online
Biochemical and biophysical research communications Full text journal online
Bioinformatics Full text journal online. (recomendado )
Bulletin of Mathematical Biology Full text journal onlineGenomics Full text journal online
Cladistics Full text journal online
Journal of Human Evolution Full text journal online
Journal of Molecular Modeling Full text journal online
Molecular Phylogenetics and Evolution Full text journal online
Journal of Structural Biology Full text journal online
Journal of Theoretical Biology Full text journal online

 

Discusión del libro texto: Bioinformatics (A.D. Baxevanis)

-------------------------------------------------------------------------------------------
 

Servidores WEB importantes:

 

LOS MÁS VISITADOS
ExPASy Molecular Biology Server
NCBI (National Center for Biotechnology and Information)

Expasy Proteomics Tools
ABIM Online Analysis tools
Weizmann Institute of Bioinformatics
Bioinformatics tools setup in the BIOINFO system
Welcome to the GenomeWeb

 

BASES DE DATOS
Protein Database searching
Protein family Databases
Protein Pattern and Domain Databases
Protein Interaction Databases
Databases - Weizmann Institute of Science
SRS (Sequence Retrieval System)
Genome databases
GeneDB http://www.genedb.org/


BASES DE DATOS ESTRUCTURALES
Cambridge Structural Database   CSD

Protein Data Bank PDB
The National Cancer Institute 3D structure databaseThe National Cancer Institute 3D structure database. ... The database is an extension of the NCI Drug Information System.
KEGG DRUG KEGG DRUG Database. drug entry. (Example) D00109. KEGG DRUG is a chemical structure based information resource for all approved drugs in Japan
3D Database Searching in Drug Discovery 3D Database Searching in Drug Discovery. John H. VanDrie ..... DOCK takes as input a crystallographically-determined protein structure with an inhibitor
IngentaConnect A receptor-ligand database for structure-based drug ... A receptor-ligand database for structure-based drug design. Author: Barnickel G.1. Source: Journal of Molecular Structure: THEOCHEM, Volume 463, Number 1
Super Drug Database You need MDL Chime to display this structure. Super Drug Database. Disclaimer: The content of SuperDrug is intended for educational and scientific
Immune Epitope Data Base The Immune Epitope Database and Analysis Resource (IEDB)

 


ALINEAMIENTO DE SECUENCIAS
ClustalW (EMBL-EBI)
LALIGN
DIALIGN - Multiple sequence alignment based on segment-to-segment comparison, at University of Bielefeld, Germany
PipMaker (full genome alignment)
Sequence Analysis - Weizmann Institute of Science
Protein Multiple Sequence Analysisl
T-Coffee
STRAP - Structural Alignment Program for Proteins
VSNS BioComputing Division Multiple Alignment Resource Page
(Link)

 

ALINEAMIENTO DE GENOMAS
Mummer
(http://mummer.sourceforge.net/)

 

MATRIX-PLOT
Fr33 http://www.fr33.net/bio/na_dotplot.php
Matrix Plot http://www.cbs.dtu.dk/services/MatrixPlot/
Matrix Plot 2 http://www.cbs.dtu.dk/services/MatrixPlot/mutualNucl/index.html

 

GENÓMICA
Genomics - Weizmann Institute of Science
MAVID - multiple alignment program for large genomic regions (http://baboon.math.berkeley.edu/mavid/)
TIGR - Mummer   http://www.tigr.org/software/mummer/ (whole genome alignment)
Open Reading Frame (ORF) finder  (NCBI)
TaxPlot  (
Protein homologs in Complete Microbial / Eukaryotic genomes)
COGs  (Clusters of Orthologous Groups of proteins) Phylogenetic classification of proteins encoded in complete genomes

PREDICCION DE GENES CODANTES
TestCode (http://helix.nih.gov/docs/gcg/testcode.html)
GLIMMER (http://www.tigr.org/~salzberg/glimmer.html)

 

DNA -> PROTEÍNA
Translate  - Translates a nucleotide sequence to a protein sequence
Transeq - Nucleotide to protein translation from the EMBOSS package
Graphical Codon Usage Analyser - Displays the codon bias in a graphical manner
BCM search launcher - Six frame translation of nucleotide sequence(s)
Backtranslation - Translates a protein sequence back to a nnucleotide sequence
Genewise - Compares a protein sequence to a genomic DNA sequence, allowing for introns and frameshifting errors
FSED - Frameshift error detection
LabOnWeb - Elongation, expression profiles and sequence analysis of ESTs using Compugen LEADS clusters
List of gene identification software sites

PERFILES DE HIDROFOBICIDAD

ProtScale  - Amino acid scale representation (Hydrophobicity, other conformational parameters, etc.)
Drawhca - Draw an HCA (Hydrophobic Cluster Analysis) plot of a protein sequence
Hydrophobic profile prediction at the Weizmann Bioinformatics Institute
Analysis of protein sequence (physical chemical profiles)
Protein General Sequence Analysis
GENO3D (AUTOMATIC MODELING OF PROTEINS THREE-DIMENSIONAL STRUCTURE)

PREDICCIÓN DE TOPOLOGÍA DE PROTEÍNAS
Transmembrane Region Prediction
HMMTOP - Prediction of transmembrane helices and topology of proteins (Hungarian Academy of Sciences)
PredictProtein - Prediction of transmembrane helix location and topology (Columbia University)
SOSUI - Prediction of transmembrane regions (TUAT; Tokyo Univ. of Agriculture & Technology) TMAP - Transmembrane detection based on multiple sequence alignment (Karolinska Institut; Sweden) TMHMM - Prediction of transmembrane helices in proteins (CBS; Denmark)
TMpred - Prediction of transmembrane regions and protein orientation (EMBnet-CH)
TopPred 2 - Topology prediction of membrane proteins (Stockholm University)
Protein 2D-PAGE Analysis


PREDICCIÓN DE ESTRUCTURA SECUNDARIA DE PROTEINAS

***Consensus Secondary Structure Prediction (IBCP)***
Protein Secondary Structure
GOR IV (Garnier et al, 1996)
HNN - Hierarchical Neural Network method (Gueerrmmeur, 1997)
Jpred - A consensus method for protein secondary structure prediction at University of Dundee
nnPredict - University of California at San Francisco (UCSF)
PredictProtein - PHDsec, PHDacc, PHDhtm, PHDtopology, PHDthreader, MaxHom, EvalSec from Columbia University

 

VISUALIZADORES DE ESTRUCTURAS DE PROTEÍNAS
Protein Structure Viewers

ALINEAMIENTO ESTRUCTURAL
VAST
(Vector Alignment Search Tool)
COMPARER

SERVIDORES DE PROTONACIÓN
H++  http://biophysics.cs.vt.edu/H++/

 

MODELAMIENTO POR HOMOLOGÍA
CAFASP 3D (list of 3D protein structure prediction servers)
Protein 3D structural analysis
SWISS-MODEL
GlobPlot - Protein disorder/order/globularity/domain predictor
DisEMBL - Protein disorder prediction
CATH  Protein Structure Classification
SCOP (Structural Classification of Proteins)
DALI  (Domain Dictionary)
FSSP  (Dali fold classification)

 

MODELAMIENTO POR THREADING
3D-PSSM - Protein fold recognition using 1D and 3D sequence profiles coupled with secondary structure information (Foldfit)
Geno3d - Automatic modelling of protein three-dimensional structure
PSIPRED /Protein Structure Prediction Server

MODELAMIENTO AB-INITIO
HMMSTR / ROSETTA

 

PREDICCIÓN DE ESTRUCTURAS 3D
Protein 3D Structure analysis
GENO3D (AUTOMATIC MODELING OF PROTEINS THREE-DIMENSIONAL STRUCTURE)

COMPARACIÓN/VERIFICACIÓN DE ESTRUCTURAS MOLECULARES
RAPPER
What IF
Validation suite for protein structures
DALI - compare protein structures in 3D

PROTEÓMICA
Proteomics - Weizmann Institute of Science
Peptide Identification

 

PREDICCIÓN DE EPITOPES  LINEALES
ProPred  MHC Class-II Binding Peptide Prediction Server ***
ProPred-I
The Promiscuous MHC Class-I Binding Peptide Prediction Server
Antibody, MHC and Immunologycal Proteins

HLA_Bind - Prediction of MHC type I (HLA) peptide binding
SYFPEITHI - Prediction of MHC type I and II peptidee binding

 

PREDICCIÓN DE EPITOPES CONFORMACIONALES
Conformational Epitope Prediction - (202.41.70.74:8080/cgi-bin/cep.pl )
OCA and Conformational Epitope Prediction - (www-iphicles.rcsb.org/pdb/lists/pdb-l/200509/002884.html)
HSLS: CEP -- a conformational epitope prediction server - (www.hsls.pitt.edu/guides/genetics/tools/Other_Subject/URL1127484564/info)
CEP: a conformational epitope prediction server  (http://bioinfo.ernet.in/cep.htm)
References - ePitope Informatics - epitope prediction and protein ...
[PDF] BMC Immunology
[PDF] Prediction of Three-Dimensional Structure and Mapping of ...

 

 PREDICCIÓN DE ESTRUCTURA 2D Y 3D EN ADN/ARN
Mfold:   http://www.bioinfo.rpi.edu/applications/mfold/

DISEÑO DE PRIMERS
GeneFisher: 
http://bibiserv.techfak.uni-bielefeld.de/genefisher/
Primer 3

 

EDITORES DE SECUENCIAS
Protein Sequence Editors

----------------------------------------------------------------------------------------------

Links importantes

 

Software utilizado
PHYLIP (Programa para análisis filogenético)
RASMOL (Visualizador de estructuras moleculares 3D)
Swiss PDb Viewer (Visualizador de estructuras moleculares 3D avanzado).
MACAW (Programa para alineamiento múltiple de secuencias)
Oligocalculator (Programa para estimar parámetros termodinámicos de oligonucleótidos)
Power/Sample size calculators (Programa para estimar el poder y el tamaño de muestra estadístico)
GAUSSIAN
Ghemical
GROMOS
GROMACS
StructureLab
SIB-PAIR 
http://www2.qimr.edu.au/davidD (Programa para trabajar en genetic linkage)
GAS  http://users.ox.ac.uk/~ayoung/gas.html  (Programa para trabajar en genetic linkage)

 


Página WEB personal de Mirko Zimic
Enviar un Email a Mirko Zimic


Última modificación: 29 de Junio,  2008