Universidad Peruana Cayetano Heredia
Departamento de Bioquímica, Biología Molecular y Farmacia

Bioinformática I
Introducción a la Bioinformática: Análisis de Secuencias.  2007-I

Profesor:  Mirko Zimic

Creditaje: (4 horas crédito)

Horario de clases
Lunes 10:00-12:00 pm    
Miércoles 10:00-12:00 pm         Aula Interactiva - LID
Inicio de clases: Lunes 12 de Marzo

Asistente: Daniel Rueda, MSc(c)

Descargar syllabus

Relación de grupos para exposiciones


Horas de consulta
Martes y Jueves, 12:00 - 1:00pm,  Unidad de Bioinformática LID

Resumen
Este curso proveerá un panorama global de los principales tópicos de la Bioinformática, haciendo énfasis en el análisis de secuencias de ADN y proteínas así como en el modelamiento y análisis estructural de biomoléculas.

Prerequisitos: Bioquímica I, conocimientos básicos del internet y manejo de programas browsers y correo electrónico. Se recomienda fuertemente a los alumnos en obtener una cuenta de correo electrónico.

Evaluación: La evaluación de los estudiantes estará basada en:
Exámenes 1, 2, 3 y 4 (el promedio simple representa el 40% de la nota final)
Prácticas (el promedio simple representa el 30% de la nota final)
Presentaciones/exposiciones (15%)
Proyecto  (15%)

 

Libro Texto:   Bioinformatics, Sequence and Genome Análisis. David W. Mount.    (descargar)
                        Bioinformatics for dummies. J.M. Claverie, Cedric Notredame (CN)
                        Programación en Perl (descargar)

CD del curso: Será distribuído el primer día de clase. Incluyen los artículos selectos del curso y el resto del material.


Relación de grupos para exposiciones

Cronograma de clases: 

Semana 1.1: Introducción. Bases de Datos Biológicas.  (Mount cap 1) (CN cap1, cap2, cap3:74-94)
(slides clase) (EMBL) [(SRS ppt)  (tutorial SRS)]  (art1, art2, art3, art4[Grupo #1] 
Semana 1.2: Búsquedas en las Bases de Datos Biológicas (guía 1)

Semana 2.1: Alineamiento simple de secuencias (alineamiento local y global, matrices de ‘score’). (Mount cap3) (CN cap 8: 267-278) 
(slides clase) (Matriz BLOSUM) (art1, art2, art3, art4, art5)
[Grupo #2] 
Semana 2.2: Alineamiento simple de secuencias: Clustal,  Macaw. Servidores de alineamiento en línea  (guía 2)

Semana 3.1: Alineamiento múltiple de secuencias (Mount cap 4) (CN cap 8, cap 9), Alineamiento matricial, Dot plot
(slides clase 1)  (slides clase 2)  (HMM)
  [Grupo #3] 
Semana 3.2: Alineamiento múltiple de secuencias: Clustal. WinDNA  (guía 3.1)  (guía 3.2)

Semana 4.1: Bases de datos de genomas. Secuencias únicas y repetitivas. Código genético (universal y particulares). Transcripción y traducción, ORF, intrones cDNA. (CN cap3: 95-113) 
(slides clase) (genoma humano)
[Grupo #4] 
Semana 4.2: Exploración de bases de genomas. Uso de las herramientas COG, TaxPlot. Transcripción/Traducción. (guía 4)
PRIMER EXAMEN (11 de abril)    (dnawin)

Semana 5.1: Búsqueda de secuencias similares en bases de datos. BLAST (blastn, blastp, blastx, etc),  servidores de identificación de repeticiones y regiones de baja complejidad. (Mount cap 7) (CN cap 7). 
(slides clase)  (FASTA 1 FASTA 2)
[Grupo #5] 
Semana 5.2: BLAST,  alineamiento matricial (matrix plot), búsqueda de repeticiones. Regiones de baja complejidad.
(guía 5)

Semana 6.1:
Predicción de la estructura secundaria del RNA. (Mount cap 5) (CN cap 12) 
[Grupo #1]  (slides clase) (folding RNA)
Semana 6.2: RNAStructure, mfold. (guía 6)

Semana 7.1: Características termodinámicas del ADN. Hibridización de oligonucleótidos. Cinéticas de hibridación de oligonucleótidos complementarios. Criterios para el diseño de primers. Estructuras de ADN-ARN (Mount cap5) 
[Grupo #2]  (slides clase) (art1) (art2) (art3) (art4) (art5) (art6)
Semana 7.2: Servidores en línea para diseño de primers. (guía 7)

Semana 8.1: Evolución molecular. Teoría Neutral, Teoría Seleccionista, Teoría Mutacionalista, Teoría de la Presión Termodinámica.
[Grupo #3]   (slides clase) (slides clase 2)  (teoria neutral & selección natural) (teoría neutral)
Semana 8.2:
SEGUNDO EXAMEN PARCIAL

Semana 9.1: Reconstrucción filogenética. Experimentos de evolución in-vitro. Reconstrucción de dendrogramas para patrones polimórficos (RFLP, SSCP, spoligotyping, etc.) (Mount cap6) (CN cap 13)  [Grupo #4]  (slides clase)
Semana 9.2: Phylip, PAUP, DAMBE, Tree of Life (guía 9) (sec. RFLP) (sec. pncA) (sec. Paup Dambe) (manuales)

Semana 10.1: Presentación de proyectos
Semana 10.2: Presentación de proyectos

Semana 11.1: Predicción de genes. (Mount cap 8)
[Grupo #5]  (slides clase1) (slides clase 2) (promoto E.coli) (promotor eucariotes)
Semana 11.2: Predicción de Promotores, predicción de ORF, frecuencia de codones, frecuencia de nucleótidos, predicción de péptido señal, localización celular de proteínas.(dnawin) (guía 11)

Semana 12.1: Interacción radiación-materia. Métodos experimentales de predicción de estructuras moleculares. Protein Data Bank. Los archivos PDB y sus características. Factor beta. Perfiles de hidrofobicidad y de otras características físicoquímicas. (Mount cap9) (CN cap 11)
[Grupo #1]  (slides clase)
Semana 12.2:
Manejo de archivos PDB, visualización de estructuras moleculares: Rasmol, SwissPdViewer, servidores de predicción de perfiles de hidrofobicidad.
TERCER EXAMEN PARCIAL

Semana 13.1: Clasificación de estructuras de proteínas. Modelamiento por homología, Modelamiento por Threading y ab initio (Mount cap 9)(CN cap4, cap11:341-362) [Grupo #2]  (model.homología) (model.threading) (alineamiento estructural) (expo. ab initio)
Semana 13.2:  
Manejo del servidor Swiss Model. Manejo de servidores para modelamiento por threading

Semana 14.1: Dinámica Molecular y Minimización de energía  [Grupo #3]  (Dinam.molecular) (minimiz.energía) (expo. forcefields)
Semana 14.2: Dinámica molecular usando Hyperchem

Semana 15.1: Desarrollo de drogas y vacunas empleando herramientas bioinformáticas [Grupo #4 y Grupo #5]  (desarrollo de drogas vacunas) (expo: biología del MHC HLA)
Semana 15.2: Predicción de epítopes inmunogénicos, MHC I, II.

Semana 16.1: Entrega de proyectos y presentación final.
Semana 16.2: CUARTO EXAMEN  (4 de julio)

---------------------------------------------------------------------------------------------------

Prácticas
Las prácticas se entregarán electrónicamente, adjuntando una copia por correo electrónico a la dirección: mzimic@gmail.com.
El criterio de evaluación de las prácticas se basará fundamentalmente en la adecuada interpretación y discusión de los resultados obtenidos, debiendo seguirse el orden definido para la presentación de un informe científico (título, introducción, objetivos, métodos, resultados, discusión, recomendaciones)

Práctica 1: Fecha de entrega: 18 de Abril 2007  (descargar)
Práctica 2: Fecha de entrega:
Práctica 3: Fecha de entrega:
Práctica 4: Fecha de entrega:

Proyecto.
 
Fecha de entrega del proyecto:
Se entregará una copia impresa y se adjuntará una copia por correo electrónico a la dirección: mzimic@gmail.com
El proyecto debe mantener el formato estándar, debiendo incluir las siguientes secciones:

Título
Resumen
Objetivos
Fundamento Teórico
Materiales y Métodos
Resultados
Discusión


 



---------------------------------------------------------------------------------------------------

Libros de consulta: (Biblioteca de la Unidad de Bioinformática)
-
Bioinformatics, A Practical Guide to tthe Análisis of Genes and Proteins. Andreas D. Baxevanis.
-Phylogenetics Charles Semple)
-Phylogenetics Trees made easy: A how to maanual for molecular biologists
-Inferring Phylogenetics (Joseph Felsensteiin)
-Protein structure prediction (Igor F. Tsiggelny)
-Protein Engineering and Design  (Paull A. Carey)
-Mechanisms of protein folding (R.H. Pain)<
-Molecular Structure Bioinformatics
-Structure determination by X-Ray crystalloography (M.F.C. Ladd)
-Biophysics: An introduction (Rodney Coterrrill)
-Molecular Biophysics: Structures in motionn (Michel Daune)
-Biological Thermodynamics  (Donlad Haaynie)
-Vaccine Design:  The role of cytokinee networks (Gregory Gregoriadis)
-Statistical methods for bioinformatics&nbssp; (Warren J. Ewens)
-Microarray: Gene Expression Data Analysis<
-Phylogenetic Analysis Using Parsimony and Other Methods.
David L. Swofford.
-Physical Approaches to Biological Evolution. Mikhail V. Volkenstein.        
-
Dynamics of Proteins and Nucleic Acids. J. Andrew McCammon and Stephen C. Harvey.
-Molecular Structures Bioinformatics
-Beginning Perl for bioinformatics (James Tisdall)
-Genomic Perl (Rex A. Dwyer)

 

Otros libros interesantes

 

Revistas
Advances in Biophysics Full text journal online
Biochemical and biophysical research communications Full text journal online
Bioinformatics Full text journal online. (recomendado )
Bulletin of Mathematical Biology Full text journal onlineGenomics Full text journal online
Cladistics Full text journal online
Journal of Human Evolution Full text journal online
Journal of Molecular Modeling Full text journal online
Molecular Phylogenetics and Evolution Full text journal online
Journal of Structural Biology Full text journal online
Journal of Theoretical Biology Full text journal online

 

Discusión del libro texto: Bioinformatics (A.D. Baxevanis)

-------------------------------------------------------------------------------------------
 

Servidores WEB importantes:

LOS MÁS VISITADOS
ExPASy Molecular Biology Server
NCBI (National Center for Biotechnology and Information)

Expasy Proteomics Tools
ABIM Online Analysis tools
Weizmann Institute of Bioinformatics
Bioinformatics tools setup in the BIOINFO system
Welcome to the GenomeWeb

BASES DE DATOS
Protein Database searching
Protein family Databases
Protein Pattern and Domain Databases
Protein Interaction Databases
Databases - Weizmann Institute of Science
SRS (Sequence Retrieval System)
Genome databases
GeneDB http://www.genedb.org/

ALINEAMIENTO DE SECUENCIAS
ClustalW (EMBL-EBI)
LALIGN
DIALIGN - Multiple sequence alignment based on segment-to-segment comparison, at University of Bielefeld, Germany
PipMaker (full genome alignment)
Sequence Analysis - Weizmann Institute of Science
Protein Multiple Sequence Analysisl
T-Coffee
STRAP - Structural Alignment Program for Proteins
VSNS BioComputing Division Multiple Alignment Resource Page
(Link)

ALINEAMIENTO DE GENOMAS
Mummer
(http://mummer.sourceforge.net/)

MATRIX-PLOT
Fr33 http://www.fr33.net/bio/na_dotplot.php

Matrix Plot http://www.cbs.dtu.dk/services/MatrixPlot/
Matrix Plot 2 http://www.cbs.dtu.dk/services/MatrixPlot/mutualNucl/index.html

GENÓMICA
Genomics - Weizmann Institute of Science

MAVID - multiple alignment program for large genomic regions (http://baboon.math.berkeley.edu/mavid/)
TIGR - Mummer   http://www.tigr.org/software/mummer/ (whole genome alignment)
Open Reading Frame (ORF) finder  (NCBI)
TaxPlot  (
Protein homologs in Complete Microbial / Eukaryotic genomes)
COGs  (Clusters of Orthologous Groups of proteins) Phylogenetic classification of proteins encoded in complete genomes

PREDICCION DE GENES CODANTES
TestCode (http://helix.nih.gov/docs/gcg/testcode.html)
GLIMMER (http://www.tigr.org/~salzberg/glimmer.html)

DNA -> PROTEÍNA
Translate  - Translates a nucleotide sequence to a protein sequence
Transeq - Nucleotide to protein translation from the EMBOSS package
Graphical Codon Usage Analyser - Displays the codon bias in a graphical manner
BCM search launcher - Six frame translation of nucleotide sequence(s)
Backtranslation - Translates a protein sequence back to a nnucleotide sequence
Genewise - Compares a protein sequence to a genomic DNA sequence, allowing for introns and frameshifting errors
FSED - Frameshift error detection
LabOnWeb - Elongation, expression profiles and sequence analysis of ESTs using Compugen LEADS clusters
List of gene identification software sites

PERFILES DE HIDROFOBICIDAD
ProtScale  - Amino acid scale representation (Hydrophobicity, other conformational parameters, etc.)
Drawhca - Draw an HCA (Hydrophobic Cluster Analysis) plot of a protein sequence
Hydrophobic profile prediction at the Weizmann Bioinformatics Institute
Analysis of protein sequence (physical chemical profiles)
Protein General Sequence Analysis
GENO3D (AUTOMATIC MODELING OF PROTEINS THREE-DIMENSIONAL STRUCTURE)

PREDICCIÓN DE TOPOLOGÍA DE PROTEÍNAS
Transmembrane Region Prediction

HMMTOP - Prediction of transmembrane helices and topology of proteins (Hungarian Academy of Sciences)
PredictProtein - Prediction of transmembrane helix location and topology (Columbia University)
SOSUI - Prediction of transmembrane regions (TUAT; Tokyo Univ. of Agriculture & Technology) TMAP - Transmembrane detection based on multiple sequence alignment (Karolinska Institut; Sweden) TMHMM - Prediction of transmembrane helices in proteins (CBS; Denmark)
TMpred - Prediction of transmembrane regions and protein orientation (EMBnet-CH)
TopPred 2 - Topology prediction of membrane proteins (Stockholm University)
Protein 2D-PAGE Analysis


PREDICCIÓN DE ESTRUCTURA SECUNDARIA DE PROTEINAS

***Consensus Secondary Structure Prediction (IBCP)***
Protein Secondary Structure
GOR IV (Garnier et al, 1996)
HNN - Hierarchical Neural Network method (Gueerrmmeur, 1997)
Jpred - A consensus method for protein secondary structure prediction at University of Dundee
nnPredict - University of California at San Francisco (UCSF)
PredictProtein - PHDsec, PHDacc, PHDhtm, PHDtopology, PHDthreader, MaxHom, EvalSec from Columbia University

VISUALIZADORES DE ESTRUCTURAS DE PROTEÍNAS
Protein Structure Viewers

ALINEAMIENTO ESTRUCTURAL
VAST (Vector Alignment Search Tool)
COMPARER

MODELAMIENTO POR HOMOLOGÍA
CAFASP 3D (list of 3D protein structure prediction servers)
Protein 3D structural analysis
SWISS-MODEL

GlobPlot - Protein disorder/order/globularity/domain predictor
DisEMBL - Protein disorder prediction
CATH  Protein Structure Classification
SCOP (Structural Classification of Proteins)
DALI  (Domain Dictionary)
FSSP  (Dali fold classification)

MODELAMIENTO POR THREADING
3D-PSSM - Protein fold recognition using 1D and 3D sequence profiles coupled with secondary structure information (Foldfit)
Geno3d - Automatic modelling of protein three-dimensional structure
PSIPRED /Protein Structure Prediction Server

MODELAMIENTO AB-INITIO
HMMSTR / ROSETTA

PREDICCIÓN DE ESTRUCTURAS 3D
Protein 3D Structure analysis

GENO3D (AUTOMATIC MODELING OF PROTEINS THREE-DIMENSIONAL STRUCTURE)

COMPARACIÓN/VERIFICACIÓN DE ESTRUCTURAS MOLECULARES
RAPPER
What IF
Validation suite for protein structures
DALI - compare protein structures in 3D

PROTEÓMICA
Proteomics - Weizmann Institute of Science
Peptide Identification

PREDICCIÓN DE EPITOPES  LINEALES
ProPred  MHC Class-II Binding Peptide Prediction Server
***
ProPred-I
The Promiscuous MHC Class-I Binding Peptide Prediction Server
Antibody, MHC and Immunologycal Proteins

HLA_Bind - Prediction of MHC type I (HLA) peptide binding
SYFPEITHI - Prediction of MHC type I and II peptidee binding

PREDICCIÓN DE EPITOPES CONFORMACIONALES
Conformational Epitope Prediction - (202.41.70.74:8080/cgi-bin/cep.pl )
OCA and Conformational Epitope Prediction - (www-iphicles.rcsb.org/pdb/lists/pdb-l/200509/002884.html)
HSLS: CEP -- a conformational epitope prediction server - (www.hsls.pitt.edu/guides/genetics/tools/Other_Subject/URL1127484564/info)
CEP: a conformational epitope prediction server  (http://bioinfo.ernet.in/cep.htm)
References - ePitope Informatics - epitope prediction and protein ...
[PDF] BMC Immunology
[PDF]
Prediction of Three-Dimensional Structure and Mapping of ...

 PREDICCIÓN DE ESTRUCTURA 2D Y 3D EN ADN/ARN
Mfold:  
http://www.bioinfo.rpi.edu/applications/mfold/

DISEÑO DE PRIMERS
GeneFisher: 
http://bibiserv.techfak.uni-bielefeld.de/genefisher/
Primer 3

EDITORES DE SECUENCIAS
Protein Sequence Editors

----------------------------------------------------------------------------------------------

Links importantes

 

Software utilizado
PHYLIP (Programa para análisis filogenético)
RASMOL (Visualizador de estructuras moleculares 3D)
Swiss PDb Viewer (Visualizador de estructuras moleculares 3D avanzado).
MACAW (Programa para alineamiento múltiple de secuencias)
Oligocalculator (Programa para estimar parámetros termodinámicos de oligonucleótidos)
Power/Sample size calculators (Programa para estimar el poder y el tamaño de muestra estadístico)
GAUSSIAN

Ghemical
GROMOS
GROMACS
StructureLab
SIB-PAIR  http://www2.qimr.edu.au/davidD (Programa para trabajar en genetic linkage)
GAS  http://users.ox.ac.uk/~ayoung/gas.html  (Programa para trabajar en genetic linkage)

 


Página WEB personal de Mirko Zimic
Enviar un Email a Mirko Zimic


Última modificación: 7 de Marzo, 2007