All EBB short courses will be held from August 7 (Sunday) to 9 (Tuesday) at the Informatics Lab (LINF)
The Informatics Lab (LINF) is located underground at the "ICC Norte" beside the Computer Sciences Department (Departamento de Ciência da Computação). There will be signs written "ESCOLA BRASILEIRA DE BIOINFORMÁTICA" throughout the whole path from the "ICC Norte" entrance to LINF.
O Laboratorio de Informática (LINF) fica no subsolo do ICC Norte, ao lado do Departamento de Ciência da Computação. O acesso a partir da entrada norte do ICC Central estará marcado "ESCOLA BRASILEIRA DE BIOINFORMÁTICA" ao longo do caminho.
| |
8am-12pm |
8am-12pm |
M O R N I N G
|
Ronnie Alves
Post-Doctor Fellow - UFRGS/Brazil
(in Portuguese)
|
Roberto Togawa
Recursos Genéticos e Biotecnologia - EMBRAPA/Brazil
Sérgio de Alencar
Post-Doctor Fellow - Recursos Genéticos e Biotecnologia - EMBRAPA/Brazil
(in Portuguese)
|
| |
14pm-18pm |
14pm-18pm |
A F T E R N O O N
|
Peter Stadler
Leipzig University - Germany
(in English)
|
Tainá Raiol
Post-Doctor Fellow - UnB/Brazil
(in Portuguese)
|
Transcriptome Data Mining
Ronnie Alves
(UFRGS, Brazil)
Porque o interesse em transcriptômica?
O transcriptoma é conjunto completo de transcritos produzidos pelo genoma em qualquer momento. Grande parte de nossas células contém o mesmo genoma, independentemente do tipo de célula, estágio de desenvolvimento, ou condições ambientais. Por um outro lado, o transcriptoma varia consideravelmente nestas diferentes circunstancias em função dos diferentes padrões de expressão gênica.
Transcriptômica, também chamado de estudo do transcriptoma, é portanto uma maneira global de visualizar e tentar entender os padrões de expressão gênica.
Como o transcriptoma é estudado?
Atualmente existe uma gama diferenciada de tecnologias mas os mais populares ainda são os DNA Microarrays. Recentemente, surgiram os RNAseq, ganhando bastante espaço na comunidade cientifica. Apesar da discussão de que os RNAseq tendem a substituir os Microarrays num futuro próximo, existe ainda uma frente de pesquisadores que enxergam estas tecnologias como complementares.
Como os padrões de expressão gênica são identificados?
Através de testes estatísticos e técnicas de mineração de dados. Durante o curso vamos experimentar técnicas de:
- Diferenciação de expressão
- Classificação/Predição
- Agrupamentos [Clustering]
A Short Course in RNA Bioinformatics
Peter F. Stadler
(Leipzig University, Germany)
RNA molecules have been recognized as a major player in cellular
regulation. In many - but by no mean in all cases - functional RNAs exhibit
a well-conserved spatial structure that is crucial for their interactions
and hence eventually for their function. This structure is dominated by the
patterns of Watson-Crick and GU base pairs both thermodynamically and
kinetically. RNA structures therefore can be approximated at the level of
secondary structures, giving rise to a discrete (combinatorial) model that
nevertheless captures in good approximation the energetics and dynamics of
folding as well as evolutionary conservation. Since secondary structures
can be computed and compared with exact and efficient dynamic programming
algorithms, RNA bioinformatics has developed as a field with its own
technology distinct from, but bridging, the fields of sequence-based genome
informatics and structural biology.
In this short course I will first give an introduction into the theoretical
foundations of RNA folding algorithms and provide a broad overview of the
type of questions that can be addressed within the secondary structure
paradigm. The theory will be complemented by a set of show-case
applications, mostly from my own research experience, demonstrating
practical applications of the algorithmic possibilities. As a hands-on
practical component of the course we will consider a curious family of
microRNAs, whose evolutionary history we will attempt to trace, and whose
structural peculiarities we will try to identify. In contrast to most other
microRNAs, mir-451 is generated without the help either Drosha or Dicer.
Goal of the practical part is to gain insight into how the ncRNA is different
from other microRNAs.
Computational Tools for Protein Structure Analysis and Modelling
Roberto Togawa e Sérgio de Alencar
(Recursos Genéticos e Biotecnologia - EMBRAPA, Brazil)
Proteínas são macromoléculas que têm uma importância fundamental nas funções biológicas de um organismo. As proteínas são formadas a partir de cadeias lineares (estrutura primária) de aminoácidos, que se enovelam formando estruturas tridimensionais (estrutura terciária). E é a partir desta conformação tridimensional que ela passa a ter uma função biológica. A alteração de um aminoácido pode implicar na mudança da conformação espacial da proteína e, como resultado, a sua função pode ser afetada.
Para o entendimento da função de uma proteína a nível molecular é necessário determinar a sua estrutura tridimensional. As duas principais técnicas experimentais de determinação estrutural de proteínas são as que utilizam técnicas de difração de raios X e ressonância magnética nuclear. Muitas das análises destas estruturas são dependentes de ferramentas computacionais. Também existe uma área da Biologia Computacional que trabalha na determinação da estrutura tridimensional através de predição in silico, chamada modelagem molecular. Esta área vem crescendo bastante, e vários novos algoritmos e ferramentas têm sido desenvolvidas a cada ano.
Este mini-curso visa fazer uma pequena introdução das ferramentas de análise das estruturas 3D de proteínas e também uma visão geral na área de modelagem molecular. O curso será composto de aulas teóricas, e práticas, onde o aluno terá contato com o uso de programas de visualização e manipulação destas estruturas 3D. Também terá a oportunidade de visitar vários sites na Internet relacionados a esta área, assim como aprender a instalar alguns programas no ambiente Windows e Linux.
Bioinformatics Tools for High-Throughput Sequencing
Tainá Raiol
(UnB, Brazil)
O avanço das novas tecnologias de sequenciamento de alto desempenho tem possibilitado a geração e análise de uma quantidade cada vez maior de fragmentos de nucleotídeos em paralelo, com um decrescente valor de custo por reação. Devido ao grande volume de dados gerados por estas tecnologias, os projetos de genômica e transcritômica têm se tornado um grande desafio para as análises de bioinformática. Dessa forma, novos algoritmos foram desenvolvidos para tratar, analisar e classificar as sequências geradas pelas novas plataformas de sequenciamento. Além disso, bancos de dados foram especialmente criados para armazenar as sequências produzidas nesses projetos.
Particularmente, pesquisas em transcritômica tem se beneficiado imensamente com o advento das estratégias de sequenciamento de DNA de alto desempenho. Sem a necessidade do emprego de técnicas de clonagem, as modernas plataformas comerciais de sequenciamento podem sequenciar diretamente DNA complementar (cDNA) ou o RNA mensageiro (RNAm) em larga escala. O RNA-seq, como foi nomeado o estudo de transcritos com o uso de sequenciadores de alto desempenho, tem sido aplicado para a análise de organismos procariotos e eucariotos.
De forma geral, as técnicas para RNA-seq requerem a disponibilidade da sequência do próprio genoma ou do genoma de um organismo próximo, usado como referência para o alinhamento dos transcritos. O Genome Sequencer FLX 454 (Roche) é a plataforma mais utilizada quando não se dispõe de uma sequência de genoma de referência para gerar a montagem de transcritos “de novo”.
Neste mini-curso, o foco é a análise de sequências obtidas pelo sequenciador 454/Roche por meio de um pipeline computacional, empregando diversas ferramentas de bioinformática. Faremos também, brevemente, análises biológicas a partir das informações obtidas pelo pipeline.
|