Lehr- und Forschungseinheit Bioinformatik
print


Navigationspfad


Inhaltsbereich

Praktikum Genomorientierte BioinformatikLab Course Genome-Oriented Bioinformatics

This content is available in German only.

 

Eine Toolbox zur Analyse von
Hochdurchsatz Sequencing (NGS) Daten
A toolbox for analysing high throughput sequencing (NGS) data

Allgemeine InformationenGeneral Information
  • Raum: Room: Seminar room A 406 + A 305/308, Amalienstr. 17
  • Beginn und Einführung: Dienstag,Start and introduction: Tuesday, 18.10.2016 14:00, SR 107
  • Zeit:
    • während des Semesters: Dienstag (12:00-18:00), Donnerstag (14:00-18:00, Vorträge) during the semester: Tuesday (12:00-18:00), Thursday (14:00-18:00, Presentations)
    • Dienstags sowie Donnerstag Vormittag kann frei an praktikumsrelevanten Themen gearbeitet werden. Zu den Vorträgen herrscht Anwesenheitspflicht.On tuesdays and thursday mornings you can work freely on your topics. For the presentations your attendance is mandatory.
    • Semesterferien: Über die Semesterferien mit Abnahme Anfang April 2017. during the semester break with exam binning of April 2017.
  • UmfangCredits:: 10 SWS / 12 ECTS (10P/Block)
Allgemeine Beschreibung
Die High-throughput Sequenzierung (next generation sequencing, NGS) Technik und die darauf basierende Messung der Genexpression (RNS-seq) verdrängt in biologischen Experimenten mehr und mehr die Messungen mit Microarray und DNA-chips. Die durch NGS und speziell durch RNA-seq gewonnenen Daten erlauben neben klassischen Analysen (differentielle Genexpression) auch speziellere Analysen wie z.B. zum (differentielles) alternatives Splicing, zur Detektion von Mutationen/Deletionen und zum Auffinden von bisher unbekannte transkripierten genomischen Bereiche. Entsprechend gehört das Know-how mit solchen Daten umzugehen, sie zu analysieren und daraus neue Erkentnisse zu gewinnen zu den Grundkenntnissen bzw. Anforderungen für Bioinformatikerinnen. Im Praktikum werden Grundlagen der zugrundeliegenden Experimente besprochen und Methoden zur Analyse von gemessenen Sequenzierungsdaten eingeführt und implementiert. Das Ziel des Praktikums ist, dass jeder Teilnehmer am Ende des Praktikums sowohl Know-how alsauch eine Toolbox zur Analyse von RNA-seq zur Verfügung hat, um einen beliebiges RNA-seq Datensatz praktisch zu analysieren und daraus wissenschaftliche Erkentnisse zu gewinnen. Das wird auch durch ein entsprechendes Abschlussprohjekt mit zugehöriger Laborleistung (Praktikumsbericht (Paper), Vortrag (Talk) und Diskussion (Poster)) geprüft.
Interne Seite

Mit Beginn des Praktikums werden alle nötigen Materialien auf einer internen Seite veröffentlicht

Zeit und Ort der Veranstaltung
Das Praktikum findet während des Semesters Dienstags und Donnerstags 14-18 Uhr statt. Im Semester werden die nötigen Tools für die Projektarbeit in der vorlesungsfreien Zeit vorbereitet. Zu diesem Zweck werden von den Teilnehmer Vorträge über Publikationen zu Praktikums-relevanten Themen gehalten und entsprechende Arbeitsblätter bearbeitet (Einzelarbeit). Dadurch erarbeitet sich jeder Teilnehmer grundlegendes Know-how und eine zugehörige Analyse-Toolbox. In der vorlesungsfreien Zeit schliesst sich die Projektarbeit an, in der ein Projekt (im Team) bearbeitet und ein Abschlussbericht erstellt wird. Das Praktikum wird mit einem Workshop ("Conference") abgeschlossen. Der Workshop umfasst die Präsentation des Abschlussberichts ("Papers") als Vortrag ("Talk") und Poster ("Poster session"). Der Termin des Workshops wird am Ende der vorlesungsfreien Zeit bzw. in der ersten Semesterwoche des SS2017 stattfinden (tba).

Die erste Veranstaltung ist am Dienstag, 18.10.2016, 14:00 im SR 105, Amalienstr. 17.

Organisation
Praktikumsleitung:
Prof. Dr. Ralf Zimmer
Betreuung:
Dr. Gergely Csaba
Markus Gruber
Beschreibung

Das Praktikum gliedert sich in drei Teile: Vorlesungsteil und Seminarteil, Praktikumsteil, Projektarbeit. Die Projektarbeit findet nach dem Semster während der vorlesungsfreien Zeit statt und schliesst mit einem Abschlussvortrag zum Semesterbeginn ab. Der Termin des Workshops wird noch im Praktikum festgelegt (tbd).

Im Vorlesungsteil und Seminarteil des Praktikums werden wir alle Themen behandeln, die für das Projekt nötig sind.
Konkret wird es in zwei-Wochen Rythmus zu den einzelnen Themengebieten zwei Vortröge von Studenten geben. Im zugehörigen Praktikumsteil wird in jeweils einem Arbeitsblatt entsprechende Teile für den zu bauenden Server implementiert.
Im Projektteil werden dann Gruppen gebildet und der Server aus den Komponenten gebaut. Zusätzlich bearbeitet jede Gruppe eine (individuelle) Fragestellung zur Analyse der Sequenzierungsdaten auf Basis des Servers und ggfs von projekt-spezifischen Erweiterungen.
Die Ergebnisse werden von dem Teams in einem Abschlussbericht (Paper) zusammengefasst und im Praktikum auf der Abschlusskonferenz als Poster und Vortrag präsentiert und vergleichend diskutiert.

Veranstaltungstermine
Die aktuelle Veranstaltungsliste finden Sie auf der (internen Seite).
Vorkenntnisse
  • Grundstudium Bioinformatik (Bachelor oder Diplom)
  • Bioinformatik Programmierpraktikum
Literatur

Ausgewählte aktuelle Bücher

  1. Somnath Datta, Dan Nettleton (Eds.: Statistical analysis of Next Generation Sequencing Data, Springer 2014
  2. Eija Korpelainen, Jarno Tuimala, Panu Somervuo, Mikael Huss, and Gary Wong: RNA-seq Data Analysis - A practical approach, Chapman&Hall/CRC Press 2015

Ausgewählte Paper

1

Anders, Simon, and Wolfgang Huber. 2010
Differential Expression Analysis for Sequence Count Data.
Genome Biology 11(10): R106

2

Bolstad, B.M., F. Collin, J. Brettschneider, K. Simpson, L. Cope, R.A. Irizarry, and T.P. Speed. 2013
Quality Assessment of Affymetrix GeneChip Data.
In Bioinformatics and Computational Biology Solutions Using R and Bioconductor.

3

Bolstad, B.M., R.A. Irizarry, L. Gautier, and Z. Wu. 2013.
Preprocessing High-density Oligonucleotide Arrays.
In Bioinformatics and Computational Biology Solutions Using R and Bioconductor.

4

Cox, Jürgen, and Matthias Mann. 2008.
MaxQuant Enables High Peptide Identification Rates, Individualized P.p.b.-range Mass Accuracies and Proteome-wide Protein Quantification.
Nature Biotechnology 26 (12): 1367\u20131372

5

Cox, Jürgen, Nadin Neuhauser, Annette Michalski, Richard A Scheltema, Jesper V Olsen, and Matthias Mann. 2011.
Andromeda: a Peptide Search Engine Integrated into the MaxQuant Environment.
Journal of Proteome Research 10 (4): 1794\u20131805

6

Goeman, Jelle J., and Peter Bühlmann. 2007.
Analyzing Gene Expression Data in Terms of Gene Sets: Methodological Issues.
Bioinformatics 23 (8): 980\u2013987

7

Hafner, Markus, Markus Landthaler, Lukas Burger, Mohsen Khorshid, Jean Hausser, Philipp Berninger, Andrea Rothballer, et al. 2010.
Transcriptome-wide Identification of RNA-binding Protein and microRNA Target Sites by PAR-CLIP.
Cell 141 (1): 129\u2013141

8

Langmead, Ben, Cole Trapnell, Mihai Pop, and Steven L. Salzberg. 2009.
Ultrafast and Memory-efficient Alignment of Short DNA Sequences to the Human Genome.
Genome Biology 10 (3): R25.

9

Li, Jun, Hui Jiang, and Wing H. Wong. 2010.
Modeling Non-uniformity in Short-read Rates in RNA-Seq Data.
Genome Biology 11 (5): R50.

10

Mortazavi, Ali, Brian A Williams, Kenneth McCue, Lorian Schaeffer, and Barbara Wold. 2008.
Mapping and Quantifying Mammalian Transcriptomes by RNA-Seq.
Nature Methods 5 (7): 621\u2013628.

11

Nam, Dougu, and Seon-Young Kim. 2008.
Gene-set Approach for Expression Pattern Analysis.
Briefings in Bioinformatics 9 (3): 189\u2013197.

12

Neph, Shane, Jeff Vierstra, Andrew B Stergachis, Alex P Reynolds, Eric Haugen, Benjamin Vernot, Robert E Thurman, et al. 2012.
An Expansive Human Regulatory Lexicon Encoded in Transcription Factor Footprints.
Nature 489 (7414): 83\u201390.

13

Pollard, K.S., and A. van der Laan. 2013.
Cluster Analysis of Genomic Data.
In Bioinformatics and Computational Biology Solutions Using R and Bioconductor. New York: Springer.

14

Rozowsky, Joel, Ghia Euskirchen, Raymond K. Auerbach, Zhengdong D. Zhang, Theodore Gibson, Robert Bjornson, Nicholas Carriero, Michael Snyder, and Mark B. Gerstein. 2009.
PeakSeq Enables Systematic Scoring of ChIP-seq Experiments Relative to Controls.
Nature Biotechnology 27 (1): 66\u201375.

15

Scholtens, D., and A. von Heydebreck. 2013.
Analysis of Differential Gene Expression Studies.
In Bioinformatics and Computational Biology Solutions Using R and Bioconductor. New York: Springer.

16

Subramanian, Aravind, Pablo Tamayo, Vamsi K. Mootha, Sayan Mukherjee, Benjamin L. Ebert, Michael A. Gillette, Amanda Paulovich, et al. 2005.
Gene Set Enrichment Analysis: A Knowledge-based Approach for Interpreting Genome-wide Expression Profiles.
Proceedings of the National Academy of Sciences of the United States of America 102 (43): 15545\u201315550.

17

Ulitsky, Igor, and Ron Shamir. 2007.
Identification of Functional Modules Using Network Topology and High-throughput Data.
BMC Systems Biology 1 (1): 8.

18

Valouev, Anton, David S. Johnson, Andreas Sundquist, Catherine Medina, Elizabeth Anton, Serafim Batzoglou, Richard M. Myers, and Arend Sidow. 2008.
Genome-wide Analysis of Transcription Factor Binding Sites Based on ChIP-Seq Data.
Nature Methods 5 (9): 829\u2013834.

19

Trapnell, C, Pachter, L, Salzberg, SL. 2009.
TopHat: discovering splice junctions with RNA-Seq.

Bioinformatics, 25, 9:1105-11.

20

Harrow, J, Frankish, A, Gonzalez, JM, Tapanari, E, Diekhans, M, Kokocinski, F, Aken, BL, Barrell, D, Zadissa, A, Searle, S, Barnes, I, Bignell, A, Boychenko, V, Hunt, T, Kay, M, Mukherjee, G, Rajan, J, Despacio-Reyes, G, Saunders, G, Steward, C, Harte, R, Lin, M, Howald, C, Tanzer, A, Derrien, T, Chrast, J, Walters, N, Balasubramanian, S, Pei, B, Tress, M, Rodriguez, JM, Ezkurdia, I, van Baren, J, Brent, M, Haussler, D, Kellis, M, Valencia, A, Reymond, A, Gerstein, M, Guigo, R, Hubbard, TJ. 2012.
GENCODE: the reference human genome annotation for The ENCODE Project.
Genome Res., 22, 9:1760-74.

21

Trapnell, C, Hendrickson, DG, Sauvageau, M, Goff, L, Rinn, JL, Pachter, L. 2013.
Differential analysis of gene regulation at transcript resolution with RNA-seq.

Nat. Biotechnol., 31, 1:46-53.

22

Wang, J, Zhuang, J, Iyer, S, Lin, X, Whitfield, TW, Greven, MC, Pierce, BG, Dong, X, Kundaje, A, Cheng, Y, Rando, OJ, Birney, E, Myers, RM, Noble, WS, Snyder, M, Weng, Z. 2012.
Sequence features and chromatin structure around the genomic regions bound by 119 human transcription factors.
Genome Res., 22, 9:1798-812.

Um die Artikel außerhalb des CIP-pools zugreifen zu können ist ggf. der lrz-vpn client und der entsprechende Proxy (http://pac.lrz-muenchen.de) im Browser zu verwenden.


Servicebereich

Informationen fürInformation for