Lehr- und Forschungseinheit Bioinformatik
print


Navigationspfad


Inhaltsbereich

Master Praktikum

Master Practical Bioinformatics (12 ECTS)

This summer term 2019 several individual instances of the course will be offered by various bioinformatics faculty (Baumbach (TUM), Gagneur (TUM), Rost (TUM), Theis (TUM), and Zimmer (LMU)). Slots in the respective research groups will be assigned depending on availability and interest of the students. Im Sommersemester 2019 werden mehrere Einzelinstanzen des Praktukums von verschiedenen Bioinformatik Professoren (Baumbach (TUM), Gagneur (TUM), Rost (TUM), Theis (TUM) und Zimmer (LMU)) angeboten. Die Plätze in den jeweiligen Arbeitsgruppen werden je nach Verfügbarkeit und Interesse der Studierenden vergeben. The Zimmer lab offers various slots for teams of four or teams of two students on the following topic: An der LMU werden im Zimmer Lab mehrere Praktika für Studententeams mit vier bzw. zwei Mitgliedern zu folgendem Themenbereich angeboten:

AtheroIndex: Methods to build and use an atlas of genome-wide high-throughput data for atherosclerosis research

AtheroIndex: Methoden zum Aufbau und Nutzung eines Atlas für Genom-weite Hochdurchsatzdaten für die Atherosklerose Forschung

If you are interested in our topic this year and in participating in our course, please register per e-mail either zimmer@bio.ifi.lmu,de or csaba@bio.ifi.lmu.de. Or decide during the Kickoff Meeting (see below). Wenn Sie sich für unsere Themen und für die Teilnahme in unserem Modul interessieren, können Sie sich auch vorab via zimmer@bio.ifi.lmu.,de oder csaba@bio.ifi.lmu,.de registrieren. Oder melden Sie sich im Kickoff Meeting an (siehe unten).

In the Kickoff Meeting on April 30, 2019 projects have been introduced and assignments of students to projects have been fiixed (see the list): Im Kickoff Meeting am 30. April 2019 wurden die Projekte vorgestellt und die Praktikumsplätze auf die Studierenden verteilt (siehe folgende Liste):
Mapping Students : Projects

 

Allgemeine InformationenGeneral Information
  • Kick-off meeting aller angemeldeten Teilnehmer des Masterpraktikums: Vorstellen der Themen, Verteilen der Praktikumsplätze bei den beteiligten Professoren und Einteilung in Gruppen Di, 30.04.2019, Garching, Raum: TBA Kick-off meeting of all registered participants of the master practical: Introduction of topics, assignment of slots offered by the participating professors and team building Di, 30.04.2019, Garching, Raum: TBA
  • Erstes Treffen der LMU Teilnehmer (Forschungsgruppe Prof. ZImmer): Do, 02.05.2019 14:00, A 105 First meeting of all participants (reseach group Zimmer Lab: Thu, 02.05.2019 14:00, A 105
  • Im Sommersemester 2019 werden im Zimmer Lab zwei Modi des Praktikums angeboten: In the summer term 2019 the Zimmer Lab offers two modi of the practical:
    • An intensive SCRUM-organized bioinformatics infra-structure course during the semester in teams of four members: work is mainly done in full work days (1 day (8h) / week x 13 weeks = 104 hours) during the lecturing time in so salled ''team sprints'' (13 weeks until 2.8.19), best in three days a week (312h). If necessary a one week (48 h) block extends the semester phase. SCRUM is a well-established alternative method to organize project and project teams. Lots of literature is available on SCRUM. Ein intensiver SCRUM-organisierter Bioinformatik-Infrastrukturkurs während des Semesters in Teams von vier Mitgliedern: Die Arbeit wird hauptsächlich an ganzen Arbeitstagen (1 Tag (8h) / Woche x 13 Wochen = 104 Stunden), möglichst an 3 Tagen / Woche (312 h). während der Vorlesungszeit in sogenannten ''Team Sprints'' (13 Wochen bis 2.8.19) geleistet. Bei Bedarf verlängert ein einwöchiger (48 h) Block die Semesterphase. SCRUM ist eine etablierte alternative Methode zur Organisation von Projekt- und Projektteams. Zu SCRUM ist eine vielfältige Literatur verfügbar.
    • A more block-oriented biomedical application course in teams of two students based on the developed infra-structure: 1 day (8h) collaborative project work per week (+4h self study) in the preparation phase during the lecturing term (13 weeks until 2.8.19) followed by a block phase of four weeks during the semester break (200 h). Ein eher Block-orientierter biomedizinischer Anwendungskurs in Teams von zwei Studenten. Analyse basieren möglichst auf der entwickelten Infrastruktur: 1 Tag (8h) kooperative Projektarbeit pro Woche (+4h Selbststudium) in der Vorbereitungsphase während des Vortragssemesters (13 Wochen = 160h bis 2.8.19) gefolgt von einer Blockphase von vier Wochen in den Semesterferien (200 h).
  • Raum: Hiwi-Räume Room: Hiwi-rooms + 406 Amalienstr. 17
  • Credits und ArbeitsumfangCredits and work load: 12 ECTS / 10 SWS (10P/Block) = 360 working hours
  • Praktikumsleitung: Responsibility: Prof. Dr. Ralf Zimmer   Dr. Gergely Csaba
Thema/Beschreibung/InhaltTopic/Description/Contents
Methods to build and use an atlas of genome-wide high-throughput data for atherosclerosis research (AtheroIndex) Verfahren zum Aufbau und zur Verwendung eines Atlas genomweiter Hochdurchsatzdaten für die Atherosklerose Forschung (AtheroIndex)

High-throughput techniques such as DNA/RNA sequencing and proteome mass spectrometry produce an ever growing number of diverse and large-scale measurements. The characteristics of these measurements are that data is obtained on a large number (“genome-wide”) of biological objects (i.e. most genes or most proteins in a cell) and that the quality and the depth is highly variable depending on the used experimental techniques and setup. Often the data cannot be interpreted without a detailed knowledge of the experimental setup and the underlying research question, in particular how a research question is addressed via the actual experiment and measurement. Hochdurchsatztechniken wie DNA/RNA-Sequenzierung und Proteom-Massenspektrometrie ermöglichen eine immer größere Anzahl von vielfältigen und groß angelegten Messungen. Die Merkmale dieser Messungen sind, dass Daten über eine große Anzahl ("genomweit") von biologischen Objekten (d.h. die meisten Gene oder die meisten Proteine in einer Zelle) erhalten werden und dass die Qualität und Tiefe je nach verwendeter experimenteller Technik und Aufbau sehr unterschiedlich ist. Oftmals können die Daten nicht ohne detaillierte Kenntnisse des Versuchsaufbaus und der zugrunde liegenden Forschungsfrage interpretiert werden, insbesondere wie eine Forschungsfrage über das eigentliche Experiment und die Messung angegangen wird.
Notwithstanding these issues, the large set of large-scale measurements shapes a landscape of “experimental knowledge”, which could be used to plan future experiments and measurements and to interpret forthcoming experimental data. The ultimate goal is to transform the set/landscape of data into a real “atlas”, which can be used as a map to effectively and efficiently plan routes from data to knowledge. Ungeachtet dieser Fragen bildet der große Satz groß angelegter Messungen eine "Landschaft des experimentellen Wissens", mit dem Experimente und Messungen geplant und zukünftige experimentelle Daten interpretiert werden können. Das ultimative Ziel ist es, die Menge/Landschaft der Daten in einen echten "Atlas" zu verwandeln, der als Karte zur effektiven und effizienten Planung von Routen von "Daten zu Wissen" verwendet werden kann.
Several initiative aim at directly produce such maps of specific landscapes such as proteome or The Cancer Genome Atlas (TCGA). But still the overwhelming wealth of data is only available in large scale collections (SRA, GEO) or via distributed resources or only via the published literature. Most data have not been “put on the map” which make them not easily exploitable for “route planning”. Mehrere Initiativen zielen darauf ab, solche Karten spezifischer Landschaften wie Proteom und The Cancer Genome Atlas (TCGA) direkt zu erstellen. Dennoch ist der überwältigende Datenreichtum nur in großen Sammlungen (SRA, GEO) oder über verteilte Ressourcen oder nur über die veröffentlichte Literatur verfügbar. Die meisten Daten wurden nicht "auf die Karte gesetzt", was sie für die "Routenplanung" nicht leicht nutzbar macht.
However, currently it is a rather complicated task to use this landscape to enhance the interpretation of a new measurement. Still, the most successful ‘standard way’ is manual curation: reading the literature, collecting findings and published data and then compare it to the data at hand. This is hard to automate and limited to the published results with accessible descriptions. Derzeit ist es jedoch eine ziemlich komplizierte Aufgabe, diese Landschaft zu nutzen, um die Interpretation einer neuen Messung zu verbessern. Der erfolgreichste "Standardweg" ist immer noch die manuelle Kuration: Lesen der Literatur, Sammeln von Erkenntnissen und veröffentlichten Daten und anschließender Vergleich mit den vorliegenden Daten. Dies ist schwer zu automatisieren und beschränkt sich auf die veröffentlichten Ergebnisse mit zugänglichen Beschreibungen.
The goal of the practical course is to create and make use of an index and map of data sets relevant for the complex human disease atherosclerosis. The main model organism to study the disease are mice and, thus, many data sets are genome-wide mouse data sets. Ziel des Praktikums ist es, einen Index und eine Karte der für die komplexe menschliche Krankheit Atherosklerose relevanten Datensätze zu erstellen und zu nutzen. Der wichtigste Modellorganismus zur Untersuchung der Krankheit sind Mäuse, und so sind viele Datensätze genomweite Mausdatensätze.

The first version (AtheroIndex prototype) of the course develops an alternative representation of publicly available high-throughput data: a network connected by similarities defined on standardized analysis. The network will be benchmarked and made available by a web interface. Die erste Version (AtheroIndex Prototyp) des Kurses entwickelt eine alternative Darstellung öffentlich zugänglicher Hochdurchsatzdaten: ein Netzwerk, das durch Ähnlichkeiten verbunden ist, die durch standardisierte Analysen definiert sind. Das Netzwerk wird bewertet und über eine Weboberfläche zur Verfügung gestellt.
In the practical course we will use big data techniques (hadoop, spark, graphx) and scrum for managing ‘the project’. As the power of scrum lies in team work and in the regular increments during two or three sprints the participants are required to work together in two (or better three) full days a week. The goal of the project is to deliver a usable tool with every increment (sprint). The final product of the course includes a manuscript describing and evaluating the product and a presentation of the AtheroIndex product. Im praktischen Teil werden wir große Datentechniken (Hadoop, Spark, Graphx) und Scrum für das Management des Projekts einsetzen. Da die Power des Scrum Ansatzes in der Teamarbeit und in den regelmäßigen inkrementellen Fortschritten in sogenannten Sprints von zwei oder drei Wochen liegt, müssen die Teilnehmer an zwei (oder besser drei) vollen Tagen pro Woche zusammenarbeiten. Ziel des Projekts ist es, mit jedem Sprint ein brauchbares Werkzeug zu liefern. Das Endprodukt des Kurses beinhaltet ein Manuskript zur Beschreibung und Bewertung des Produkts und eine Präsentation des AtheroIndex-Produkts.
In the second version (AtheroIndex application) of the course a team of two students will use the AtheroIndex prototype and the underlying techniques to interpret a current unpublished data set from atherosclerosis research. Typically the data will be obtained and interpreted in collaboration with partners from the SFB 1123 Atherosclerosis in the medical faculty of the LMU. The goal of this version is to write a manuscript and an interactive report on the atherosclerosis experimental data. In der zweiten Version (AtheroIndex Anwendung) des Kurses wird ein Team von zwei Studenten den AtheroIndex-Prototypen und die zugrunde liegenden Techniken verwenden, um einen aktuellen, unveröffentlichten Datensatz aus der aktuellen Atherosklerose-Forschung zu interpretieren. Typischerweise werden die Daten in Zusammenarbeit mit Partnern aus dem SFB 1123 "Atherosklerose - Mechanismen und Netzwerke neuer therapeutischer Targets" in der medizinischen Fakultät der LMU erhoben und interpretiert. Ziel dieser Version ist es, ein Manuskript und einen interaktiven Bericht über die experimentellen Daten der Atherosklerose zu schreiben.

BetreuerCourse instructuors
VorkenntnissePrerequisites
  • Grundstudium Bioinformatik (Bachelor oder Diplom)Bachelor Bioinformatics
  • Programmierpraktikum BioinformatikBioinformatics programming course
  • Praktikum Genomorientierte BioinformatikPractical Genome-oriented bioinformatics
  • Gute Programmierkenntnisse (Bachelor Level)Good programming skills (bachelor level)
Interne WebseiteInternal web page

Mit Beginn des Praktikums werden alle nötigen Materialien auf einer internen Seite veröffentlicht At the beginning of the semester all required material will be provided at the internal Webpage

Downloads


Servicebereich

Informationen fürInformation for


test