Beschleunigte Erbgutforschung durch Zusammenarbeit von Broad Institute und Cloudera
(PresseBox) - Cloudera kooperiert jetzt mit dem Broad Institute of MIT und Harvard, dem weltweit führenden Zentrum für Biomedizin- und Genomforschung. Im Mittelpunkt der Kooperation steht dieses Jahr die Entwicklung der nächsten Generation des Genome-Analysis-Toolkits, GATK4, von Broad.
Mit Cloudera Enterprise werden biowissenschaftliche Forschungen und maßgeschneiderte Wirkstoffentdeckungen um ein Vielfaches beschleunigt, indem Mediziner, Wissenschaftler und Dienstleister zusätzlich auf Echtzeit-Daten zur Personalisierung/Individualisierung ihrer Patientenerfahrungen zurückgreifen können. Durch die Integration der vierten Generation von GATK (GATK4) auf Cloudera Enterprise und der Verwendung des Spark-basiertem Distributed-Computing-Frameworks zur Beschleunigung der Forschungsergebnisse, erlangt das Broad Institute tiefere Erkenntnisse über die genomische Sequenzierung. Dadurch wird eine rasche Datenexploration ermöglicht, die letztlich zu besseren klinischen Entscheidungen führt.
GATK wird aktuell von mehr als 31.000 registrierten Anwendern in aller Welt eingesetzt. Das Broad Institute arbeitet mit Partnern zusammen, um über die Cloud einen weiten Zugriff zu ermöglichen und die Nutzung von Tools zur Genomanalyse zu erleichtern. Nur so können noch umfassendere Erkenntnisse erzielt werden und die Entscheidungsfindung verbessert werden. Zur Vermeidung doppelter Infrastrukturen können Anwender zudem auf sogenannten Best-Practice-Pipelines aufbauen.
?Mit dem Einsatz des Computing-Frameworks Spark auf Cloudera Enterprise können wir Tools implementieren, die wir mit GATK3 aufgrund der Komplexität der Berechnungen bisher nicht nutzen konnten?, sagt Dr. Eric Banks, Senior Director Data Sciences and Data Engineering bei Broad und Entwickler des GATK-Software-Packages. ?Auf Cloudera Enterprise können wir Analysen von genomischen Daten um zwei Größenordnungen schneller als in vorherigen GATK-Versionen durchführen. So erzielen wir schnellere iterative Analysen und treiben genomische Innovationen weiter voran.?
Die Sequenz des menschlichen Genoms wurde im Jahr 2000 im Rahmen eines Humangenom-Projekts erstmals skizziert. Seitdem haben sich die Kosten der Sequenzierung von ursprünglich rund 100 Mio. US-Dollar pro Genom auf aktuell rund 1.000 US-Dollar exponentiell reduziert. Im gleichen Zeitraum konnten die Ressourcen zur Speicherung und Verarbeitung von Informationen über Big Data-Technologien wie Hadoop massiv erweitert werden.
?Durch die verringerten Kosten der Genom-Sequenzierung und die technologischen Fortschritte im Bereich Big Data, können wir es uns leisten, die Genome unserer Patienten weitreichend zu sequenzieren und so Datensätze erzeugen, die bisher undenkbar waren?, betont Shawn Dolley, Verantwortlicher im Bereich Biowissenschaften bei Cloudera. ?Mit der Erstellung der nächsten Toolkit-Generation auf Spark werden In-Memory-Berechnungen stark beschleunigt und Parallelitäten erleichtert. Zur Datenexploration forciert Cloudera Enterprise die Umläufe beim Zugriff und bei der Datenberechnung, was die Forschungs- und Entwicklungszeiten erheblich verkürzt.?
Cloudera bietet eine zeitgemäße Plattform für Datenmanagement und -analyse auf Basis von Apache Hadoop sowie den neuesten Open Source-Technologien. Weltweit führende Unternehmen vertrauen auf Cloudera, um mit Unterstützung von Cloudera Enterprise - der schnellsten, einfachsten und sichersten Datenplattform der Gegenwart - ihre wichtigsten geschäftlichen Herausforderungen zu meistern. Unsere Kunden erfassen, speichern, verarbeiten und analysieren auf effiziente Weise gewaltige Datenmengen und nutzen fortschrittliche Analysemethoden, um Unternehmensentscheidungen schneller, flexibler und kostengünstiger als je zuvor treffen zu können. Auf dem Weg zum Erfolg bieten wir unseren Kunden umfassenden Support, Schulungen und andere professionelle Services. Weitere Informationen finden Sie unter http://cloudera.com.
Kontakt mit Cloudera
Lesen Sie unsere Blogs: cloudera.com/engblog und vision.cloudera.com
Folgen Sie uns auf Twitter: twitter.com/clouderade
Besuchen Sie uns auf Facebook: facebook.com/cloudera
Treten Sie der Cloudera Community bei: cloudera.com/community
Cloudera bietet eine zeitgemäße Plattform für Datenmanagement und -analyse auf Basis von Apache Hadoop sowie den neuesten Open Source-Technologien. Weltweit führende Unternehmen vertrauen auf Cloudera, um mit Unterstützung von Cloudera Enterprise - der schnellsten, einfachsten und sichersten Datenplattform der Gegenwart - ihre wichtigsten geschäftlichen Herausforderungen zu meistern. Unsere Kunden erfassen, speichern, verarbeiten und analysieren auf effiziente Weise gewaltige Datenmengen und nutzen fortschrittliche Analysemethoden, um Unternehmensentscheidungen schneller, flexibler und kostengünstiger als je zuvor treffen zu können. Auf dem Weg zum Erfolg bieten wir unseren Kunden umfassenden Support, Schulungen und andere professionelle Services. Weitere Informationen finden Sie unter http://cloudera.com.
Kontakt mit Cloudera
Lesen Sie unsere Blogs: cloudera.com/engblog und vision.cloudera.com
Folgen Sie uns auf Twitter: twitter.com/clouderade
Besuchen Sie uns auf Facebook: facebook.com/cloudera
Treten Sie der Cloudera Community bei: cloudera.com/community