WEBVTT

00:00:00.000 --> 00:00:03.629
In vielen Wissenschaftsbereichen (z. B.
Bioinformatik, medizinische Bildgebung und

00:00:03.629 --> 00:00:06.299
Astronomie) müssen große Datenmengen
analysiert werden. Dafür werden häufig

00:00:06.299 --> 00:00:10.769
repetitive Prozesse ausgeführt, die aus
vielen einzelnen Schritten bestehen und dabei

00:00:10.769 --> 00:00:15.240
verschiedene Softwarewerkzeuge benutzen.
Solche Prozesse werden auch als "Workflows"

00:00:15.240 --> 00:00:18.930
bezeichnet, und die einzelnen Softwarewerkzeuge
als "Tools". Die Workflowausführung per Hand

00:00:18.930 --> 00:00:21.949
kann sehr aufwändig sein. Insbesondere die
Dateneingabe und die Konvertierung von Ausgaben

00:00:21.949 --> 00:00:26.130
in andere Formate, um sie mit den nächsten
Tools kompatibel zu machen, kosten oft viel Zeit.

00:00:26.130 --> 00:00:30.090
Workflowmanagementsysteme schaffen hier
Abhilfe. Sie ermöglichen es, Workflows

00:00:30.090 --> 00:00:34.290
formal zu beschreiben, und stellen
Infrastruktur zur Verfügung, um sie zu
konfigurieren, auszuführen und

00:00:34.290 --> 00:00:38.399
nachzuvollziehen. Forschende können solche
Workflows einfach miteinander teilen und
wiederverwenden, und zur Überüfung

00:00:38.399 --> 00:00:43.110
veröffentlichter. Datenanalyseergebnisse heranziehen.
Damit können Workflows die Reproduzierbarkeit

00:00:43.110 --> 00:00:46.579
von Forschungsergebnissen maßgeblich erhöhen.
Dem steht jedoch entgegen, dass es viele
konkurrierende Workflowformate gibt.

00:00:46.579 --> 00:00:50.399
In den letzten zwei Jahrzehnten sind über
hundert verschiedene Workflowmanagementsysteme

00:00:50.399 --> 00:00:55.020
entstanden, die größtenteils eigene Formate
definieren und untereinander kaum kompatibel sind.

00:00:55.020 --> 00:00:58.469
Eine gemeinsame Sprache wurde immer notwendiger,
und so wurde das Projekt "Common Workflow Language"

00:00:58.469 --> 00:01:02.430
ins Leben gerufen: Ein offener Standard für
die formale Beschreibung von Workflows und

00:01:02.430 --> 00:01:05.539
Tools in strukturiereten YAML-Textdateien.
