Datenaufbereitung und Modellierung mit Machine-Learning Methoden
- Bachelorarbeit
- Masterarbeit
Das Fraunhofer ICT bearbeitet seit vielen Jahren Forschungsprojekte im Themenbereich Materialalterung & -stabilität und hat hier über Jahrzehnte eine weltweit anerkannte Fachkompetenz aufgebaut. Aus Simulation und experimenteller Bestimmung sind mit der Zeit große Datenmengen entstanden. Mit Hilfe von modernen Machine-Learning Methoden bieten sich neue Möglichkeiten Wissen über bisher unbekannte chemische Zusammenhänge zu gewinnen oder zeit- und kostenintensive Vorgänge wie die Synthese neuer Substanzen zu optimieren.
In dieser Arbeit sollen Thermodynamik Daten aus einer SQL-Datenbank analysiert, bereinigt und zur Anwendung von modernen Machine-Learning Verfahren vorbereitet werden. Vorhandene Deskriptorensätze, also Modelle zur numerischen Beschreibung chemischer Substanzen (zum Beispiel Bag-of-Bonds, Joback, Coulomb-Matrix) werden evaluiert und u.U. modifiziert oder weiterentwickelt. Im Rahmen eines zyklusbasierten Entwicklungsmodells werden aus diesen aufbereiteten Daten gezielt Modelle mit ML-Methoden erstellt, trainiert und evaluiert. Schritt für Schritt sollen somit immer präzisere Modelle zur Vorhersage von Materialeigenschaften verschiedener chemischer Substanzen erstellt werden.