Am Fraunhofer Institut arbeiten Sie unmittelbar an Foundation Models. Vielleicht geben Sie einmal einen praktischen Einblick wie diese entlang der Wertschöpfungskette von Unternehmen eingesetzt werden können.
Gerne, auch wenn ich hier vermutlich ganze Seiten mit Beispielen füllen könnte. Durch ihre Vielseitigkeit können Foundation Models mit den unterschiedlichsten Daten umgehen und an alle möglichen Aufgaben angepasst werden. Daraus ergibt sich natürlich eine große Bandbreite an Anwendungsgebieten.
Nehmen wir z. B. das Thema Procurement, in dem mein Team bereits einige Erfahrung hat. Hier kann der gesamte Source-to-Pay-Prozess unterstützt werden, also von der Lieferantensuche bis hin zur Rechnungsstellung. Um einige Beispiele zu nennen:
- Wir haben in unseren Projekten bereits Lösungen auf Basis von Foundation Models entwickelt, um Angebotsanfragen (RFQs) (teil-)automatisch zu beantworten und aus einer Auswahl von Tausenden von Produkten die richtigen auszuwählen.
- Wir unterstützen mit Foundation Models die Analyse von Verträgen, z. B. um Rahmendaten automatisiert zu extrahieren oder sogar Vertragsrisiken zu erkennen.
- Wir haben auf Basis multimodaler Foundation Models eine Lösung entwickelt, die automatisiert Daten aus Rechnungsbelegen extrahiert.
Dies ist nur eine Auswahl an Möglichkeiten. Diese Modelle könnten z. B. auch zur automatischen Generierung von Vertragsdokumenten, zum Abgleich von Dokumenten und vielem mehr eingesetzt werden. Ähnliche und unzählige weitere Anwendungsbeispiele ergeben sich in der Medizin, im HR-Bereich etc.
Die landläufige Vorstellung besteht darin, dass es nur noch eine Frage der Zeit ist, bis Chat GPT4 o. ä, Lösungen für alles bieten kann. Ist das zutreffend? Oder geht die Tendenz dahin, dass es künftig individuelle KI-Lösungen für Unternehmen und gewisse Anwendungsbereiche geben wird?
Das ist eine spannende Frage. Mitte 2022 habe ich mich gefragt, ob bald alles von den Lösungen von Microsoft, OpenAI, Google und Co. dominiert wird. Denn nur diese Unternehmen haben die Rechenkapazitäten, um wirklich große Modelle zu trainieren. Lange Zeit sah es so aus, als ob vor allem die Größe des Modells der entscheidendste Faktor für deren Leistungsfähigkeit wäre. Mittlerweile sehen wir hier eine leichte Umkehr: kleinere, leichter zu trainierende und zu betreibende Modelle, die auf hochqualitativen Daten trainiert werden, zeigen sehr gute Ergebnisse. Die Open-Source-Community schließt mit einem rasanten Tempo zu den großen Tech-Firmen auf und wir sehen heute die ersten Open-Source-Modelle, die GPT3.5 in verschiedenen Aufgaben schlagen und sich der Leistungsfähigkeit von GPT4 Modellen annähern.
Ich sehe hier zwei Stränge - Unternehmen, die diese Modelle hauptsächlich auf nicht-sensitiven Daten einsetzen, werden auf die Lösungen von Microsoft und Co. setzen. Sie müssen sich nicht um das Training der Modelle kümmern, erhalten die mitunter leistungsstärksten Modelle und kämpfen auch nicht um die Ressourcen im Unternehmen. Allerdings müssen sie dann in Kauf nehmen, dass die Antwortzeiten der Modelle ggf. lang sind, dass sie von einem Provider abhängig werden und dass sich möglicherweise mit Versionsänderungen plötzlich Aspekte der Modelle verschlechtern.
Auf der anderen Seite werden wir Unternehmen sehen, die Foundation Models speziell für ihre Anwendungsfälle oder ihre Unternehmensdaten anpassen und betreiben. In diesem Fall sind speziellere, kleinere Modelle sehr spannend und bieten auch Vorteile gegenüber der Nutzung der kommerziellen Modelle. Allerdings müssen die Unternehmen dann auch die Kompetenz erwerben, diese Modelle zu adaptieren und zu betreiben.
In welchen Bereichen/Abteilungen ist schon jetzt der Einsatz von - allgemein zugänglicher - KI in Unternehmen sinnvoll und wo sollten unbedingt Eigenentwicklungen vorgenommen werden?
Im Moment würde ich das vor allem davon abhängig machen, wie sensibel und schützenswert die Daten sind, die mit dem Modell verarbeitet werden sollen und wie kritisch die Prozesse sind, die mit den Modellen automatisiert werden. Wenn die Daten unkritisch sind und ich damit leben kann, dass ich ggf. längere Antwortzeiten habe, dann kann man auf kommerzielle Modelle zugreifen.
Überall dort, wo das nicht der Fall ist, lohnt es sich, über Eigenentwicklungen nachzudenken, z. B. auf Basis der unzähligen Modelle auf der Plattform huggingface. Dies hat den zusätzlichen Vorteil, dass man unabhängig von Drittanbietern bleibt. Allerdings müssen hier die Kosten und Ressourcen berücksichtigt werden. Die nötige Expertise, Infrastruktur und der Aufwand sind nicht unbeträchtlich.
Gehen wir weg von der Entwicklung hin zur Anwendung von Künstlicher Intelligenz. Hier spielt das sog. Prompting eine große Rolle. Davon hängt schließlich die Qualität des von der KI generierten Ergebnisses ab. Ist also KI immer nur so gut, wie die Frage, die ihr gestellt wurde?
Das Prompting ist tatsächlich ein entscheidender Faktor. Die Art und Weise, wie ich meine Anfrage formuliere, kann die Antwort, die ich erhalte, maßgeblich beeinflussen. Eine der ersten Publikationen, die sich mit diesem Thema beschäftigt hat, hat z. B. gezeigt, dass es eine große Leistungssteigerung bringt, wenn man das Modell anweist, schrittweise eine Lösung zu erarbeiten. Es hat sich auch gezeigt, dass es besser ist, dem Modell eine bestimmte Rolle zuzuweisen, also z. B. zu Beginn einer Anweisung zu sagen: Du bist Experte für Steuerrecht. Mittlerweile arbeiten die Anbieter der Modelle aber auch daran, dies zu vereinfachen, so dass die Modelle unabhängiger von konkreten Formulierungen werden. Außerdem hat sich gezeigt, dass die Modelle selbst besser als Menschen in der Lage sind, geeignete Prompts zu formulieren. D. h. wir müssen uns ggf. nicht mehr lange damit auseinandersetzen, wie wir die richtigen Prompts formulieren, sondern fragen einfach die Modelle selbst.
Was bedeuten die Entwicklungen im Bereich der KI für die Arbeitswelt. Gegenwärtig haben wir einen großen Mangel an (Fach-)Kräften zu verzeichnen - besteht nicht auf kurze oder lange Sicht die Gefahr, dass zahlreiche Arbeitsplätze wegfallen? Oder verändern sich lediglich die Jobprofile?
Es wäre falsch zu glauben, dass wir keinen Wegfall von Arbeitsplätzen sehen werden. Wenn diese Modelle zu Effizienzsteigerungen führen, werden Unternehmer und Unternehmerinnen sicher darüber nachdenken, auf diese Weise Geld zu sparen. Darauf müssen wir uns und die Gesellschaft vorbereiten. Ich glaube, dass diejenigen, die sich die Nutzung dieser neuen Modelle aneignen und damit umgehen können, jetzt im Vorteil sind. In diese Richtung werden sich auch die Jobprofile verändern. Es liegt aber auch an uns, diese Themen in der Schulbildung und in der Aus- und Weiterbildung von Arbeitnehmern zu platzieren. Wie eingangs gesagt: Wir sollten die Chancen sehen - müssen dann aber auch jetzt handeln.
Lieber Herr Giesselbach, vielen Dank für das Gespräch!