
Von "Multimodallität" spricht man, wenn der KI-Assistent nicht nur den Text einer Anfrage analysiert, sondern auch andere Medien wie z.B. Bilder, und die Informationen aus allen Quellen für die Generierung der Antwort verknüpft.
Besonders häufig betrifft das die Kombination aus Text und Bild, z.B. in E-Mails oder Chats. Seltener werden Voice-Nachrichten mit Fotos zu verknüpfen sein.

So ist zum Beispiel diese Anfrage nur zu beantworten, wenn auch das mitgesendete Foto einbezogen wird.
Die KI-Integration in todo4teams ist in der Lage, Text und Bilder in einen gemeinsamen Kontext zu setzen, um einen Antwortvorschlag zu generieren.
Dabei liest die KI nicht nur im Bild sichtbaren Text, sondern erkennt auch Gerätetypen etc.
In diesem Fall (unter Verwendung von ChatGPT als KI-Modul in todo4teams) erkennt die Agentic AI korrekt das Problem, vermutet einen Sensorfehler und schlägt genau die richtigen Schritte vor.
Der Fehlercode "Ed" wurde korrekt im Bild erkannt und mit dem Frage nach einer Fehlfunktion eines Gefriergerätes in Verbindung gesetzt.
Dass der Kunde auch korrekt mit 'Herr' und seinem Nachnamen angesprochen, wird da fast zur Nebensache.
