Bildverarbeitung

Gehirnsignale trainieren eine künstliche Intelligenz

12.12.2023 - Automatisches Labeln von KI-Trainingsbildern

Um das Training einer künstlichen Intelligenz zu beschleunigen, nutzt ein israelisches Unternehmen die Gehirn­signale eines Experten. Dieser schaut sich die zu kategorisierenden Bilder an, statt sie händisch zu sortieren. 
Die Software ermittelt aufgrund der Gehirnaktivitäten, ob sie OK oder NOK sind.

Künstliche Intelligenz (KI) ist als Lösung für das rasend schnelle Erkennen von Anomalien und Fehlern inzwischen verbreitet. Zum Training von KI-Modellen werden jedoch umfangreiche markierte Datensätze benötigt, was teuer und zeitaufwändig sein kann. Das israelische Unternehmen Innereye nutzt die menschliche Fähigkeit, Muster fast reflex­artig zu erkennen. Durch das Aufzeichnen und Dekodieren der Gehirnaktivität wendet Innereye eine Methode an, die die Annotationszeit erheblich verkürzt und die Genauigkeit erhöht, während gleichzeitig menschliches Expertenwissen in die KI-Modelle einfließt.


Gehirnbasierte Bildklassifizierung

Dazu zapfen Brain-Computer Interfaces (BCI), also Schnittstellen vom menschlichen Gehirn mit Computern, die Gehirnsignale von Experten an, um die Annotierung von Bildern zu beschleunigen und zeichnen gleichzeitig die visuelle Verarbeitung und das Vertrauen des Nutzers in seine Entscheidung auf. Die Innereye-Technologie zeichnet genau die Reaktion des Gehirns auf Reize auf, die für das Erkennen abnormaler Muster oder Bildklassen/-typen relevant sind. Eine entscheidende Rolle spielt bei diesem Prozess die Elektroenzephalographie (EEG). Das ist eine nichtinvasive, tragbare und erschwingliche Neurobildgebungstechnik, die sich für jede Art von praktischer Gehirn-Computer-Schnittstelle eignet. Bilder können in einer schnellen Abfolge präsentiert werden und anhand der vom Benutzer erzeugten Gehirnsignale werden diese Bilder mit Soft-Labels versehen und zum Trainieren oder Re-Trainieren eines KI-Modells verwendet.

Im Gegensatz zu harten Bild-Labels, die versuchen, das wahrscheinlichste Label zu erfassen, sind Soft-Labels in der Lage, auch die Wahrscheinlichkeit zu erfassen, die mit dem Label auf der Grundlage der Reaktion des Gehirnsignals verbunden ist, was die Überanpassung des Modells reduziert. Dieses Verfahren, das als Human-in-the-Loop bezeichnet wird, ermöglicht es, eine große Anzahl von Bildern in relativ kurzer Zeit zu kennzeichnen. Es kann mit aktiven Lerntechniken kombiniert werden und die Menge der für das Training von KI-Modellen benötigten annotierten Daten erheblich verringern.


Bilder labeln in 300 Millisekunden

Dieses Bildklassifizierungssystem bietet dabei eine Abkürzung in das Gehirn eines Experten. Das Gehirn ist in der Lage, visuelle Bilder sehr schnell zu verarbeiten und Entscheidungsfragen in der Grauzone zu bewältigen, wenn also die Entscheidung für ein Label nicht ganz klar ist. Der Entscheidungsprozess, mit dem ein Experte feststellt, ob sich in einem komplexen Bild ein gesuchtes Zielobjekt befindet, dauert etwa 300 Millisekunden. Was dagegen viel mehr Zeit in Anspruch nimmt, sind die kognitiven und motorischen Prozesse, die nach der Entscheidungsfindung ablaufen. Dazu gehören die Planung einer Reaktion (zum Beispiel etwas sagen oder eine Taste drücken) und die anschließende Ausführung dieser Reaktion. Wenn der Anwender diese Planungs- und Ausführungsphasen überspringen und stattdessen das EEG nutzen kann, um direkt auf die Ergebnisse der visuellen Verarbeitungs- und Entscheidungsfindungssysteme des Gehirns zuzugreifen, lassen sich Bilderkennungsaufgaben viel schneller durchführen und auch das Konfidenzniveau des Experten mit erfassen.


Expertenwissen fließt in Trainingsdaten mit ein

Innereye verwendet Deep Learning, um EEG-Signale in Reaktionen zu klassifizieren, die „Targets“ und „Non-Targets“ anzeigen. Targets können alle Anomalien sein, die ein trainiertes menschliches Gehirn erkennen kann. Die Anwendung der Technologie erfordert allerdings Training und Konzentration. Die Benutzer müssen Experten für die jeweilige Aufgabe sein, die gut darin geschult sind, eine bestimmte Art von Ziel zu erkennen. Während sich der Experte auf einen kontinuierlichen Strom von Bildern konzentriert, der je nach Komplexität drei bis zehn Bilder pro Sekunde umfasst, kann ein kommerzielles EEG-System in Kombination mit der Software von Innereye die charakteristische Gehirnreaktion des Experten unterscheiden, wenn er ein Ziel erkennt. Das System liefert Ergebnisse, die ebenso genau sind wie die eines Menschen, aber viel informativer als die manuelle Klassifikation von Bildern. Zudem beschleunigt diese Abkürzung zum Gehirn der Person die Bildklassifizierung entscheidend. 

Die Experten müssen dabei immer darauf achten, was sie sehen und können die Bilder nicht einfach an sich vorbeiziehen lassen. Daher gibt die EEG-Technik auch Einblicke in den Aufmerksamkeitszustand des Experten und ermöglicht bei Bedarf Unterbrechungen und Ruhephasen. Der Brain-in-the-Loop-Ansatz ist besonders hilfreich für die Klassifizierung von Daten, die möglicherweise interpretationsfähig sind. Menschliche Experten können etwas Ungewöhnliches erkennen, auch wenn sie nicht genau wissen, was es ist. Die Technologie ist in der Lage, diese Unsicherheit in den Gehirnströmen zu registrieren. Da Menschen die einzigartige Fähigkeit besitzen, Neues zu erkennen und zu kontextualisieren, ist dies ein wesentlicher Vorteil des Systems gegenüber reinen KI-Bildklassifizierern.

Die Software zeichnet jede vom Gehirn erzeugte Nuance auf und speist sie in die verknüpften KI-Modelle zurück. So trainiert sie die KI nicht nur mit Eins oder Null. Vielmehr wird auch der menschliche Faktor der Unsicherheit mit einbezogen, um das System zu verbessern, indem jedes Bild von Computer Vision und einem menschlichen Gehirn klassifiziert wird.


KI-Trainingsaufbau

Das Grundprinzip eines Brain-in-the-Loop-Aufbaus lässt sich in fünf Schritte unterteilen:

  • Training des Basismodells: Ein erstes KI-Modell wird anhand eines kleinen Datensatzes mit markierten Beispielen trainiert.
  • EEG-basiertes Modell-Training: EEG-Daten von Experten des jeweiligen Anwendungsbereichs werden gesammelt, während sie unauffällige Bilder und welche mit abnormalen Merkmalen bewerten.
  • Soft-Label-Zuweisung: Aus EEG-Daten generierte Soft Labels werden in einem größeren Trainingsdatensatz zugewiesen.
  • Modellverbesserung: Das KI-Modell wird anhand des neuen Datensatzes, der mit EEG-basierten Soft-Labels versehen ist, für jeden einzelnen Experten neu trainiert.
  • Aktives Lernen und Brain-in-the-Loop: Ein aktiver Lernansatz wird in Kombination mit Brain-in-the-Loop-Konzepten angewandt, um die kontinuierliche Aktualisierung und Feinabstimmung des KI-Modells vorzunehmen.


Zusammenfassung

Der Brain-in-the-Loop-Ansatz der Innereye-Technologie reduziert den Bedarf an gelabelten Daten erheblich. Das Einbeziehen von Gehirnsignalen und menschlicher Expertise ermöglicht es, die Genauigkeit und Robustheit von KI-Modellen zu erhöhen und gleichzeitig den arbeitsintensiven Labelling-Prozess deutlich zu reduzieren. Die möglichen Anwendungsfelder sind vielfältig. Bislang wird die Technologie zum Beispiel in der Produktion für das Erkennen von Produktfehlern eingesetzt. Ebenso in der Flughafensicherheit, um potenzielle Bedrohungen in Gepäckstücken zu identifizieren, sowie in der Medizin, um Tumore zu finden. Ein weiteres Anwendungsbeispiel kommt aus der Agrarindustrie und ermöglicht Landwirten mittels einer App, das Fachwissen von Pflanzenexperten beim Erkennen von Pflanzenkrankheiten direkt auf dem Acker anzuwenden.

Autor
Andreas Breyer, Vision Communications

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon