Automatisierung

Künstliche Intelligenz für alle: Komplettlösung für KI-basierte Bildverarbeitung

26.06.2020 -

Deep Learning eröffnet der industriellen Bildverarbeitung Einsatzgebiete, die sich zuvor nur mit viel Aufwand oder gar nicht erschließen ließen. Der zur klassischen Bildverarbeitung grundlegend unterschiedliche Ansatz stellt Anwender jedoch vor neue Herausforderungen, weshalb oftmals ein Umdenken notwendig ist. Ein schwäbischer Kamerahersteller präsentiert deshalb eine Embedded-Vision-Komplettlösung, mit der jeder Anwender in wenigen Schritten und ohne Programmierkenntnisse KI-basierte Bildverarbeitung realisieren und auf einer Kamera – als eingebettetes Inferenzsystem – einsetzen kann. Deep Learning wird damit anwendertauglich.

Computer Vision und Bildverarbeitung sind zu unabdingbaren Werkzeugen in vielen Bereichen geworden. Daher bekommen es bildverarbeitende Systeme mit einer stetig wachsenden Produkt- und Variantenvielfalt sowie organischen Objekten wie Obst, Gemüse oder Pflanzen zu tun. Konventionelle Ansätze mit regel­basierter Bildverarbeitung stoßen hier schnell an ihre Grenzen, da die zu analysierenden Bilddaten zu stark variieren und die Unterschiede nicht oder nur schwer durch Algorithmen abzubilden sind. Eine robuste Automatisierung lässt sich in solchen Fällen nicht durch ein unflexibles Regelwerk umsetzen – auch dann nicht, wenn es um eine für Menschen einfache Aufgabe geht. Zum Beispiel ist ein Kind in der Lage, ein Auto als solches zu identifizieren, auch wenn es dieses eine Modell noch nie gesehen hat. Dazu reicht es aus, wenn das Kind die wesentlichen Merkmale von Autos kennt.
Diese Fähigkeit, flexibel und selbstständig zu entscheiden, lässt sich durch maschinelles Lernen auf Bildverarbeitungssysteme übertragen. Mithilfe neuronaler Netze und Deep-Learning-Algorithmen wird einem Computer beigebracht, Objekte zu sehen, wiederzuerkennen und aus dem Gelernten Schlussfolgerungen zu ziehen. Wie ein Mensch lernt und entscheidet ein solches System also anhand von Erfahrungswerten.

Unterschiede zur klassischen ­Bildverarbeitung

Der wesentliche Unterschied zur regelbasierten Bildverarbeitung (BV) liegt in der Art und Weise Bildmerkmale zu identifizieren und wie das erlernte Wissen repräsentiert wird. Beim klassischen Ansatz liegt es in der Hand eines Bildverarbeitungsspezialisten, die ausschlaggebenden Bildmerkmale zu selektieren und bestimmten Regeln folgend zu beschreiben. Viele Zeilen Quellcode sind nötig, um detailliert festzulegen, wie eine gegebene Aufgabe zu lösen ist. Denn nur das, was die Regeln abdecken, kann die Software erkennen. Die spätere Ausführung erfolgt in festgelegten Grenzen ohne Interpretationsspielraum. Die eigentliche geistige Leistung liegt also allein beim BV-Experten.
Ganz anders ist das Vorgehen bei der Arbeit mit neuronalen Netzen. Deren Vorteil liegt darin, selbständig zu lernen, welche Bildmerkmale wichtig sind, um daraus die richtige Schlussfolgerung zu ziehen. Man spricht dann vom nicht-symbolischen Ansatz, da das Wissen nur implizit vorliegt und keinen Einblick in die erlernten Lösungswege zulässt. Welche Merkmale gespeichert, wie sie gewichtet und welche Schlussfolgerungen getroffen werden, beeinflussen lediglich die Menge und die Inhalte der Trainingsbilder. Deep-Learning-Algorithmen erkennen und analysieren die vollständigen Bildinhalte und setzen erkannte Merkmale je nach Häufigkeit des Auftretens in Beziehung mit den zu lernenden Begriffen. Die statistische Häufigkeit erzeugt beim Training das, was wir Erfahrung nennen. Googles Spezialistin für künstliche Intelligenz Cassie Kozyrkov bezeichnet Machine Learning auf dem Websummit 2019 in Lissabon als Werkzeug zum Programmieren. Es ermögliche einer Maschine, Begriffe über Beispiele beizubringen, anstatt über viele Instruktionen.
Für die Entwicklung von Maschine-­Vision-Anwendungen auf KI-Basis ist demnach ein Umdenken nötig. Es ist wichtig zu verstehen, dass die Qualität der Ergebnisse – sprich die Geschwindigkeit und Zuverlässigkeit beim Erkennen von Objekten – davon abhängt, was ein neuronales Netz erkennt und daraus schlussfolgert. Hier spielt das Wissen des entsprechenden Facharbeiters eine entscheidende Rolle, der die geeigneten Datensätze für das Training mit möglichst vielen Beispielbildern mitsamt den zu lernenden Begriffen bereitstellt. Die Verantwortung, die beim klassischen Ansatz bei einem Bildverarbeitungsspezialisten lag, übernimmt beim Machine Learning ein Datenspezialist.

Neue Herausforderungen beim Machine Learning

Doch welche Fähigkeiten sind nun nötig, um Machine Learning umzusetzen? Bricht man die Entwicklung einer KI-Anwendung in einzelne Schritte herunter, offenbaren sich tatsächlich Aufgaben und Begrifflichkeiten, die verglichen mit dem klassischen Ansatz gänzlich neu sind. Der Umgang und die Vorbereitung der Bilddaten sowie das Training neuronaler Netze erfordern neue Tools und Entwicklungs-Frameworks, die auf einer geeigneten PC-Infrastruktur installiert und ausgeführt werden müssen. Und obwohl notwendige Anleitungen und Open-Source-Quellen bei Cloud-Anbietern oder auf Plattformen wie Github in der Regel frei zur Verfügung stehen, liefern sie lediglich die rudimentären Basiswerkzeuge, deren Einsatz viel Erfahrung voraussetzt. Und das Erstellen, Ausführen und Bewerten der Trainingsergebnisse auf einer geeigneten Hardware-Plattform erfordert Verständnis und Wissen über Hardware, Software und deren Schnittstellen.

Sofort loslegen mit der Maschine-­Learning-Komplettlösung

Der Kamerahersteller IDS aus Obersulm bei Heilbronn möchte den Anwender schon bei den ersten Schritten mit Machine Learning unterstützen. Mit einer Inferenzkamera-Komplettlösung kombiniert das Unternehmen seine Deep-Learning-Erfahrung und seine Kameratechnik. Das ermöglicht dem Anwender den Soforteinstieg in die KI-basierte Bildverarbeitung. Mit IDS NXT ocean senkt der Hersteller die Einstiegshürde und stellt einfach anzuwendende Werkzeuge bereit, mit denen Anwender ohne viel Vorwissen Inferenzaufgaben in wenigen Minuten erstellen und sofort auf einer Kamera ausführen können.

Das Konzept basiert auf drei Komponenten:

  • einer einfach bedienbaren Trainingssoftware für neuronale Netze
  • und einer Kameraplattform,
  • inklusive eines KI-Beschleunigers, der die neuronalen Netze Hardware-seitig ausführt.

Alle Komponenten hat IDS entwickelt. Die cloud-basierte Trainingssoftware IDS NXT Lighthouse führt Schritt für Schritt durch die Datenvorbereitung bis zum Training der künstlichen Intelligenz in Form eines neuronalen Netzes. Der Anwender kommt dabei nicht in Kontakt mit Basiswerkzeugen oder muss sich mit der Installation von Entwicklungs­umgebungen auseinandersetzen. Weil die Software in der Cloud läuft, ist sie ohne Installation sofort einsatzbereit. Dem Anwender stehen für all seine Projekte genügend Speicherplatz und ausreichend Trainings-Performance in einem einfach bedienbaren Workflow zur Verfügung. Einloggen, Trainingsbilder hochladen, labeln und anschließend das gewünschte Netz trainieren. Kunden profitieren von der Rechenzentrums- und Netzwerkarchitektur von deutschen Servern der Amazon Web Services (AWS), die speziell eingerichtet wurde, um alle Anforderungen an Datenschutz und -Sicherheit zu erfüllen.
Mit wenigen Konfigurationseinstellungen spezifiziert der Anwender in einfachen Dialogen die Anforderungen für Geschwindigkeit und Genauigkeit an seine Anwendung. Netzauswahl und Einrichtung der notwendigen Trainingsparameter nimmt IDS NXT Lighthouse daraufhin selbständig vor. Die Trainingsergebnisse vermitteln dem Anwender bereits eine gute Vorhersage über die Qualität der trainierten Intelligenz und ermöglichen so ein schnelles Ändern und Wiederholen des Trainingsprozesses.
Zudem verbessert IDS das System kontinuierlich und baut es aus. Ohne Update und Wartungsphasen einplanen zu müssen, steht den Anwendern stets die aktuelle Version der Software zur Verfügung. Sie können sich somit auf ihre Anwendungen konzentrieren, ohne das Wissen über Lernmethoden und künstliche Intelligenz aufbauen zu müssen.

Anwender ist Lehrer des neuronalen Netzes

Der Hersteller setzt bei IDS NXT Lighthouse auf das sogenannte überwachte Lernen (Supervised Learning), um neuronale Netze zu trainieren. Die Deep-Learning-Algorithmen lernen mit vorgegebenen Paaren von Ein- und Ausgaben. Dazu stellt der Lehrer – in diesem Fall der Anwender – während des Lernens den korrekten Funktionswert zu einer Eingabe bereit, indem er einem Bildbeispiel die korrekte Klasse zuordnet. Dem Netz wird die Fähigkeit antrainiert, Assoziationen selbstständig herzustellen, indem es Vorhersagen zu Bilddaten in Form von Prozentwerten macht. Je höher der Wert, desto genauer und sicherer ist die Vorhersage.
Für einen schnellen Erfolg sorgt das nahtlose Zusammenspiel der Software mit den IDS-NXT-Kamerafamilien Rio und Rome. Denn fertig trainierte neuronale Netze lassen sich ohne Programmieraufwand auf einer dieser Kameras hochladen und ausführen. Damit hat der Anwender sofort ein funktio­nierendes Embedded-Vision-System, das eigenständig sieht, erkennt und Ergebnisse zu den aufgenommenen Bilddaten ableitet. Mit seinen digitalen Schnittstellen kann es außerdem Maschinen direkt ansteuern.

Embedded-Vision-Hybrid-System

IDS hat für den FPGA der IDS-NXT-Kameraplattform einen KI-Core namens deep ocean core entwickelt, der vortrainierte neuronale Netze hardwarebeschleunigt ausführt. Das macht die Industriekameras zu Inferenz­kameras, die künstliche Intelligenz im industriellen Umfeld sinnvoll nutzbar machen. Bildanalysen finden dezentral statt, wodurch sich Bandbreiten-Engpässe in der Übertragung vermeiden lassen. IDS-NXT-Kameras können, was Genauigkeit und Geschwindigkeit von KI-Aufgaben angeht, mit modernen Desktop-CPUs Schritt halten – bei gleichzeitig wesentlich geringerem Platz- und Energie­verbrauch. Durch die Programmierbarkeit des FPGAs ergeben sich zusätzlich Vorteile wie Zukunftssicherheit, geringe wiederkehrende Kosten und Time-to-Market.
Durch den kombinierten Einsatz von IDS-eigener Soft- und Hardware kann der Anwender die maximale Inferenzzeit zudem selbst vor dem Training bestimmen. Die Software IDS NXT Lighthouse kümmert sich daraufhin um optimale Trainingseinstellungen unter Berücksichtigung der KI-Core-Performance der Kamera. Damit erwarten den Anwender bei der späteren Ausführung der Inferenz keine Überraschungen, wodurch zeitraubendes Nachjustieren und Nachtrainieren entfällt. Das System bleibt damit außerdem für den Anwender, einmal integriert, immer 100 Prozent kompatibel und konsistent in seinem Verhalten. Gerade bei industriell zertifizierten Anwendungen ist das ein klarer Vorteil.

Funktionsumfang lässt sich per Software erweitern

Durch die leistungsfähige Hardware ist die Embedded-Vision-Plattform aber weit mehr als eine reine Inferenzkamera für die Ausführung von neuronalen Netzen. Der Funktionsumfang der CPU-FPGA-Kombination lässt sich mittels Vision Apps vom Anwender ganz nach Bedarf erweitern und verändern. Wiederkehrende Vision-Aufgaben lassen sich damit schnell einrichten und wechseln. Auch ein flexibel agierender Bildverarbeitungsablauf ist damit möglich.
Aufgenommene Bilder durchlaufen beispielsweise zuerst eine Vorverarbeitung, bevor eine recht simple und schnelle Klassifizierung Gut- und Schlecht-Teile sortiert. Beim Auftreten von Fehlern kann dann innerhalb von Millisekunden ein weitaus komplexeres neuronales Netz nachgeladen werden, um die Fehlerklasse viel detaillierter zu bestimmen und die Ergebnisse an eine Datenbank zu übermitteln. Per App-Entwicklungskit sind maßgeschneiderte Lösungen einfach realisierbar. Anwender können damit individuelle Vision Apps in wenigen Schritten selbst erstellen und auf IDS-NXT-Kameras installieren und ausführen.
IDS-NXT-Kameras sind Hybridsysteme, um sowohl Vorverarbeitung von Bilddaten mit klassischer Bildverarbeitung als auch eine Merkmalsextraktion mittels neuronaler Netze nebeneinander einzusetzen, um Bildverarbeitungsanwendungen auf einem Gerät effizient zu nutzen.

Kontakt

IDS Imaging Development Systems GmbH

Dimbacher Str. 10
74182 Obersulm
Deutschland

+49 7134 96196 0

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon