Deep Learning in der Bildverarbeitung
Selbstlernend, leistungsstark und fast menschlich
Künstliche Intelligenz (AI) und Deep Learning erschließen der Vision-Technologie neue Anwendungsmöglichkeiten. Mit einer neuen, auf Deep Learning basierenden industriellen Bildanalyse lassen sich komplexe Aufgaben zuverlässig lösen.
Einstmals unlösbare Aufgabenstellungen sind nun zuverlässig realisierbar, vor allem wenn es um die unbekannte Ausprägung von Fehlern geht. Dabei ist die Komplexität einer schwierigen Applikation heute kein unüberwindbares Hindernis mehr: Mit der direkten Integration einer neuen, auf Deep Learning basierenden industriellen Bildanalyse zur automatischen Erkennung, Prüfung und Klassifizierung geht die Umsetzung auch ohne einschlägiges AI-Know-how und Programmierkenntnisse einfach und schnell.
Vier Werkzeuge lösen komplexe Aufgaben
Cognex VisionPro ViDi ist die erste auf Deep Learning basierende Bildanalyse-Software, die speziell für die Fabrikautomation konzipiert wurde. Die praxiserprobte, zuverlässige Software-Lösung mit modernen Algorithmen für maschinelles Lernen kombiniert künstliche Intelligenz mit der Robustheit der industriellen Bildverarbeitung in der Cognex Designer Software. Damit lassen sich komplexe Anwendungen lösen, die mit traditionellen Bildverarbeitungssystemen zu schwierig, zu aufwändig oder zu teuer wären. Die Software verfügt über vier leistungsstarke Tools:
- ViDi BLUE Locate zur Lokalisierung und Identifizierung von Merkmalen
- ViDi RED Analyze zur Segmentierung und Fehlererkennung
- ViDi GREEN Classify zur Objekt- und Szenenklassifizierung
- ViDi BLUE Read zum Lesen von Texten und Zeichen
Die neue Technologie auf Basis von Deep Learning funktioniert zuverlässig auch bei Abweichungen und unvorhersehbaren Defekten. Sie wird insbesondere angewendet zur Lokalisierung und Identifizierung verzerrter Merkmale, zur Segmentierung und Fehlererkennung, zur Klassifikation von Textur und Material und für anspruchsvolle OCR-Anwendungen (mit verzerrtem Druck).
Verzerrte Merkmale zuverlässig lokalisieren und identifizieren
ViDi BLUE Locate findet komplexe Merkmale und Objekte durch Lernen aus kommentierten Bildern. Selbstlernende Algorithmen lokalisieren Teile, zählen durchsichtige medizinische Glasfläschchen auf einem Tablett und führen Bestückungsprüfungen auf Kits und Packungen durch. Zum Einlernen des Software-Tools benötigt der Anwender lediglich Bilder, auf denen die relevanten Merkmale markiert sind.
Ein typisches Anwendungsbeispiel ist die Identifizierung und Klassifizierung von Zündkerzen. Hier müssen die Hersteller auf Sichtprüfungen vertrauen, wenn die Umgebungen keine Technologie zum Lesen von Barcodes unterstützen. Leichte Abweichungen im Erscheinungsbild können für automatische Prüfsysteme aber ein Problem darstellen. Dies ist der Fall bei Zündkerzen, die zur Vormontage auf Tabletts in unterschiedlichen Farben ankommen. Die Software-Lösung verallgemeinert dann die Merkmale einer Zündkerze anhand ihrer Größe, Form und Oberflächenmerkmale.
Der Ingenieur markiert mithilfe des Identifizierungs-Tools einige Zündkerzen auf den Bildern, um die Software einzulernen. Dadurch werden einzelne Zündkerzen nach dem Training identifiziert und können gezählt werden. Das ViDi GREEN Classify-Tool verwendet währenddessen das Deep-Learning-basierte Modell, um die Zündkerzen nach dem bekannten Merkmal - der Farbe - in einer definierten Größe zu klassifizieren.
Fehlererkennung und Segmentierung
ViDi RED Analyze wird verwendet, um Anomalien und ästhetische Fehler zu erkennen - gleichgültig ob es sich um Kratzer auf einer dekorierten Oberfläche handelt, um unvollständige oder unsaubere Anordnungen oder um problematische Webstellen in Textilien. Das Tool kann all diese Probleme ganz einfach durch das Lernen des normalen Aussehens eines Objekts einschließlich erheblicher, jedoch zulässiger Änderungen identifizieren.
Zudem wird das ViDi RED Analyze Tool zum Segmentieren spezieller Bereiche verwendet - beispielsweise beim Vorhandensein von Fremdmaterial auf einem medizinischen Gewebe. Das Analysetool kann die relevanten Bereiche durch Lernen des wechselnden Erscheinungsbilds in der Zielzone zuverlässig identifizieren. Das Analysetool erleichtert beispielsweise die automatische Erfassung und Bestimmung von Fehlern auf texturierten Metalloberflächen, etwa bei der Prüfung von Kolbenringen. Außerdem erfasst es zuverlässig Poren im Metall, beispielsweise bei der Inspektion der Zylinder.
Auch bei der Inspektion von Textilien, etwa bei der Airbag-Prüfung, kommt es zum Einsatz. Denn für Airbags gelten zur Gewährleistung der Sicherheit der Passagiere strenge Qualitätsstandards. Die Fahrzeughersteller müssen alle sicherheitskritischen Komponenten doppelt und dreifach prüfen, um deren Qualität zu gewährleisten und Garantie- und Rückrufkosten zu senken.
Die Vorgehensweise zur Lösung der Aufgabe ist einfach: Ein Ingenieur trainiert das Analysetool im sogenannten Unsupervised-Mode - zu diesem Zweck wird eine Reihe an fehlerfreien Bildern eines Airbags eingelernt. Das Tool erlernt so das normale Erscheinungsbild eines Airbag-Gewebes einschließlich Webmuster, Gewebeeigenschaften und Farbe. Alle Merkmale, die von dem eingelernten Erscheinungsbild des Modells abweichen, werden im Bild markiert. Auf diese Weise erfasst die Software zuverlässig und beständig alle Anomalien wie Löcher, Schlitze, Risse und ungewöhnliche Stichbilder. So können fehlerhafte Bereiche des Gewebes auch ohne umfangreiche Fehlerbibliotheken schnell identifiziert und gemeldet werden.
Objekt- und Szenenklassifizierung
ViDi GREEN Classify wird verwendet, um ein Objekt oder eine ganze Szene zu klassifizieren, beispielsweise bei der Identifizierung von Produkten basierend auf deren Verpackung, bei der Klassifizierung von Schweißnähten oder der Unterscheidung von zulässigen und unzulässigen Fehlern. Basierend auf einer Sammlung von Bildern lernt das Tool verschiedene Klassen zu unterscheiden. Zum Einlernen benötigt der Anwender lediglich Bilder, die den verschiedenen Klassen zugeordnet und entsprechend markiert sind.
Ein Anwendungsbeispiel ist die Prüfung der Schweißnähte eines Motor-Kolbens. Diese sind extrem unterschiedlich, wodurch die Erkennung von Anomalien schwierig wird. Bestimmte Anomalien, wie fehlende, zu große oder zu kleine Schweißnähte, sind unerwünscht. Andere Anomalien, wie überlappende Nähte, dagegen sind erlaubt und aus Sicherheitsgründen sogar erforderlich. Das ViDi RED Analyze-Tool erleichtert in Kombination mit dem ViDi GREEN Classify-Werkzeug die automatische Prüfung und Klassifizierung der Schweißnahtfehler.
Die Vorgehensweise zur Lösung der Aufgabe ist unkompliziert: Die Software wird vom Ingenieur mittels des RED Analyze-Tools im Supervised-Mode eingelernt. Hierfür werden auf Bildern, die als „Nicht in Ordnung“ eingestuft sind, die Fehler händisch im Tool markiert. Das Analysetool lernt somit das Erscheinungsbild eines spezifischen Fehlers, und ist somit in der Lage, mit dem eingelernten Model in Bildern nach Fehlern zu suchen. Im zweiten Teil der Prüfung klassifiziert der Ingenieur die Fehler mithilfe des GREEN Classify-Tools nach ihrem jeweiligen Typ. Die Software extrahiert auf der Basis des entwickelten Modells Informationen über bestimmte Fehler und separiert überlappende Nähte als eigene Klassifizierung. Auf der Basis dieser Information ist der Automobilhersteller in der Lage, ausschließlich überlappende Nähte auszuwählen.
Lesen von Texten und Zeichen
ViDi BLUE Read entziffert stark verformte, schiefe und schlecht geätzte Zeichen mit Hilfe der optischen Zeichenerkennung OCR. Die vorgeschulte Font-Bibliothek identifiziert den größten Teil des Textes ohne zusätzliche Programmierung oder Font-Training und ermöglicht damit eine schnelle und einfache Anwendung. Das robuste Tool kann so eingelernt werden, dass spezifische OCR-Anwendungsanforderungen eingestellt werden können. Hierfür ist kein spezifisches Know-how erforderlich.
Beispielsweise erkennt das Tool verformte Zeichen bei der Prüfung der Fahrgestellnummer (VIN, Vehicle Indentification Number). Denn für eine erfolgreiche Rückverfolgbarkeit müssen die Hersteller in der Lage sein, die Fahrgestellnummer zuverlässig zu lokalisieren und zu dekodieren. Die Farbgebung sowie Spiegel- und Blendeffekte machen es für industrielle Bildverarbeitungssysteme aber schwierig, die Zeichen zu lokalisieren und zu erkennen. Mit dem Lesetool hingegen lassen sich verformte Zeichen nun trotz der anspruchsvollen Bilderstellung einfach lokalisieren und lesen.
Zum Einlernen der Software definiert ein Ingenieur die Zeichengröße auf Bildern mit einer repräsentativen Auswahl an VIN-Zeichen. Dank seiner vorinstallierten Omni-Schriftarten erkennt das Tool sogar Zeichen, die durch Blendeffekte und Kontraste verdeckt sind. Während der Einlern- und Validierungsphase kennzeichnet der Ingenieur immer nur die jeweils übersehenen Zeichen - und zwar solange, bis die Software in der Lage ist, alle Zeichen korrekt zu identifizieren. Dieser neue, auf Deep-Learning basierte Ansatz zu OCR spart beim Einlernen und bei der Entwicklung Zeit, indem er eine übermäßige Kennzeichnung vermeidet und Zeichen auf unruhigem Hintergrund erfolgreich liest.