Deep Learning kann OCR
Künstliche Intelligenz verbessert die Prüfung variabler Daten in der Nahrungsmittelindustrie
Optischen Technologien aus dem Umfeld der industriellen Bildverarbeitung kommt bei Kennzeichnungskontrollen besondere Bedeutung zu. Während die Möglichkeiten zur Prüfung von maschinenlesbarem Code bereits weit fortgeschritten sind, unterlag die automatische Prüfung von Klarschrift mit Kameras bisher erheblichen Einschränkungen, da die OCR-Algorithmen (Optical Character Recognition), die zum Lesen der aufgenommen Beschriftungen zum Einsatz kommen, fehleranfällig sind. Ein prozesssicheres Lesen kann nur sichergestellt werden, wenn die variablen Daten optimal aufgebracht wurden.
Bei Verpackungsprozessen in der Nahrungsmittelindustrie ist es allerdings üblich, dass Beschriftungen sehr schnell aufgedruckt werden müssen und somit nicht immer eine perfekte Druckqualität gegeben ist. Die Fehlerraten beim Lesen sind entsprechend hoch und aufwändige manuelle Stichprobenkontrollen noch immer weit verbreitet.
Ein weiterer Nachteil von heute zum Einsatz kommenden Lösungen ist der hohe Aufwand für Anpassungen an die jeweiligen Gegebenheiten. Smarte Lösungen, wie sie beim Prüfen von maschinenlesbarem Code zum Einsatz kommen, konnten sich bisher wegen der oben beschriebenen Einschränkungen nicht durchsetzen.
Technischer Durchbruch beim Lesen von Klarschrift
Aktuell erleben wir einen technischen Durchbruch, der das automatische Lesen von Klarschrift auch in der Nahrungsmittelindustrie mit all ihren komplexen Anforderungen ermöglicht – wie kurze Taktzeiten, schwankende Schriftqualität und raue Umgebungsbedingungen. Neuronale Netze, ein Spezialgebiet der künstlichen Intelligenz, die mit Deep-Learning-Verfahren erzeugt werden, können lernen, Klarschrift auch unter schwierigen Bedingungen sicher zu erkennen: auf unruhigen Hintergründen, bei mangelnder Druckqualität oder ungewöhnlichen Schriftarten.
Neuronale Netze und Deep Learning
Neuronale Netze, die mit Deep-Learning-Verfahren erstellt werden, imitieren die Funktionsweise des menschlichen Gehirns. Künstliche Neuronen dienen als Speicher von Informationen und tauschen diese nach dem Vorbild biologischer Synapsen über Verbindungen zwischen den Neuronen einzelner Schichten und Regionen miteinander aus. Während der intensiven Lernphase erhalten die Neuronen Feedback, wie sie zu einem aktuellen Ergebnis beigetragen haben. Über die Zeit verändern sie sich auf Basis dieses Feedbacks, und auch die Verbindungen zwischen den Neuronen unterliegen einem ständigen Entwicklungsprozess. Dadurch verbessert sich die Fähigkeit des gesamten neuronalen Netzes hinsichtlich Klassifikations- oder Approximationsaufgaben stetig.
Revolution durch eigenständiges Lernen
Für die digitale Bildverarbeitung bedeute dies einen enormen Fortschritt. Statt dem System in manueller und detaillierter Feinarbeit einzuprogrammieren, auf welche Merkmale es achten muss, um ein Objekt – zum Beispiel einen Buchstaben oder eine Zahl – in einer Kameraaufnahme klar zu erkennen, bringt der Anwender den Algorithmus dazu, selbst zu lernen, welches die relevanten Merkmale sind. Das menschliche Gehirn leistet ein solches Erkennen meisterhaft, auch wenn Zeichen von der Norm abweichen. Doch können wir selten genau erklären, warum wir wissen, welcher Buchstaben dargestellt wird. Mit Deep Learning muss auch der Anwender dem Algorithmus nicht mehr erklären, woran das zu erkennen ist, sondern er erhält während der Lernphase Feedback, ob er aufgedruckte Buchstaben und Zahlen richtig erkannt hat oder die Extraktion fehlerhaft war. So lernt er immer besser zu erkennen, was die spezifischen Kriterien sind, nach denen sich die einzelnen Zeichen unterscheiden.
Obwohl neuronale Netze bereits seit vielen Jahren Gegenstand der Forschung sind, setzen sie sich erst allmählich in industriellen Anwendungen durch. Die geeignete Computerhardware, die die sehr großen und komplexen Netze simulieren kann, ist er seit kurzem erschwinglich.
Vorteile von Deep Learning für den praktischen Einsatz:
- robustes, zuverlässiges und schnelles Lesen auch dort, wo die Qualität stark schwankt;
- keine anpassenden Programmierarbeiten beim Start-up einer neuen Installation;
- keine Anpassungen, wenn sich an der Konfiguration der Linie etwas ändert;
- keine manuelle Nachkontrolle.
Das Komplettsystem für OCR
Strelen Control Systems hat ein System zur Schriftenprüfung entwickelt, das sich schnell und einfach direkt in die Produktionslinien integrieren lässt. Kamera und Beleuchtung werden inline installiert – auch bei engen Platzverhältnissen. Der Rechner mit der Deep Learning Software befindet sich in einem staub- und feuchtigkeitsgeschützten Edelstahlschrank. Die Bedienung erfolgt über einen Touchscreen auf einer intuitiven Benutzeroberfläche.
Autor
Jochen Naumann, Projektleiter und Senior Software Entwickler im Bereich Bildverarbeitungssysteme bei Strelen Control Systems
Kontakt
Strelen Control Systems GmbH
Robert-Bosch-Str. 5
64572 Büttelborn
Deutschland
49 6151 78 93 80
+49 6151 78 93 81