Schwachstellen im Schienennetz
Rückverfolgbarkeit von Eisenbahnschienen mit 3D-OCR
Sicherheit steht bei der Bahn immer und überall an oberster Stelle - auch auf den Hochgeschwindigkeitsstrecken. Um diese sicherzustellen, gelten auch für die Eisenbahnschienen und Räder strenge Sicherheitsvorschriften. Dabei ist die Rückverfolgbarkeit jeder einzelnen Schiene und jedes Eisenbahnrades zwingend. Schnelle 3D-Lesestationen mit Laser-Triangulationskameras übernehmen bei den einzelnen Schienen das Lesen der achtstelligen Kennzeichnung.
Da Eisenbahnschienen sowohl im Fertigungsprozess als auch nach dem Verbauen sicher identifizierbar sein müssen, ist die Kennzeichnung der Schienen nach DIN EN 13674-1-2008 mit einer achtstelligen alphanumerischen Zeichenfolge vorgegeben. Die Zeichenfolge wird seitlich auf die Schiene warmgestempelt und wiederholt sich in einem Abstand von maximal 5 m über die gesamte Schienenlänge von bis zu 120 m. Die Codierung beinhaltet eindeutige Angaben zur Schmelze-Nummer, über die Nummer des Stranges und die Lage des Vorblocks innerhalb des Stranges sowie die Lage der Schiene im jeweiligen Vorblock (A, B...Y). Die Schiene kann vor Auslieferung in kürzere Segmente geteilt werden, muss jedoch eine Mindestlänge von 5 m beibehalten, um die Rückverfolgbarkeit auch nach der Auslieferung sicherzustellen. Im Fertigungsprozess muss diese Codierung vor den abschließenden Prüfungen der Schiene (Ultraschall, Wirbelstrom, Dimension und Ebenheit) sicher gelesen werden, um einen konsistenten Datensatz mit allen Prüfergebnissen zu erzeugen. Denn ist die Identifikation der Codes nicht möglich, dürfen die Schienen nicht weiterverarbeitet werden. Zusätzlich muss auch die Länge der Schiene und die normgerechte Position der einzelnen Codierungen geprüft werden. Verzunderte Oberfläche, Verfärbungen, Vibrationen, Rost und Unebenheiten der Schienen erschweren dabei den Lesevorgang. Auch die große Schwankungs-Bandbreite der Zeichenprägung führt dazu, dass Form und Aussehen der Zeichen variieren können. Idealerweise sind die Zahlen und Buchstaben bei einer Prägetiefe von 0,5-1,5 mm 16 mm hoch und 10° zur Senkrechten geneigt. Um Pseudofehler der Ultraschallprüfung in der Fertigung und nach der Montage bei der vorgeschriebenen periodischen In-line-Prüfung zu vermeiden, wird eine möglichst geringe Prägetiefe angestrebt und realisiert. Die Schienen werden auf einem Rollengang mit seitlicher Führung bei 1,5 m/s an der Erkennungsstelle transportiert. Die Erkennungsstelle ist rund 30 m vom Leitstand entfernt. Das Ergebnis der Identifikation muss spätestens beim Eintreffen der Schiene an der nächsten Messstation, das sind etwa 10 m vor dem Erreichen des Leitstandes, vorliegen. Aufgrund der großen Entfernungen sind Kabellängen von 70 m für das Erkennungssystem erforderlich.
Mögliche Zeichen auf 120 m Schienenlänge ausfindig machen
Da die Zeichen-Kontrastierung zu stark schwankt, ist eine prozesssichere Lösung mit den klassischen 2D-Verfahren nicht möglich. Auch mit aufwändigen Beleuchtungsansätzen und Software-Tools ist kein zufriedenstellendes Ergebnis zu erzielen. Eine 3D-Laser-Triangulationskamera erreicht dagegen die im Prozess notwendige Lese-Sicherheit.
Ein Linienlaser und eine schnelle 3D-Kamera sind in einem bestimmten Winkel zueinander angeordnet und tasten so die seitliche Oberfläche der Eisenbahnschiene ab. Die lokale Ablenkung des Laserstrahles auf der Oberfläche ist ein Maß für die Höhe bzw. Tiefe an der entsprechenden Position. Die Kamera bestimmt die Position des Laserstrahles in jedem einzelnen Bild und liefert die Höhendaten direkt als 3D-Daten für die weitere Auswertung. Die Transportgeschwindigkeit der Schiene synchronisiert die Bildaufnahme, um auch bei schwankender Geschwindigkeit immer gleiche Aufnahmesequenzen zu generieren. Dabei wird alle 0,1 mm eine neue Bildaufnahme mit 3D-Datengenerierung durchgeführt. Bei der maximalen Geschwindigkeit von 1,5 m/s wird eine Scanfrequenz von 15 kHz erreicht und gleichzeitig ein 3D-Bild und Intensitätsbild mit je 16 bit erzeugt.
Über die gesamte Schienenlänge von bis zu 120 m entsteht eine enorme Datenmenge, die bereits eine Herausforderung für die Verarbeitung darstellt. Beim Schieneneinlauf kommt hinzu, dass sich die Führung der Schiene auf dem Rollengang schwierig gestaltet. Größere Schwankungen der Prägung und Zeichendarstellung vorwiegend in der Tiefe aus Kamerasicht sind die Folge. Unter diesen Randbedingungen gestaltet sich die Lokalisierung des Zeichenblocks über die gesamte Schienenlänge schwierig und im ersten Schienenabschnitt besonders kritisch. Anschließend erfolgt in diesen identifizierten Regionen mit möglichen Zeichen mittels adaptiver Methoden die Segmentierung der einzelnen Zeichen, also die Trennung der Zeichenmerkmale vom Hintergrund.
Beste Lese-Ergebnisse durch statistisches Lernen
Im nächsten Schritt wird jedem segmentierten Zeichenbereich mit statistischen Verfahren und Fuzzy-Algorithmen das entsprechende Zeichen mit der besten Übereinstimmung aus dem gelernten Zeichensatz zugeordnet. Die Übertragung des Gesamtergebnisses an den Leitstand schließt den Lesezyklus ab. Um die geforderten Leistungsdaten der Erkennung zu erreichen, erfolgt die Bildaufnahme kontinuierlich im Hintergrund in einer eigenen Task, die Auswertung der bis zu 1,2 Millionen 3D-Bilder pro Schiene ebenso kontinuierlich in einer anderen Task. Für gute Leseergebnisse wird das A-priori-Wissen über den Prägeprozess als Teil der Klassifikation genutzt und z.B. ein Zeichen mit ungenügender Prägequalität aus dem ersten Zeichenblock der Schiene in weiteren Blöcken vor Erreichen des Leitstandes plausibilisiert und ggf. ersetzt. Ist eine 100%-ige Erkennung trotz allem nicht gegeben, besteht die Möglichkeit der manuellen Korrektur eines nicht gelesenen Zeichens. Dazu wird im Automatikbetrieb zusätzlich zum 3D-Bild auch das Helligkeitsbild im Leitstand angezeigt.
Um die große Bandbreite der Variationen eines Zeichens erfassen zu können, wird beim Lernen des Zeichensatzes bereits ein statistisches Verfahren angewandt, das die Gemeinsamkeiten eines Zeichens im 3D-Raum betont. Da die Anzahl der unterschiedlichen Varianten eines Zeichens von der System-Software nicht begrenzt ist, können beliebig viele Varianten eines Zeichens kundenseitig eingelernt werden. In der Praxis hat sich jedoch gezeigt, dass bei mehr als 20 Varianten pro Zeichen selten noch eine signifikante Verbesserung der Lese-Ergebnisse erzielt wird.
Fazit: Rückverfolgbar mit 3D-Lesestationen
Die 3D-Lesestationen zur Zeichenerkennung auf den Eisenbahnschienen sind seit Anfang 2011 bei einem deutschen Hersteller im Einsatz, die 3D-Lesestationen für die Eisenbahnräder seit 2004 in Russland, der Ukraine und Spanien installiert. Aus den Erfahrungen dieser Installationen ist ein Standard-System für die 3D-Zeichenerkennung von geprägten oder erhabenen Zeichen für den Einsatz in der Gießerei entstanden. Gussteile, wie z.B. Zylinderkurbelgehäuse, Motorblöcke usw., haben die spezifischen Produktionsdaten wie Chargennummer, Gießjahr, Gießwoche und Schicht, Gießwerkzeug und Form innerhalb des Werkzeuges sowie ggf. eine Zeichnungsnummer und Index meist als erhabene Zeichen codiert.
Für die Rückverfolgbarkeit dieser Teile müssen die Produktionsdaten im ersten Schritt automatisch gelesen oder manuell eingegeben werden. Prozesssicher lässt sich dieser Schritt mit 3D-Lesestationen umsetzen, da die Kameras inzwischen auch mit logarithmischer Kennlinie verfügbar sind und so eine hohe Unabhängigkeit von den typischen Variationen der Oberflächeneigenschaften erreicht wird. Ebenso erlauben die höhere Auflösung der 3D-Kameras und die hohe Scanfrequenz einen breiteren Einsatz als noch 2004 möglich. Zur weiteren Verfolgung der Teile in den nächsten Prozessschritten wird meist ein Data-Matrix-Code (DMC), in dem zusätzlich eine fortlaufende Nummer integriert ist, aufgetragen. Diese Codierung kann dann in den nachfolgenden Stationen auch mit einfachen Lesegeräten sicher gelesen werden.
Die 3D-OCR-Systeme von Octum sind sowohl für stationäre (dabei wird die Kamera auf einer oder mehreren Achsen bewegt) als auch für bewegliche Teile einsetzbar. Der 3D-Sensor (Laser, Kamera, Optik, Scheimpflugadapter, Gehäuse) wird applikationsspezifisch so ausgelegt, dass für die gegebene Oberfläche die beste Auflösung, größte Dynamik und schnellste Abtastung erzielt wird. In der Praxis können das bei einer Tiefenauflösung von bis zu 10 µm bis zu 15.000 3D-Bilder pro Sekunde sein. Die Prozess-Ankopplung wird kundenspezifisch ausgelegt, wofür die gängigen Schnittstellen zur Verfügung stehen. Die Bedienoberfläche ist zurzeit in Deutsch, Englisch, Russisch und Spanisch verfügbar