Bildverarbeitung

Ohne Umwege zur maximalen Performance

Embedded Vision & KI

20.10.2021 - Wenn bisherige Embedded-Vision-Ansätze an ihre Grenzen stoßen und durchgängig hohe ­Performance sowie niedrige Latenz gefordert sind, sind neue Lösungsansätze und Prozessor­technologie gefragt. Hersteller von Kamerasensoren reagieren auf die wachsenden Herausforderungen mit neuen, hochauflösenden Modellen, die ebenfalls hohe Bildraten versprechen. Um eine ­optimale Systemperformance zu erzielen, kommt es aber vor allem auf die passende System­architektur an, die für eine durchgängig schnelle Verarbeitung der Daten sorgt. Dabei spielt die Kombination aus Übertragungsstrecken, Prozessor­performance und KI-Erweiterung eine entscheidende Rolle. Dies nimmt dieser Beitrag zum Anlass, um die konzeptionellen Herausforderungen und Lösungs­ansätze einmal genauer unter die Lupe zu nehmen.

Aufgrund wachsender Anforderungen an Bildauflösung und Geschwindigkeit stehen Schnittstellen mit höherer Geschwindigkeit und niedriger Latenz im Fokus. Wichtig dabei sind aber auch immer eine einfache Handhabung sowie gute Kompatibilität und nicht zuletzt die kostengünstige Umsetzung. Bei der externen Kameraanbindung sind deshalb seit vielen Jahren USB Vision und GigE Vision sehr beliebt und weit verbreitet, stoßen aber bezüglich Übertragungsraten an gewisse Grenzen. Gerade im Bereich schneller, hochauflösender Industriekameras zählt deshalb auch 10GigE Vision zu den etablierten Standards. Damit lassen sich Brutto-Übertragungsraten von mehr als 1.200 MB/s realisieren. Für die Anbindung per Camera Link und CoaXPress kommen hochwertige Framegrabber zum Einsatz, die im Bildverarbeitungssystem intern über schnelles PCI Express (PCIe) angebunden sind. Wenn es jedoch darum geht, große Datenmengen vom Sensor möglichst schnell, kostengünstig und effizient für die Weiterverarbeitung bereitzustellen, müssen Protokoll-Overhead minimiert und der Umweg über Zusatzbausteine vermieden werden.

Ausreichend Bandbreite und Performance

Bei der Konzeption von leistungsfähigen Bildverarbeitungssystemen ist es nicht nur wichtig, die passenden Schnittstellen nach außen zur Verfügung zu stellen. Ein ebenso wichtiger Punkt ist die interne Systemarchitektur, die durchgängig ausreichend Bandbreite und Performance für die Datenverarbeitung sicherstellen muss. Besonders bei Multi-Kamera-Anwendungen, bei denen viele verschiedene Schnittstellen gleichzeitig genutzt werden, spielt ausreichend Reserve eine wichtige Rolle, damit die Systemperformance im realen Betrieb keine Engpässe aufweist.

Als erfahrener Entwicklungs- und Produktionspartner für Embedded-Vision Hardware-Lösungen legt TQ großes Augenmerk auf zukunftsorientierte Konzepte, die Aspekte wie Künstliche Intelligenz und Upgrade-Fähigkeit berücksichtigen. Als Basis greift das Unternehmen deshalb auf das eigene breite Portfolio an Computer-on-Modules zurück, die neueste Prozessorausführungen unterschiedlicher Hersteller und Architekturen unterstützen und zudem durch den modularen Konzeptansatz Zukunftssicherheit und Flexibilität bieten. Neueste Prozessorgenerationen wie die elfte Generation Intel-Core- und Intel-Xeon-Prozessoren (Codename Tiger Lake H) setzen dabei neue Maßstäbe für Embedded-Vision-Anwendungen und bieten eine Vielzahl an High-Speed-Schnittstellen sowie starke CPU- und Grafik-Leistung inklusive effizienter KI-Unterstützung. Ebenso ist die notwendige Bandbreite für schnellen DDR4-3200-Speicher gegeben, was eine durchgängig hohe Performance sichergestellt. Gerade im Bereich der High-End-Bildverarbeitung sollte das Augenmerk auf der sogenannten H-Serie dieser Familie liegen, wie sie beispielsweise auf dem TQ-Embedded Modul TQMx110EB zum Einsatz kommt: Diese bietet gegenüber der kleineren U-Serie sehr viel mehr Systemperformance und den vollen Schnittstellenumfang. 

Die Details machen den Unterschied

Damit Anwender von den neuesten Intel-Core- und Intel-Xeon-Prozessoren optimal profitieren können und auch individuelle Lösungen einfach und kosteneffizient umsetzbar sind, bietet TQ mit dem TQMx110EB ein COM-Express-Basic-Modul an, das alle Embedded-H-Serie-Prozessorvarianten (Core i3, Core i5, Core i7 und Xeon) dieser neuen CPU-Generation unterstützt. Somit stehen bis zu acht leistungsfähige CPU-Cores, ein hochperformanter Grafik-Controller, bis zu 24 MB Cache und bis zu 64 GB DDR4-3200 zur Verfügung. Über die COM-Express-Steckverbinder werden nicht nur schnelles 2.5 Gigabit Ethernet, vier USB 3.2 Gen2 Schnittstellen (mit je 10 Gbit/s), acht USB 2.0 Interfaces sowie vier super-schnelle SATA III Ports bereitgestellt. Das Modul bietet zusätzlich 24 PCIe Lanes, wobei diese in zwei Gruppen aufgeteilt sind: Acht PCIe Gen3 ­Lanes mit je 8 Gb/s werden über den PCH (Peripheral Controller Hub / Chipsatz) bereitgestellt und teilen sich die Bandbreite zur CPU mit den anderen, bereits oben erwähnten IO-Schnittstellen. Die weiteren 16 PCIe Lanes werden mit PCIe-Gen4-Geschwindigkeit (mit insgesamt bis zu 256 Gb/s Bandbreite) direkt an die CPU angebunden, sodass ein ungebremster, direkter Datentransfer zwischen Peripherie und Prozessor möglich ist. Hierbei unterstützt das TQMx110EB auch „PCIe Bifurcation“, was eine Aufsplittung dieser Schnittstelle für bis zu drei PCIe Root Ports (Modi: x16, x8/x8 oder x8/x4/x4) ohne kostspielige, zusätzliche Elektronik zulässt. Besonders für anspruchsvolle Bildverarbeitungsanwendungen bietet dies höchste Flexibilität: So ist beispielsweise die Anbindung von mehreren schnellen PCIe-basierten Kamera-Modulen möglich. Wie bei klassischen Systemansätze üblich, lassen sich aber auch mehrere Framegrabber oder 10-Gigabit-Ethernet-Controller für hochauflösende High-Speed-Multi-Kamera-Systeme direkt an die CPU anbinden. Alternativ dazu sind weitere Optionen wie Zusatzsteckplätze für mehrere Accelerator-Karten (beispielsweise für Tensor Processing Units) realisierbar, was optimale Voraussetzungen für besonders anspruchsvolle KI-Anwendungen schafft. Auch hier profitiert die Systemperformance von der superschnellen PCIe Gen4 Anbindung direkt an die CPU.

Der modulare Ansatz mit dem TQMx110EB, das zusammen mit einem Carrierboard ein vollständiges Bildverarbeitungssystem bildet, bietet somit die Möglichkeit, unterschiedlichste Systemarchitekturen zu realisieren, die sich individuell auf die jeweiligen Anforderungen abstimmen lassen und dennoch stets durchgängig höchste Systemperformance bieten.

Die Umsetzung für Embedded-Vision-Lösungen

Die geringe Baugröße des TQMx110EB Embedded-Moduls mit lediglich 95 x 125 mm ermöglicht die Integration neuester Intel-Core- und Intel-Xeon-Prozessoren in besonders kompakte, aber dennoch extrem leistungsfähige Embedded-Vision-Anwendungen. Da das Modul bereits die volle PC-Funktionalität umfasst, müssen auf dem Carrierboard, welches die Schnittstellen nach außen führt, lediglich noch die individuellen Anforderungen umgesetzt werden. Dabei ist auch eine Optimierung für die spezifischen Einbaubedingungen bezüglich Mechanik und Entwärmung einfach durchführbar – Kompromisse wie beim Einsatz vorgefertigter Gesamtsysteme sind somit nicht notwendig. Die Anbindung von PCIe-Kameras kann ohne zusätzliche Adapter realisiert werden, wodurch Signalintegrität und Störfestigkeit optimal sichergestellt werden können.

Beispielhaft dargestellt: Eine Embedded-Vision-Lösung mit zwei ultra-hochauflösenden Highspeed-Kameras, die mit hoher Bandbreite über PCIe x4 direkt an die CPU angebunden sind, lässt sich zusätzlich mit vielen weiteren Kameras ergänzen. Dabei kann es sich auch um eine Mischung aus verschiedenen Standards wie USB3 Vision, GigE Vision und 10 GigE Vision handeln. Die ohnehin schon sehr hohe KI-Leistung, die durch die hoch performante CPU und integrierte Grafikeinheit bereitgestellt wird, lässt sich bei Bedarf über einen zusätzlichen AI-Accelerator noch weiter erhöhen. PCIe x8 Gen4 mit einer Geschwindigkeit von bis zu 128 Gb/s stellt dabei ausreichend Bandbreite zur Verfügung, sodass auch besonders leistungsfähige VPUs (Vision Processing Units) oder TPUs (Tensor Processing Units) zum Einsatz kommen können. Durch die Verwendung der auf dem TQMx110EB bereits als Option verfügbaren NVMe-x4-SSD steht ein besonders schnelles Speichermedium für das Betriebssystem und die Daten zur Verfügung. Alternativ können beispielsweise auch M.2 Speichermodule (NVMe oder SATA) zum Einsatz kommen, die zudem auch unterschiedliche RAID-Konfigurationen unterstützen.

Durch einen modularen Systemaufbau können Bildverarbeitungslösungen also sehr flexibel und kosteneffizient realisiert werden und von neuester Prozessortechnologie profitieren. Mit unterschiedlichen CPU-Derivaten stellt das TQMx110EB von TQ verschiedene Leistungsklassen der neuen, elften Generation an Intel-Core- und Intel-Xeon-Prozessoren zur Verfügung und bietet dabei durchgängig höchste Systemperformance, sodass sich das System auch zukunftssicher immer optimal auf die jeweiligen Gegebenheiten anpassen lässt.

Autor
Harald Maier, Product & Business Management x86
 

Kontakt

TQ-Systems GmbH

Mühlstr. 2, Gut Delling
82229 Seefeld
Deutschland

+49 8153 9308 0
+49 8153 9308 7245

Top Feature

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon

Top Feature

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon