Bildverarbeitung

Science Fiction wird Realität

Futuristische Computer-Interaktion durch Stereoskopische Bildverarbeitung

08.12.2009 -

Die Datenverarbeitungsleistung des Computers hat sich seit seiner Erfindung um ­Größenordnungen gesteigert - die Art, wie wir mit diesen Geräten interagieren, hat sich allerdings über diesen Zeitraum hinweg nur wenig verändert. Bildverarbeitungssysteme, die auf der Basis von Stereo-Kameras arbeiten, beginnen dies zu ändern. Es werden futuristische Schnittstellen geschaffen, die weit über das hinaus gehen, was gestern noch Science ­Fiction war.

Fragt man heute einen x-beliebigen Passanten auf der Straße, wie er mit seinem Rechner interagiert, wird er mit großer Wahrscheinlichkeit drei Methoden nennen: Tastatur, Maus, Touch Screen. Maus und Tastatur sind der De-facto-Standard für Eingabegeräte seit der Xerox Alto im Jahr 1972 entwickelt wurde. Und selbst der Touchscreen, der heute in Smartphones und Tablet-PCs allgegenwärtig ist, befindet sich seit Anfang der 1970er Jahre auf dem Markt - Elo TouchSystems kündigte das erste Modell im Jahr 1974 an.
Diese Touch-Control-Systeme sind in der Schwerindustrie und auch im Bereich der Gebäudeautomation sehr beliebt. Hier erweisen sie sich Maus und Tastatur als überlegen bei der intuitiven, schnellen oder genauen Interaktion zwischen Anwender und Bildschirmdarstellung.
Eine ganz neue Art der Kommunikation mit der digitalen Welt wird jetzt aber durch stereoskopische Bildverarbeitungssysteme ermöglicht. Sie sind intuitiver in ihrer Anwendung und erinnern in mancherlei Hinsicht an Science-Fiction-Filme wie den Tom Cruise - Blockbuster Minority Report aus dem Jahr 2002.

Jenseits von Science Fiction
Minority Report hat eine Rechner-Schnittstelle vorausgeahnt, die in der Lage ist Hand- und Fingerbewegungen zu nutzen. Im Film werden Gesten wie Zeigen, Greifen, Öffnen und Wischen so interpretiert, dass damit Darstellungen und Daten auf dem Bildschirm gesteuert und verändert werden. Die Genauigkeit und zunehmende Bandbreite heutiger Bildverarbeitungskameras erlaubt allerdings mehr als nur eine Steuerung durch Finger.
Besonders interessant ist eine in der Schweiz entwickelte Schnittstelle, die durch eine Zusammenarbeit zwischen ­Atracsys und Sony Image Sensing Solutions entstanden ist: die Interactive Communication Unit (ICU). Die ICU basiert auf zwei hochspezifizierten IEEE1394.b-Kameras, die präzise die dreidimensionalen Bewegungen eines Anwenders und sogar dessen Emotionen verfolgen können. Die Kameras sind mit einem Rechner verbunden, der umgehend den Bildinhalt auf dem Monitor entsprechend aktualisiert.
Die ICU verwendet zwei XCD-V60-­Kameras von Sony, die an eine Standard-CPU angeschlossen sind. Das System wird demnächst mit den XCD-SX90-­Kameras modernisiert, die 1/3-Typ-PS-IT-Sensoren enthalten.
Die ICU erkennt selbst feine Unterschiede in Gesichtsausdrücken und macht das Bildverarbeitungssystem damit ideal für den Einsatz im Marketing. Das Alter und Geschlecht eines Anwenders lässt sich feststellen, genauso aber auch Gemütszustände wie Glück, Zorn, Traurigkeit und Überraschung. Dies wird durch die Verfolgung beispielsweise des Hochziehens der Mundwinkel oder des weiten Öffnens der Augen erreicht, beides Merkmale, die mit dem Lächeln einhergehen. Mithilfe von zwei Kameras lässt sich diese Erkennung dreidimensional im Raum durchführen und so wird eine Rechnerschnittstelle ermöglicht, die einen Anwender noch enger mit einer Applikation in Verbindung bringt, sei es für industrielle, Marketing- oder spielbezogene Zwecke.

Tracking-Optionen
Die Ablösung der Maus: Mithilfe eines stereoskopischen Bildverarbeitungssystems ist es möglich, genau zu bestimmen, wohin eine Person deutet oder sogar, was diese Person im Fokus hat. Ein Mauszeiger kann so mit dem Finger oder gar dem Blick bewegt werden und eine zweite Bewegung, wie z. B. ein Lächeln oder Nicken, simuliert den „Maus-Klick".
Beim derzeitigen Einsatz zu Marketing-Zwecken greift das System so z. B. auf Internet-Inhalte zu, um zusätzliche Produkt- oder Service-Informationen abzurufen. Eine Person blickt z. B. auf eine Uhr oder ein anderes Gerät in einem Schaufenster und erhält allein dadurch Zugriff auf eine Webseite mit weiteren relevanten Informationen zum betrachteten Gegenstand.
Ähnlich der Multi-Touch-Fähigkeit bei Touch Screens können auch Bildverarbeitungssysteme verschiedenartige Gesten interpretieren, z. B. kreisförmige Menüs, bei denen der Cursor durch Kopfbewegungen (links/rechts oder aufwärts/abwärts) gesteuert wird.
Korrekte Positionierung: Ob Schaufenster oder industrielle Anwendung - der Betrachter ist selten in der optimalen Position, um dargestellte Inhalte gut zu sehen oder mit ihnen zu interagieren. Stereosehen aber ermöglicht es dem Rechner die Position des Anwenders präzise zu berechnen. Mithilfe dieser Information ist es möglich, die dargestellte Information über 3D-Rendering-Effekte anzupassen, um so eine für den Nutzer optimale Darstellung zu erzielen.
Stimmungssteuerung: Durch die Erkennung kleinster Regungen im Gesicht der beobachteten Person kann die ICU das Verhalten dieser Person interpretieren. Da laut Atracsys Marketing-Anwendungen für diese Technologie ein vielversprechender Markt sind, ist diese Empfindlichkeit in der Bewegungserkennung entscheidend für den zukünftigen Erfolg. Inhalte lassen sich dann nicht nur demografischen Gesichtspunkten, sondern auch je nach Gemütszustand des Betrachters genau anpassen.
Spiele: Durch die Bewegung des gesamten Körpers können Anwender mit Spieleinhalten einfach und unmittelbar interagieren. Mithilfe einfacher Algorithmen, die in der CPU ablaufen und für jede Anwendung abgestimmt sind, lassen sich mit Avataren lebensechte Aktionen nachahmen. So kann z. B. Space Invader, ein Klassiker der Arcade-Spiele aus den 1970er-Jahren, über die Rechts- und Linksbewegungen eines Spielers gesteuert werden, womit das Raumschiff dementsprechend manövriert wird. Neben Spielen und Marketing-Anwendungen bietet diese Art der Interaktion auch im Industriebereich zahlreiche Vorteile. Dort ließen sich z. B. Roboterarme mithilfe einfacher Hand- oder Armbewegungen fernsteuern.

Zukünftige Anwendungen
Eine Verbesserung der Rechnerschnittstellen, intuitiver und den Anwender mehr einbeziehend, ist essentiell. Neben den kommerziellen Anwendungen könnten Schnittstellen auf der Basis von Bildverarbeitungssystemen auch in der Medizintechnik eine wichtige Rolle spielen. In einem Operationssaal könnte der Chirurg damit Daten abrufen, ohne dabei eine Computer-Maus oder eine Tastatur berühren zu müssen - und somit sterile Bedingungen einhalten.
Stereoskopische Bildverarbeitungssysteme bringen die größte Veränderung im Bereich der Computer-Interaktion seit der Erfindung der Maus und Tastatur Anfang der 1970er Jahre. Die Technik hinter der ICU lässt sich für nahezu alle Zwecke verwenden und an beliebige Applikations-Anforderungen anpassen. Einschränkungen ergeben sich nur durch die Fülle der denkbaren Inhalte sowie durch Platzbeschränkungen, die eine Multi-User-Nutzung verkomplizieren könnten.
Der Film „Minority Report" hat der Welt das Konzept vorgestellt. Es hat weniger als sieben Jahre gedauert, von dort aus die Technologie zu entwickeln und aus Science Fiction Realität werden zu lassen.

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon

Spannende Artikel zu Fokus-Themen finden Sie in unseren E-Specials. Lesen Sie jetzt die bisher erschienenen Ausgaben.

Zu den E-Specials

Media Kit

Die Mediadaten 2025 sind jetzt verfügbar! Laden Sie sie hier herunter.

Industrie-Lexikon

Begriffe aus der Bildverarbeitung und Automation, die man kennen sollte

Zum Lexikon