Im Schlamm ruht sich ein großes Nilpferd aus
Virtuelle Videosafaris für blinde und sehbehinderte Personen
Oliver Bendel und Doris Jovic

Inclusive AI ist ein junges Forschungsfeld und zugleich ein Anwendungsgebiet, wo KI-Systeme aller Art verwendet werden, um behinderte und beeinträchtigte Personen zu unterstützen und ihnen Teilhabe zu ermöglichen. Dabei spielt u.a. generative KI eine Rolle, etwa in Form von Multimodal Large Language Models (MLLM). Diese sind auch in die Animal-Computer Interaction eingezogen, etwa innerhalb von Apps, die Verhaltenstipps für Benutzer geben, die auf Tiere treffen. Im VISUAL-Projekt an der Hochschule für Wirtschaft FHNW wurden beide Disziplinen kombiniert, um neues Potenzial zu erschließen.
Der Prototyp erlaubt es blinden und sehbehinderten Personen, auf virtuelle Videosafaris zu gehen. Es werden öffentlich verfügbare Wildtier-Webcams integriert und die Live-Bilder mit Hilfe eines MLLM analysiert und evaluiert. Für unterschiedliche Bedürfnisse sind unterschiedliche Profile und Modes verfügbar. Ein Text-to-Speech-System vermittelt die Beschreibungen und Erklärungen. Der Prototyp zeigt die technische Machbarkeit und das Potenzial für Inclusive AI und ACI. Es gilt allerdings auch Einschränkungen zu berücksichtigen, etwa mit Blick auf kommerzielle MLLMs und punktuell unzutreffende Beschreibungen, und es muss weitere Forschung und Entwicklung stattfinden, um das Erlebnis wirklich inklusiv und autonom zu machen.
Weiterlesen mit Login
Noch nicht registriert?
Registrieren Sie sich jetzt kostenfrei und Sie erhalten vollen Zugriff auf alle exklusiven Beiträge. Mit unserem Newsletter senden wir Ihnen Top-Meldungen aus der Automatisierung, Bildverarbeitung und Licht- und Lasertechnik im Industrieumfeld. Außerdem erhalten Sie regelmässig Zugriff auf unsere aktuellen E-Paper.
RegistrierenMeist gelesen

Echtzeit-Analyse mit KI-gesteuerten Hyperspektralkameras
Hyperspektrale Bildgebung gilt als Schlüsseltechnologie in Einsatzgebieten, in denen neben der visuellen Erscheinung auch die Materialzusammensetzung von Objekten eine Rolle spielt.

Warum Logistik über die Wettbewerbsfähigkeit entscheidet
Digitalisierung, Nachhaltigkeit und Resilienz müssen gleichzeitig gelingen – in einer Zeit, in der Kosten steigen und Ressourcen knapp sind. Logistik entscheidet damit über Tempo, Stabilität und Wettbewerbsfähigkeit.

Humanoide Roboter erreichen den Mittelstand
Sinkende Kosten, schnelle Einsatzbereitschaft und steigende Flexibilität eröffnen neue Anwendungen jenseits klassischer Insellösungen.

Antriebe für Tiefsee und Weltall
Lösungen für herausfordernde Einsatzbedingungen wie in der Tiefsee oder im Weltall verlangen kundenspezifische Antriebslösungen, die im Co-Engineering entwickelt werden.

Es muss nicht immer ein humanoider Roboter sein
Mythomorphes Design eröffnet der sozialen Robotik eine eigene Perspektive. Als Vorbilder dienen Mythen und Fantasiewesen statt Mensch oder Tier. Der Beitrag ordnet Beispiele ein und diskutiert Chancen sowie Risiken.







