Neue Imaging-Welt - Wie die Bilder denken lernen

Imaging-Industrie ist mit Artificial Intelligence ein Motor für die Zukunft

Imaging Industrie
Die Imaging Industrie ist ein wesentlicher Taktgeber für viele Zukunftsszenarien

Selbstfahrende Autos, automatisch nachbestellende Kühlschränke, Service-Roboter, die Drinks an den Platz bringen, Türen die sich mit Fingerabdruck öffnen, sich selbst sortierende digitale Bildarchive – die Zukunft verspricht komfortabel und spannend zu werden. „Wenig präsent ist, dass für all diese Szenarien die Imaging-Industrie mit ihren neuartigen Technologien der Bilderfassung und -verarbeitung der wesentliche Taktgeber ist“, kommentiert Christian Müller-Rieker vom Photoindustrie-Verband (PIV), die aktuellen Innovationstrends. Immer sind es Kameras – oder verwandte Geräte aus dem Imaging Ökosystem – und häufig KI-gestützte nachgelagerte Bildauswertungstools, die das alles überhaupt erst ermöglichen. Um künftig in allen Lebensbereichen ein Höchstmaß an Effizienz, Qualität, Nachhaltigkeit und Sicherheit gewährleisten zu können, ist der Bedarf an sehenden und interpretierenden Systemen grenzenlos.

Bisher: Automatisierte Bildverarbeitung

Bisher stand vor allem die automatisierte Bildverarbeitung im Fokus, die es zum Beispiel im Bereich Smart City möglich macht, Parklücken ebenso zu erkennen wie bei Smart Home etwa die fehlende Milch im Kühlschrank und sogar die Oberflächengüte von Werkstücken in der industriellen Fertigung. Bildverarbeitung ist die Schlüsseltechnologie auch für Industrie 4.0. Mit solchen Basis-Technologien werden heute schon wiederkehrende gleichförmige Aufgaben gut bewältigt. Flexibel und schnell reagieren wie ein Mensch können diese Bildverarbeitungs-Systeme jedoch nicht. Auch für komplexere Szenarien, wie etwa der Erkennung von gesuchten Personen auf Fotos von Überwachungskameras, bedarf es intelligenter Systeme, die zuvor mit einer Flut an Informationen gespeist wurden.

Intelligente, selbstlernende Systeme führen auf das nächste Level

selbstfahrendes Auto
© Daimler
Damit selbstfahrende Autos keine Vision bleiben, sind Kameras und komplexe Bildverarbeitung ein wichtiger Baustein

Unter „intelligent“ und damit künstlicher Intelligenz (KI oder englisch „AI“ für artifical intelligence) versteht man vor allem selbstlernende Systeme. Während man früher etwa fest einprogrammieren musste, wie ein Programm zum Beispiel Gesichter erkennt, ist Software heute so flexibel, dass sie sich das selbst erarbeitet. Als Basistechnologie werden dazu sogenannte „Neuronale Netze“ verwendet. Sie sind vielfältig wie ein Schweizer Taschenmesser und haben nicht nur die Bild- sondern auch die Spracherkennung auf eine ganz neue Ebene gehoben. Vereinfacht gesagt erkennen neuronale Netze in einem Lernprozess – ähnlich wie der Mensch – anhand von Versuch und Irrtum, welche Operationen sie ausführen müssen, um zum gewünschten Ergebnis zu kommen. Werden mehrere Schichten von neuronalen Netzen in Kombination eingesetzt, verbessern sich die Ergebnisse deutlich. Man spricht dann vom „deep learning“.

Damit neuronale Netze zum gewünschten Ergebnis kommen, hilft Feedback über die Richtigkeit ihrer Zwischenergebnisse sowie eine große Menge an Daten. Idealerweise werden neuronale Netze zum Start daher mit bereits von Menschen bewerteten Daten gefüttert, z.B. manuell verschlagwortete Bilder. Je mehr sie davon haben, desto einfacher und besser können sie Muster erkennen und desto zuverlässiger werden die Endergebnisse. Und das Beste: Im Lauf der Zeit werden sie immer besser, denn sie lernen ständig dazu.

In der Praxis: Vielfältige Einsatzmöglichkeiten

Der deutsche Stockfotografie-Anbieter EyeEm hat sich z.B. seinen großen Datenbestand zu Nutze gemacht und eine Anwendung auf Basis künstlicher Intelligenz entwickelt, die automatisch Schlagworte für Aufnahmen vorschlägt. Mittlerweile ist die automatische Erkennung von Szenen bei den großen KI-Anbietern im Bildverarbeitungsbereich Google, Apple und Microsoft Standard. So können zielsicher zum Beispiel nur Aufnahmen von einem Business-Meeting ebenso in einem großen Bildbestand gefunden werden wie solche einer Strandparty – ganz ohne, dass Menschen sie vorher katalogisieren müssen.

Ein wesentlicher Bereich von KI-Technologien ist die Gesichts-Wiedererkennung. Bildverwaltungsprogramme können so auf Basis der bereits eingelesenen Fotos automatisch zusammengestellte Sammlungen mit Aufnahmen bestimmter Personen anbieten. Microsoft geht sogar so weit, dass man versucht, Emotionen automatisch zu erkennen. So könnte es etwa möglich werden, zum 18. Geburtstag zielsicher ein Babyfoto mit trotzigem Gesichtsausdruck für ein Erinnerungs-Fotobuch zu finden.

Der Nutzen für Konsumenten

Roboter © Werner Pluta
© Werner Pluta
Damit Roboter sich in Zukunft zu uns gesellen können, benötigen sie Systeme zur Bilderfassung und –verarbeitung, um sich orientieren zu können.

Für die Endanwender bedeutet all dies ein Plus an Komfort: Zeitintensive, eher langweilige Aufgaben wie das Verschlagworten werden ihnen abgenommen und sie können schneller mehr aus ihren Bildern machen. Die Einsatzmöglichkeiten gehen aber weit über den heimischen Computer und die eigenen Erinnerungsfotos hinaus. So werden etwa Supermärkte möglich, die komplette Selbstbedienung ganz ohne Kasse erlauben, weil sie erkennen, wo der Besucher gerade ist und was er in den Warenkorb gelegt hat. Zukunftsmusik? Mitnichten: Amazon hat kürzlich mit dem Go-Store in Seattle einen Prototypen eröffnet. Auch für Service-Roboter, die zum Beispiel in der Pflege unterstützen könnten, sind solche Technologien wichtig, denn sie sollen den richtigen Patienten selbständig erkennen und anhand der Mimik ablesen können, ob er zufrieden ist.

Ausblick in die Zukunft: Quantensprünge mit Quantencomputern

Eine Bremse für den Einsatz von KI-Technologien ist derzeit noch, dass sie vergleichsweise viel Rechenleistung verschlingen und für viele Einsatzgebiete noch zu langsam sind. Experten erhoffen sich von der Entwicklung von Quantencomputern, die deutlich leistungsfähiger sind als die heutigen Rechner, auch einen Quantensprung für die künstliche Intelligenz.

photokina 2018

Künstlicher Intelligenz (KI) als Tool und Lösung im Zusammenhang mit dem Imaging Ökosystem wird ein zentrales Trendthemen der photokina 2018 sein, die vom 26. bis 29. September 2018 in Köln ihre Tore öffnet. Man darf also gespannt darauf sein, was die Unternehmen auf der Imaging-Weltleitmesse zeigen werden.