AI Unplugged #6: Wie Computer Bilder und Videos erkennen

29. August 2019 Podcasts 0
AI Unplugged #6: Wie Computer Bilder und Videos erkennen

Bei seinem KI-Podcast „AI unplugged“ spricht KI-Experte und Solvemate-Gründer Erik Pfannmöller regelmäßig mit Experten und Unternehmern über innovative Themen, Gründungen und Trends aus dem Bereich Künstliche Intelligenz und maschinelles Lernen. Mit Sebastian Gerke ist in dieser Folge ein Experte für Bilderkennung zu Gast. Er verrät uns außerdem, welcher Schatz in deutschen Archiven schlummert.

  • Computer Vision

    Bilderkennung ist Teil unseres Lebens geworden: beispielsweise wenn eine APP unsere Gesichter erkennt, um darauf Nasen von Katzen oder Hunden zu setzten. Bilderkennung ist weit mehr als ein Fun Faktor auf unseren Mobiltelefonen. Computer Vision wird beispielsweise eingesetzt, um Tumore auf MRT-Bildern zu erkennen.

    Wie sehen Computer Bilder?

    Um zu verstehen, wie Bilderkennung funktioniert, ist es notwendig zu verstehen, wie Bilder aufgebaut sind: sie bestehen aus vielen Einzelpunkten, den Pixeln. Die Pixel wiederum beschreiben einen Farbwert aus den drei Komponenten Rot, Grün und Blau – daraus ergibt sich der RGB-Wert.

    Aufgabe des Computers ist es nun, aus diesen kleinteiligen Inforationen höherwertige Informationen zusammenzusetzen. Am Ende dieser höherwertigen Informationen steht dann das Label, etwa Nase, Augen oder sogar Katze. Dieses Label wird vorher festgelegt. Doch wie kommt der Computer zur Nase?

    Wie funktioniert Bilderkennung?

    Der Computer schaut sich nicht mehr nur einen Pixel an, sondern auch die Nachbarschaft. “Wo liegen Kanten, wo liegen Ecken und wie sehen die Übergänge aus?” – sind klassische Klassifikationsmerkmale, auch Low Level Feature genannt. Das erledigen neuronale Netze, die aus Schichten bestehen. Ein neuronales Netz analysiert Schicht für Schicht das Bild, bis sich aus diesen Low-Level-Features die charakterische Pixelzusammensetzung einer Nase ergeben. Eine Stufe höher liegt die Objekterkennung, der ein ähnliches Prinzip zugrunde liegt.

    Bei der Objekterkennung kommt es aber oft darauf an, einen ganzen Satz von Bildern zu analysieren, beispielsweise, um alle Bilder zusammenzufassen, auf denen Berge zu sehen sind. Hier kommt oft Supervised Learing zum Einsatz. Hierzu wird ein Algorithmus mit Trainingsbildern gefüttert, die mit dem Label “Berge” versehen sind. Der Algorithmus sucht in den Bildern nach wiederkehrenden Mustern und überträgt diese auf unbekannte Bilder. Dabei muss er unterstützt werden, wie wir in der letzten Folge unserer AI Podcast erklärt haben (Link).

    Bilderkennung kann in einer höheren Stufe in Bildverstehen münden: Der Computer erkennt die Objekte, verbindet diese zu einer Szene und kann diese beschreiben. Das ist beispielsweise in der Robotik notwendig, wenn ein Roboter innerhalb einer Szene ein Objekt greifen soll. Eine andere praktische Anwendung ist die Beschreibung einer Szene für Blinde. Damit haben wir schon zwei Anwendungsbeispiele für Bilderkennung genannt. Ein anderes Beispiel aus der Praxis ist die Videoanalyse.

    Videoanalyse – wie Bilderkennung Archivschätze hebt

    Das Problem: in deutschen Medienarchiven finden sich hunderte Stunden Sportaufnahmen. Die sind zwar verschlagwortet und archiviert, oft jedoch nur mit Ereignis, Aufnahmedatum und einer kurzen Inhaltsbeschreibung. Mit der Bilderkennung werden die alten Aufnahmen digitalisiert, wobei ein Algorithmus darauf trainiert wird, bestimmte Sportler oder Szenen wie Elfmeterschießen zu erkennen.

    Jetzt analysiert das neuronale Netz diese Aufnahmen und ermöglicht so eine genauere Suche. So hebt der Computer vielleicht sogar einige Archivschätze.

  • Darum solltest Du reinhören

    Dieser Podcast gibt Dir einen guten Überblick zu Bilderkennung. Du verstehst…

    • …was Bildbearbeitung und -erkennung unterscheidet
    • …wie Computer Bilder erkennen
    • …wie Image Recognition bei Bildern und Videos funktioniert
    • …wo Fotoerkennung zum Einsatz kommt
    • …wie Tracking in Videos funktioniert
    • …weshalb die Bilderfahndung im öffentlichen Raum gar nicht so einfach ist
    • …welche Rolle neuronale Netze bei der Bilderkennung spielen

    Last, but not least: Nach dieser Folge weißt Du, ob Computer ein Gefühl für Schönheit haben.

  • Darüber sprechen wir mit Sebastian Gerke

    Im “AI unplugged”-Podcast werden diese Themen rund um Künstliche Intelligenz behandelt (Links führen zum Track):

      • ab: 00:00 | Vorstellung und Einführung ins Thema
      • ab: 04:09 | Wie nehmen Computer Bilder wahr?
      • ab: 07:57 | Deep Dive: Bilderkennung
      • ab: 17:29 | So funktioniert Bilderkennung im Video
      • ab: 21:57 | Was unterscheidet Computer Vision von Bildbearbeitung?
      • ab: 24:37 | Welche Gefahr geht von Deep Fake Videos aus?
      • ab: 28:31 | Check: Image Recognition in der Praxis
      • BONUS (nur Patreon-Nutzer) | Algorithmen vor Gericht
      • BONUS (nur Patreon-Nutzer) | Wenn Computer wissen, was schön ist  

    Hä? Bonus? – ganz einfach, wenn du Unterstützer von digital kompakt auf Patreon wirst, hast du die Möglichkeit, extralange Podcasts ohne Werbung von uns zu bekommen 😍.

Dauer: Minuten

Abonnieren:

Die Podcasts von digital kompakt können auf Podigee verfolgt, per RSS-Feed abonniert oder bei iTunes und Spotify abgespielt werden – so können Sie unsere Podcasts ganz bequem via Smartphone in Podcast-Apps abonnieren und hören.

Bildmaterial: digital kompakt


Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.