Active Silicon’s KI-Reihe – Teil 3: Weniger Programmierung und schneller zur Bildverarbeitungslösung dank CNNs

  • Published Oktober 2017

Es ist eines der ehrgeizigsten Ziele der automatischen Bildverarbeitung, Maschinen das Sehen und Verstehen von Bildern beizubringen, so wie es für uns Menschen selbstverständlich ist. In vielerlei Hinsicht übertreffen Bildverarbeitungssysteme die menschliche Leistungsfähigkeit, speziell dort, wo eine Aufgabe mit einer überschaubaren Anzahl von Regeln und logischen Verknüpfungen beschrieben werden kann. Dies ist z.B. bei der Inspektion von geometrischen Abmessungen und Toleranzen gefertigter Teile oder bei der Überprüfung der Farbe und Ebenmäßigkeit von Oberflächen der Fall.

Jedoch erfordern die benötigten Algorithmen großen Aufwand und ein hohes Maß an Expertise bei der Programmierung. Zudem mangelt es ihnen an Abstraktionsvermögen sobald die auftretende Varianz der Form und/oder Textur über ein bestimmtes Maß hinausgeht. Genau hier kann künstliche Intelligenz völlig neue Möglichkeiten eröffnen.

Heutzutage können Kameras Bilder mit weitaus höheren Bildraten aufnehmen als das menschliche Auge, ohne dass bei ihnen die Konzentration nachlässt. Bei der geometrischen Messung und 3D-Analyse sind Bildverarbeitungssysteme bereits genauer und weitaus schneller als Menschen. Jedoch gab es erst vor kurzem entscheidende Durchbrüche in der Bildverarbeitungsforschung: Bislang war es meist notwendig, hunderte bis tausende von Filter- und Wavelet-Merkmalen aus der Pixelmatrix der Bilder zu extrahieren, von denen die Merkmale, mit dem höchsten Informationsgehalt, bestimmt und einem manuell konfigurierten oder statistische trainierten Klassifikator übergeben wurden. Dies war enorm zeitaufwändig und erforderte große Expertise.

Daher waren es vor allem zwei Faktoren, welche die weltweite Anwendung von Machine-Vision-Techniken bremsten: Erstens der Mangel an ausreichend schnellen, robusten und wenig rechenintensiven Algorithmen zur Merkmalsextraktion aus Bildern und zur Klassifikation; zweitens und am wesentlichsten, der Mangel and Bildverarbeitungsentwicklern, die in der Lage sind, Lösungen für neue sowie bereits bekannte Machine-Vision-Anwendungen mit existierenden Algorithmen zu implementieren.

Wie CNNs die Bildverarbeitung unterstützen können
Beide Hemmschuhe können maschinelle Lernverfahren beseitigen. Mit der Erfindung der sogenannten Convolutional Neural Networks (CNNs), zu Deutsch „faltendes neuronales Netzwerk“, wurde eine ausgefeilte Merkmalsextraktion überflüssig. Vielmehr lernt das künstliche neuronale Netz autonom, wie es Bilder analysieren muss, um das gewünschte Ergebnis zu erhalten. CNNs gehören zur Familie der sog. Deep Neural Networks und zeichnen sich durch ihre spezielle Architektur aus. Das Verfahren ist allgemein auch unter dem Begriff Deep Learning zur Zeit in aller Munde.

Das mathematische Modell hinter diesen mehrschichtigen künstlichen neuronalen Netzen ist angelehnt an das menschliche Gehirn. Stark vereinfacht dargestellt erfolgt die Bildanalyse und Klassifikation bei Neuronalen Netzen folgendermaßen: Rezeptor-Neuronen der ersten Netzwerkebene nehmen die Grauwert- oder RGB-Pixelwerte auf. Diese Neuronen sind verbunden mit mehreren Neuronen auf der zweiten Schicht und diese wiederum mit Neuronen auf der jeweils folgenden Schicht usw.. Schließlich enden die Verbindungen auf Neuronen der Ausgabe-Schicht. In jeder dieser Millionen von Verbindungen zwischen zwei Neuronen wird das Signal mit einem Gewichtungsfaktor entweder verstärkt oder gedämpft. In der Lernphase solch eines Netzwerks versucht der Lernalgorithmus die Erkennungsrate über drei Stellschrauben zu maximieren: die Anzahl der Schichten, die Anzahl an Neuronen pro Schicht und die Gewichtungsfaktoren in jeder Verbindung.

Dank dieses leistungsfähigen Ansatz für maschinelles Lernen müssen Systementwickler heute nur noch ein CNN mit passenden Beispielbildern trainieren, z.B. von Gut- und Schlechtteilen in der Qualitätsinspektion, von Hautkrebs-Melanomen oder von Fischläusen. Schnell lässt sich der Algorithmus trainieren und testen so dass er nach kurzer Zeit im realen Betrieb eingesetzt werden kann. Diese Technik beschleunigt die Einführung von Machine Vision in zahlreichen Anwendungen, ermöglicht Lösungen für bislang unlösbare Probleme und reduziert die Kosten.

Was können wir tun?
Wir bei Active Silicon unterstützen den Fortschritt der künstlichen Intelligenz in der Bildverarbeitung, da unsere Ingenieure sicherstellen, dass unsere eingebetteten Systeme für Deep-Learning-Anwendungen geeignet sind. Wir stehen bereit, wenn komplexe Systeme für Industrie, Medizintechnik, Wissenschaft, Verkehr oder Sicherheitstechnik mittels künstlicher Intelligenz in großem Stil umgesetzt werden sollen.

Möchten Sie gern wissen, ob sich Ihre Bildverarbeitungsanwendung mit Künstlicher Intelligenz lösen lässt? Dann kontaktieren Sie uns bitte und lassen Sie es uns gemeinsam herausfinden!

Folgen Sie auch einfach unserem Blog und unseren Kanälen auf den sozialen Medien. So bleiben Sie stets auf dem Laufenden zu den aktuellen Entwicklungen!