Gesichtserkennung

Gesichtserkennung bezeichnet die Analyse der Ausprägung sichtbarer Merkmale im Bereich des frontalen Kopfes, gegeben durch geometrische Anordnung und Textureigenschaften der Oberfläche.

Begriffsunterscheidung

Es ist zu unterscheiden zwischen der Lokalisation eines Gesichts im Bild und der Zuordnung des Gesichts zu einer bestimmten Person. Im ersten Fall wird geprüft, ob und wo ein Gesicht zu sehen ist, im zweiten, um wen es sich handelt.

Geht es um die Gesichtserkennung im Sinne des Erkennens, um welches Gesicht es sich handelt, dann kann man zwei Fälle unterscheiden: Sollte dies durch Menschen geschehen, wird im englischen Sprachraum von face perception gesprochen, während eine Gesichtserkennung durch Maschinen als face recognition bezeichnet wird. Einige Tierarten können Gesichter bei Tieren der gleichen Art oder auch bei Tieren einer anderen Art, einschließlich Menschen, unterscheiden und in dem Sinn erkennen. Hier werden die Begriffe face perception und face recognition (conspecific/heterospecific) verwendet.

Fähigkeit von Lebewesen, menschliche Gesichter zu erkennen

Die Fähigkeit zur Erkennung und Unterscheidung von Gesichtern (Gesichtswahrnehmung) wird vom menschlichen Gehirn normalerweise innerhalb der ersten Lebensmonate erworben. Sie ist an Funktionen des Großhirns, genauer der Occipitallappen gebunden. Ein teilweises oder völliges Fehlen dieser Fähigkeit heißt Prosopagnosie.

Neugeborene interessieren sich mehr für Gesichter oder Gesichter ähnelnden Objekten als für Anderes. Schon im letzten Drittel der Schwangerschaft öffnen Embryos die Augen und entwickeln Sehsinn. 2017 zeigten Versuche an Ungeborenen in der 34. Schwangerschaftswoche, dass sich diese statistisch signifikant einem auf die Bauchdecke der Mutter projiziertem Lichtmuster zuwenden, wenn dieses das Grundmuster eines Gesichts aufweist.

Technische Gesichtserkennung

In technischem Zusammenhang zählt Gesichtserkennung zu den biometrischen Verfahren. Sie wird sicherheitstechnisch, kriminalistisch und forensisch eingesetzt, zum Zweck der Identifikation oder Verifikation (Authentifizierung) natürlicher Personen. Typischerweise dient die technische, computergestützte Gesichtserkennung zur Zutrittskontrolle zu sicherheitsempfindlichen Bereichen und zur Suche nach Dubletten in Datenbanken, beispielsweise in Melderegistern zur Vermeidung von Identitätsdiebstahl.

Maßgeblich für die Erfassung und digitale Repräsentation von Gesichtsbildern für interoperable Zwecke, insbesondere zur Verwendung in elektronischen Reisepässen und Kriminalistik, ist der internationale Standard ISO/IEC 19794-5. Seine detaillierten Spezifikationen hinsichtlich Bildinhalt und Aufnahmetechnik zielen auf eine hohe Erkennungsqualität.

2D-Verfahren
Simple Gesichtserkennungsverfahren verwenden eine zweidimensionale (2D) geometrische Vermessung besonderer Merkmale (z. B. Augen, Nase, Mund). Hierbei wird deren Position, Abstand und Lage zueinander bestimmt. Heutige Verfahren setzen jedoch meist auf komplexe Berechnungen wie die Waveletanalyse (z. B. mittels Gabor-Transformation) oder Hauptkomponentenanalyse. Das National Institute of Standards and Technology (NIST) hat wiederholt vergleichende Untersuchungen verschiedener kommerzieller und universitärer Verfahren durchgeführt.

Die Ergebnisse zeigen eine deutliche Steigerung der Erkennungsleistung innerhalb von ca. 10 Jahren. Lag die Falschrückweisungsrate bei einer gesetzten Falschakzeptanzrate von 0,1 % im Jahr 1993 noch bei praxisuntauglichen 79 % (d. h. beinahe vier von fünf Personen wurden damals nicht erkannt), so wird diese Fehlerrate heute (Stand Mitte 2006) von den leistungsfähigsten Verfahren auf nur 1 % reduziert (d. h. etwa eine von hundert Personen wird nicht erkannt). Diese Rate liegt in der gleichen Größenordnung wie die aktueller Fingerabdruck- oder Iriserkennungsverfahren und übertrifft die Fähigkeiten der menschlichen Gesichtserkennung.

2001 entwickelten zwei Informatiker die nach ihnen benannte Viola-Jones-Methode zur Gesichtserkennung. Das Verfahren beruht auf maschinellem Lernen, erkennt auch Strukturen anderer Art, etwa Verkehrszeichen für das autonome Fahren. Vergleichbar hierzu ist die Methode Histogram of oriented gradients (HOG), die ebenfalls auf Trainingsdaten beruht.

3D-Verfahren
Neben der zweidimensionalen biometrischen Gesichtserkennung, bei der für die Erfassung handelsübliche Kameras genutzt werden, entwickelte sich ein neuer Zweig, der auf die dreidimensionale (3D) Erfassung (z. B. mittels Streifenprojektion) des Gesichts setzt. Durch die zusätzlichen Informationen sollen höhere Erkennungsgenauigkeit, bessere Posenunabhängigkeit und Überwindungssicherheit erzielt werden. Testergebnisse des NIST zeigen, dass mit Stand Mitte 2006 die 2D-Verfahren hinsichtlich der Erkennungsleistung den 3D-Verfahren noch überlegen waren.

Anwendung

In Deutschland wurde während des Rheinkulturfestivals in Bonn im Herbst 2011 ein Projekt der öffentlich-rechtlichen Rundfunkanstalt WDR gestartet, die eine Gesichtserkennung der Festivalbesucher ermöglicht. Das funktioniert über (hochauflösende) Fotos der Festivalbesucher, die mithilfe der Gesichtserkennung von Facebook „getaggt“ werden. Die Gesichter werden so identifiziert und mit Facebook-Profilen verknüpft.

Die App FindFace produziert von russischen Softwareentwicklern benötigt nur ein Foto von einer Person z. B. aufgenommen auf der Straße, um dann im Internet in sozialen Netzwerken diese Person wiederzufinden (Stand Mai 2016). Das System soll z. B. dafür eingesetzt werden, um Personen, die sich in realen Geschäften z. B. eine Stereoanlage anschauen, diesen dann später gezielte Werbung im Internet zustellen zu können. Aber auch Privatpersonen können Fotos von Unbekannten, die man daten möchte, auf der Straße machen, um später mit der App deren Profile im Internet zu finden und die Person zu kontaktieren.

Moskaus Stadtverwaltung will die Software zukünftig nutzen, um Fotos aus Überwachungskameras mit Fahndungsfotos abzugleichen. Die Sicherheitsfirma Kaspersky hat das System getestet und attestiert dem System eine Erkennungsrate von 90 Prozent. Das System basiert auf FaceN und benutzt Techniken des maschinellen Lernens, um Gesichter zu erkennen. Dabei werden Strukturen analysiert, die sich nicht verändern, wenn man z. B. eine Brille trägt oder Make-up. Im Oktober 2016 wurde bekannt, dass sich 117 Millionen Amerikaner in der Gesichtserkennungsdatenbank des FBI befänden.

Am 1. August 2017 startete am Berliner Bahnhof Südkreuz ein Projekt des Bundesinnenministeriums und der Bahn zur Gesichtserkennung. Dabei sollten mittels dreier Kameras freiwillige Testpersonen erkannt werden, die häufiger den Bahnhof passierten. Die Testpersonen hatten zuvor ihre Namen und je zwei Fotos ihrer Gesichter hinterlegt. 275 Personen hatten sich für das Projekt freiwillig gemeldet. Das Pilotprojekt sollte zunächst für sechs Monate laufen. Datenschützer und Bürgerrechtler reagierten mit teils scharfer Kritik auf den Testlauf. Maja Smoltczyk, die Datenschutzbeauftragte des Landes Berlin, sagte dem Rundfunk Berlin-Brandenburg rbb, dies sei „ein sehr, sehr tiefgreifender Eingriff in Grundrechte, insbesondere in das Recht auf informationelle Selbstbestimmung“, also das verfassungsrechtlich verbriefte Recht, „sich unbeobachtet und anonym in der Öffentlichkeit zu bewegen“.

Während sich dieser erste Testlauf nur mit Gesichtserkennung befassen sollte, war zunächst ein weiterer geplant, mittels dessen laut Bundesinnenministerium softwaregestützt auch hilflose liegende Personen oder verdächtige Gegenstände automatisiert durch die Systeme erkannt und gemeldet werden.

Im August 2017 hatten Forscher der Stanford University eine KI vorgestellt, die anhand von mehr als 35.000 Fotos einer Datingplattform die Gesichtsform, den Gesichtsausdruck und die Art, wie die Person zurechtgemacht war, auslas und den sexuellen Präferenzen der Personen zuordnete. Anschließend ließen sie ihr Programm zufällige Fotos von hetero- und homosexuellen Personen untersuchen und sie einer sexuellen Orientierung zuordnen. Bei Männern lag die KI in 81 % der Fälle richtig, bei Frauen waren es 71 %. Menschliche Schätzer tippten dagegen rund 20 % schlechter. Aktivisten von HRC und GLAAD bezweifelten die Methodik der Studie, man habe lediglich nach Schönheitsstandards sortiert. Die Forscher selbst stellten fest, dass sie auch falsch liegen könnten, wiesen aber auf die Gefahren für die Betroffenen hin, sollte eine solche Technologie missbraucht werden.

Forscher der Universität von Maryland sowie vom Dartmouth College haben eine KI entwickelt, die mit 92-prozentiger Wahrscheinlichkeit an der Stimme und dem Gesichtsausdruck eines Menschen erkennen kann, ob dieser lügt. Die KI wurde mit 104 Videos trainiert, die Personen zeigen, die vor Gericht sowohl die Wahrheit als auch die Unwahrheit sagen. Die KI lernte so, minimale Änderungen im Gesichtsausdruck und der Stimme zu erkennen, um so den Wahrheitsgehalt des Gesagten zu deuten. Das System könne durch bessere Audiodaten und mehr Videomaterial noch stark verbessert werden.

Zu Beginn 2018 wurde bekannt, dass in China bei einem Pilotprojekt am Bahnhof von Zhengzhou die Polizei Sonnenbrillen mit einer Gesichtserkennungs-Software einsetzt. Innerhalb von Sekunden werden so Gesichter mit einer Verbrecherkartei abgeglichen und auf einem mobilen, Tablet-ähnlichen Computer Verdächtige angezeigt. Auf diese Weise wurden bereits sieben Kriminelle festgenommen.

Die chinesische Firma Watrix hat im November 2018 eine KI vorgestellt, die Menschen aus 50 Metern Entfernung aus den Aufnahmen einer Überwachungskamera mit einer Trefferquote von 94 Prozent allein an der Gangart des Menschen identifizieren kann. Somit ist es nicht mehr notwendig, das Gesicht einer Person zu sehen, um die Person zu identifizieren. Die Technik ist bereits in Shanghai und Peking im Einsatz. Die schwedische Firma „Visage Technologies AB“ bietet Software zur Gesichtserkennung als SDK an.

Authentifizierung
Ein erkanntes Gesicht kann als biometrischer Faktor für die Authentifizierung eingesetzt werden. In China wird solche KI-gestützte Gesichtserkennung verstärkt eingesetzt. Viele dieser Anwendungen, die insbesondere im Bank- und Finanzbereich beheimatet sind, basieren auf der Software Face++ von der Firma Megvii. Hierbei handelt es sich um eine auf das Deep Learning – Framework Brain++ aufbauende biometrische Anwendung. Die dahinter stehenden Algorithmen werden mit Hilfe von großen Datensätzen, also sehr vielen Bildern, trainiert. Dieses maschinelle Lernverfahren nutzt ein großes, mehrschichtiges neuronales Netzwerk, das seine Parameter in der Trainingsphase so lange anpasst, bis das Gesicht einer Person zuverlässig erkannt wird. Unter der Bezeichnung Face ID vermarktet Apple eine Gesichtserkennung zur Benutzeridentifikation.

Kritik

Kritiker der Technologie weisen auf die starken Eingriffe in die Privatsphäre hin und warnen vor dem Missbrauch für Massenüberwachung. Als abschreckendes Beispiel für einen Überwachungsstaat verweist die US-Bürgerrechtsorganisation American Civil Liberties Union auf die Volksrepublik China, deren Behörden mit etwa 200 Millionen Überwachungskameras und Gesichtserkennung landesweit Angehörige der muslimischen Minderheit der Uiguren überwachen.

Als erste Stadt weltweit beschloss San Francisco im Mai 2019 seinen Behörden und der Stadtpolizei den Einsatz von Gesichtserkennungstechnologie zu verbieten. Der Stadtrat begründet dies mit dem Schutz der Bürgerrechte. San Francisco als „Tech-Hauptquartier“ hätte hier Verantwortung zu übernehmen und müsse neue Technologien genau regulieren.

Quelle: (https://de.wikipedia.org/wiki/Gesichtserkennung)