Mittels KI-gestützer Videoüberwachung denkt promiseQ die Sicherheitsbranche neu
Ein Schatten, ein Tier, das sich bewegt oder Regen – wer zur Absicherung seiner Gebäude oder Unternehmen auf Videoüberwachung setzt, sieht sich oft Falschalarmen ausgesetzt. Die Flut an Videodaten, die diese Systeme generieren, stellen die Sicherheitsmitarbeitenden vor eine große Herausforderung. Alarme werden ungefiltert an die Notrufleitstellen geschickt, dort müssen sie dann von Personen verifiziert werden. Die Quote ist hoch: über 98% der ausgelösten Alarme sind harmlos. Aber sie kosten Zeit, Geld und Ressourcen. Im ungünstigsten Fall führen sie nicht nur zu unnötigen Einsätzen – sie können auch von echten Bedrohungen ablenken. Haben die Mitarbeitenden bereits 99 mal eine Katze weggeklickt, machen sie es beim 100. Mal auch – nur dass es sich in diesem Fall um den Ernstfall handelt.
Das MediaTech Hub Startup promiseQ hat sich zum Ziel gesetzt, dieses Problem mit Hilfe von künstlicher Intelligenz (KI) zu lösen. Die KI-basierte Plattform von promiseQ analysiert Videodaten in Echtzeit und filtert Falschalarme automatisch heraus. So können sich die Sicherheitsmitarbeitenden auf das Wesentliche konzentrieren und echte Bedrohungen schneller erkennen und reagieren.
Die KI-Plattform von promiseQ basiert auf einem Deep-Learning-Algorithmus, der mit Millionen von Videodaten trainiert wurde. Der Algorithmus ist in der Lage, verschiedene Muster und Objekte in Videos zu erkennen und so zwischen echten Alarmen und Falschalarmen zu unterscheiden. Echte Alarme werden weitergeleitet, die anderen herausgefiltert. Aber nicht nur das. Gründer Tolga Ermis erklärt: „Wir haben um den KI-Filter herum eine ganzheitliche Plattform entwickelt, eine Video-Intelligenz-Plattform. Darüber kann man sich live auf Kameras zuschalten, Kunden- und Objektmanagement machen, tote Winkel oder unscharfe Einstellungen identifizieren und verändern. Sollte jemand die Kamera verdrehen, bemalen oder verkleben, lässt sich das außerdem anhand von hinterlegten Referenzbildern schnell feststellen.“
Kamerasysteme werden mit externer KI-Hardware trainiert
Gemeinsam mit seinem Partner Elias Kardel haben beide bereits bei Automobilherstellern an Projekten zum autonomen Fahren gearbeitet und sich dabei mit Themen wie Crowdsourcing für das Training von KI oder kamerabasierter Spurhaltung für fahrende Autos beschäftigt. Mit der Idee, KI und Crowdsourcing – also die Beteiligung von Menschen – zu kombinieren, starteten sie gemeinsam promiseQ. Mittlerweile besteht das Team aus über 30 Mitarbeitenden, die die Idee stetig weiterentwickeln. Der Human-Review-Faktor, also der Gegencheck zwischen KI und Crowdsourcing, steht mittlerweile nicht mehr im Fokus, wird aber als Premiummodell für den KI-Falschalarmfilter mitangeboten.
Gerade haben sie mit dem promiseQube ein neues Produkt gelauncht. Der promiseQube bringt Echtzeit-Hardware in einer Box und ermöglicht es, die Sicherheitssysteme um umfangreiche KI-Features vor Ort zu ergänzen. „Wir können jede beliebige ‚dumme Kamera‘ mit der Box ultrasmart machen“, so Tolga Ermis. Der Qube erkennt die verschiedenen Objektklassen – momentan beispielsweise Personen und sich bewegende Fahrzeuge. Mit dem Zero-Shot-Modell, das im Machine-Learning genutzt wird, wird intern getestet, wie zukünftig eine Vielfalt von Objektklassen bestimmt werden kann. Je nach Vorgabe etwa “weiße Sneaker”, “Menschen mit Maske”, “Menschen mit blauen Pullovern”, “Menschen mit Helmen” – oder auch eindeutig kritische Objekte wie Feuer oder Messer an Personen.
Die leistungsstarke Hardware ermöglicht Sicherheitsunterhemen so eine noch nie dagewesene Flexibilität. Bisher war man dort auf Kamerahersteller angewiesen, die die Alarmdefinition vorgaben. Wollte man darüber Objektklassen wie Feuer oder Fahrzeuge mit bestimmten Kennzeichen herausfiltern, war man auf die Angebote der Hersteller und deren Training der Kameras über traditionelle neuronale Netzwerke angewiesen. Tolga Ermis macht deutlich: „Solche traditionellen neuronalen Netzwerke sind wie Kleinkinder, denen man alles tausend Mal zeigen muss. Beispielsweise: Hier ist ein Bild von einem Messer, hier eines von einem Messer in der Dunkelheit, hier eines von einer Gabel, hier ein Messer aus dem Seitenwinkel. Es braucht umfangreiche Datenmengen, damit die Kamera auf die entsprechende Situation reagieren kann.“
Ein Game-Changer, nicht nur für die Sicherheitsindustrie
Aktuell wird das Zero-Shot-Modell auf den promiseQube geupdatet – vortrainiert mit dem frei verfügbaren Wissen des gesamten Internets. Statt mit einem Kleinkind sei er mit einem Universitätsabsolventen zu vergleichen, so der Tolga Ermis. Der Qube kann Kameras mit dem Kontext beliefern und weiß, wie die gesuchten Objekte in hunderten Varianten aussehen. Die Vorgaben an ihn werden mit natürlicher Sprache vorgegeben: „Bitte erkenne Personen in blauen Pullovern.“
Das Team von promiseQ arbeitet auch daran, dass darüber zukünftig Türen, Lautsprecher, Schlösser oder Nebelmaschinen angesteuert und ausgelöst werden können. „Den promiseQube könnte man wie Alexa von Amazon beschreiben, aber mit Zähnen und Krallen“, so Ermis.
Solche flexiblen Kamera-Vorgaben, die dank des Zero-Shot-Maschinenlernens möglich sind, möchte promiseQ perspektivisch auch anderen Branchen zur Verfügung stellen. Der Einzelhandelsbereich wäre ein logischer Partner. In welchen Gängen sind die meisten Personen unterwegs? Wie ist deren Demografie? Via KI-gestützter Videoüberwachung ließe sich das schnell analysieren und etwa Lagerbestände automatisch durchgehen. Momentan konzentriert sich das Startup aber darauf, die Sicherheitsbranche zu revolutionieren. Die Nachfrage nach den ersten promiseQubes ist so groß, dass nun eine Warteliste für den nächsten Produktionsrun, der im Frühsommer geplant ist, besteht.