Wer hört mit?

Lauschende Lautsprecher

Jedes Jahr werden weltweit über 100 Millionen intelligente Lautsprecher verkauft. In Deutschland stand 2021 bereits in 33% der Haushalte mindestens ein „Smart Speaker“.

Im Alltag sind die digitalen Butler und Hausdamen äußerst praktisch. Die eingebauten Mikrofone lauschen jedoch ständig auf das Signalwort, damit sie die Sprachbefehle nicht verpassen. Erst dann, so die Hersteller, zeichnen die Lautsprecher das Gehörte auch auf. In der Praxis kommt es jedoch oft zu unerlaubten Fehlaufzeichnungen, die dann auf den Servern der Technologie-Unternehmen landen.

Der Sprachfilter „Alias“ soll genau das verhindern. Wie das funktioniert, erfahren Sie hier.

Sprachfilter Alias neben Google Home 2
Sprachfilter „Alias“ für den intelligenten Lautsprecher „Google Home“, Tore Knudsen u. Frank Gnegel, 2020. MPST, Foto: Bert Bostelmann

Das Objekt: Ein nützlicher Schädling

Wie funktioniert der Sprachfilter?

Warum ein Sprachfilter?

Das Objekt: Ein nützlicher Schädling

Der dänische Interaktion-Designer Tore Knudsen beschäftigt sich in seinen Produkten mit der Schnittstelle zwischen virtuellen und realen Räumen. Ein großes Thema ist dabei der Kontrollverslust des Menschen durch technische Geräte, wie beispielsweise die daueraktiven Smart Speaker. Der Sprachfilter Alias manipuliert die Lautsprecher von Amazon und Google und gibt den Nutzenden so die Kontrolle über das Aufnahmeverhalten ihrer Sprachassistenten zurück.

Das Design des Sprachfilters spiegelt seine Funktion. Poren strukturieren das Gehäuse, das sich wie eine zähflüssige Biomasse über den Google-Lautsprecher legt. Pilze und Viren, die Organismen befallen, um sie zu ihrem eigenen Vorteil nutzen, inspirierten Tore Knudsen zu dieser Formsprache. Wie ein Parasit, erklärt der Designer, befällt der Sprachfilter den Smart Speaker und manipuliert sein Verhalten durch Störgeräusche, personalisierte Signalwörter und gezielter Desinformation.

MPST, Foto: Bert Bostelmann
MPST, Foto: Bert Bostelmann
MSPT, Foto: Bert Bostelmann

Wie funktioniert der Sprachfilter?

Im Gehäuse des Sprachfilters sind zwei Lautsprecher und ein Mikrofon verbaut, die von einem Raspberry Pi – einem Einplatinencomputer – gesteuert werden. Dieser ist so programmiert, dass der Google Assistant permanent mit einem Störgeräusch beschallt wird. Menschen können das Geräusch nicht hören, die sensiblen Mikrofone des Smart Speakers sind dadurch jedoch außer Gefecht gesetzt. Hinzu kommen weitere digitale Schutzmaßnahmen, die in einer App gesteuert werden.

+

In der App lernt der Sprachfilter auf personalisierte Signalwörter zu hören. Neben Namen und Begriffen, kann er auch durch andere Audiosignale – zum Beispiel eine Melodie oder ein Pfiff – aktiviert werden. Wenn das Mikrofon des Sprachfilters das persönliche Signal hört, wird das Störgeräusch kurzzeitig unterbrochen und der Sprachbefehl gefiltert an den Smart Speaker weitergegeben. Danach ertönt wieder das Störgeräusch, damit der Lautsprecher nichts mehr hören kann.

Auch das Geschlecht, mit dem der Sprachfilter die Befehle an Google übermittelt, kann ich der App festgelegt werden. Zur Auswahl stehen weiblich und männlich. Das täuscht den Google-Algorithmus und verfälscht das Profil, das Google von allen seinen Nutzenden erstellt.

Praktisch ist, dass in der App auch Abkürzungen für längere Befehle eingerichtet werden können. Das Signal „Mir ist langweilig“ beispielsweise, kann als „Welche Ausstellung sieht man gerade im Museum für Kommunikation Nürnberg?“ weitergegeben werden. Ihr Smart Speaker sagt Ihnen dann unser aktuelles Ausstellungsprogramm an.

MPST, Foto: Bert Bostelmann

Hier stellt Tore Knudsen das Projekt Alias ausführlich vor.  

Sie wollen den Sprachfilter Alias kaufen?

Der Sprachfilter ist im Handel nicht erhältlich. Sie können ihn aber mithilfe eines 3D-Druckers selbst herstellen. Die Druckdaten und die Software stehen auf github.com kostenlos zur Verfügung.  

Viel Spaß mit ihrem eigenen Alias!

Warum ein Sprachfilter?

Sprachassistenten müssen durch ein Signalwort „aufgeweckt“ werden. Das setzt voraus, dass sie ständig mithören. Die Herstellerfirmen versichern zwar, dass die Sprachdaten erst aufgezeichnet werden, wenn das Signalwort verwendet wird. Dennoch kommt es häufig zu unfreiwilligen Aufzeichnungen. Eine Studie der Ruhr Universität Bochum und des Max-Planck-Instituts für Sicherheit und Privatsphäre legte 2019 offen, dass die Smart Speaker überraschend häufig Dialoge im Fernsehen, Songtexte oder ähnlich klingende Wörter als Signalwort missverstehen. Unbemerkt starten sie dann die Aufzeichnung.

MSPT, Foto: Bert Bostelmann
Google Home
MPST, Foto: Bert Bostelmann
Google Home
MPST, Foto: Bert Bostelmann

Ausversehen zugehört

Für die Studie prüften die Wissenschaftler:innen elf Smart Speaker von acht unterschiedlichen Herstellern. Insgesamt fanden sie mehr als 1 000 Tonsignale, die von den Geräten fälschlicherweise als Signalwort verstanden wurden. Vor allem beim Schauen von Serien und Nachrichten, werden die Geräte oft aktiviert.

Erfahren Sie mehr über die Studie und schauen Sie Videos mit Beispielen der falschen Signalwörter an:

Fehlaufzeichnung? Was passiert damit?

Für die Technologie-Unternehmen sind die Fehl-Aufzeichungen wertvoll. Sie nutzen die Audios, damit die Assistenzsysteme aus ihren Fehlern lernen können. Dazu hören Menschen die Fehlaufzeichnungen an und tippen ausgewählte Fälle ab, mit denen dann die Algorithmen der Spracherkennung trainiert werden. Nach starker Kritik durch Datenschützende, gaben die Technologie-Unternehmen an, dieses Vorgehen künftig einzustellen.

Eine Dokumentation geht der Frage nach, was mit den fälschlich aufgezeichneten Daten passiert und was auch die richtig aufgezeichneten Daten den Technologie-Unternehmen über sie verraten.

top