Alle paar Wochen werden uns neue Techniken wie zum Beispiel Sprachsteuerung vorgestellt. Einige davon bringen uns den technischen Utopien aus StarTrek in kleinen Schritten näher. Aber wie das so oft bei Werkzeugen ist, man kann sie zum Guten einsetzen aber auch für sehr unschöne Sachen.
Ein schönes Beispiel liefert die Spracherkennung von Geräten für Privatwohnungen. Vorreiter war hier Microsoft mit seiner X-Box One. Die X-Box One sollte die ganze Zeit über ein Mikrofon lauschen und auf bestimmte Sprachbefehle aktiv werden. In ein ähnliches Horn stößt Amazon mit der Echo.
Eigentlich eine prima Idee.
Wäre es nicht toll, wenn man einfach in den Raum sagt: „Computer, Licht, 50% Helligkeit“? Ja, wäre es!
Aber nur wenn auch nur das Licht angeht und man darauf vertrauen kann, dass es auch garantiert zu 100% dabei bleibt. Es muss sicher sein, dass die Information, dass im Wohnzimmer von Max Mustermann gerade mittel helles Licht angemacht hat, in der Wohnung bleibt. Sie darf nicht in irgendeine Cloud wandern oder zu irgendwelchen Geheimdiensten die Clouds und Internetknoten belauschen. Und genau hier liegt das Problem für Microsoft, Google, Apple und Amazon.
Es ist für den Anwender nicht nachvollziehbar, dass was mit den Daten von Siri, Google Now, Amazons Personal Assistant und Microsofts Kinect passiert. Wird die Spracherkennung in dem Gerät ausgeführt, oder werden die ganze Zeit die Geräusche des Mikrofons in die Cloud gesendet?
Niemand möchte ernsthaft eine Wanze in seinem Wohnzimmer, die unkontrolliert jedes Gespräch, jeden Streit oder was auch immer in den eigenen vier Wänden zu hören ist überträgt.
Der Schlüssel für eine funktionierende Spracherkennung im Wohnzimmer ist also, Transparenz.
Es muss technisch und juristisch (z.B. durch eine Datenschutzerklärung des Herstellers) sichergestellt werden, dass die erhobenen Daten nur für den Zweck der Ausführung der Befehle genutzt werden. Dies muss für den Anwender nachprüfbar sein. Außerdem muss er es sicher bemerken, wenn dies einmal nicht mehr der Fall sein sollte.
Das System, auf dem die Spracherkennung läuft, muss für den Anwender vertrauenswürdig sein, dann hat es auch Chancen bei dem sehr kritischen deutschen Verbraucher.
Hier hilft es, wenn die Quellcodes von der verwendeten Hard- und Software offen liegen und von versierten Anwendern selbst nachgebaut werden können. Auch ist die zwingende Auslagerung von Software in die Cloud, ohne die Möglichkeit die Dienste auf eigenen Servern nicht gerade hilfreich.
Wenn Kameras und Mikrofone in Geräte einbaut, hilft es, wenn sich diese MECHANISCH abschalten lassen. So kann eine billige Plastikkappe vor einer Kamera und herausziehbares Mikrofon oder ein mechanischer Schalter (der sich nicht per Software/Firmware umgehen lässt) bei dem Vertrauen wunder wirken.
Wir lernen daraus: Es geht nicht nur darum tolle Technik zu bauen, sondern diese für den Kunden überprüfbar zu machen. Nur so kann das Vertrauen der Kunden in die Technik aufgebaut werden. Gerade auf dem deutschen Markt ist dies sehr wichtig.