„Hallo, Behörde?“ – Kurzstudie sieht hohes Potenzial für sprachgesteuerte E-Government Dienste

  • Nationales E-Government Kompetenzzentrum veröffentlicht Kurzstudie „Sprachsteuerung von E-Government Diensten in Deutschland“
  • Bislang fehlt die Datenbasis im Bereich E-Government für die Umsetzung von stimmbasierten Dialogsystemen
  • Roadmap: Start mit einfachen Statusabfragen, später kontextbezogene Sprachdialoge für Anträge

Pressemeldung vom Mai 2020

Sprachsteuerung bietet großes Potenzial, um einen barrierefreien und niedrigschwelligen Zugang zu E-Government Diensten zu schaffen – von der Beantragung eines Anwohnerparkausweises bis zur Steuererklärung. Einfache mündliche Statusabfragen lassen sich schon heute realisieren. Für komplexere Interaktionen wie Sprachdialoge, die Bürgerinnen und Bürger beispielsweise Schritt für Schritt durch eine Behördendienstleistung oder durch einen Antrag führen, fehlen in Deutschland jedoch bislang zentrale Grundlagen. Benötigt wird eine Infrastruktur, die den Aufbau staatlicher Sprachsteuerungsangebote unter Berücksichtigung der hohen Datenschutzanforderungen ermöglicht. Zu diesem Schluss kommt die vom Nationalen E-Government Kompetenzzentrum (NEGZ) geförderte Kurzstudie zur „Sprachsteuerung von E-Government Diensten in Deutschland“.

„Wir sind überzeugt davon, dass sich die Sprachsteuerung als Interaktionskanal durchsetzen wird. Umso wichtiger ist es, bereits heute die richtigen Weichen für den Einsatz im behördlichen Kontext zu stellen“, sagt Dr. Stefan Schaffer vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI). Schaffer ist Mitautor der Kurzstudie und forscht im Bereich Kognitive Assistenzsysteme.

„Wir sind überzeugt davon, dass sich die Sprachsteuerung als Interaktionskanal durchsetzen wird. Umso wichtiger ist es, bereits heute die richtigen Weichen für den Einsatz im behördlichen Kontext zu stellen“, sagt Dr. Stefan Schaffer vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI). Schaffer ist Mitautor der Kurzstudie und forscht im Bereich Kognitive Assistenzsysteme.

Die Studie identifiziert mehrere vielversprechende Szenarien für Sprachinteraktion in behördlichen Prozessen. Der Schwerpunkt liegt dabei auf Einsatzmöglichkeiten rund um die Steuererklärung. „Ein Steuer-Assistenzsystem könnte zum Beispiel dabei helfen, Belege zu erfassen oder Arbeitsfahrten zu protokollieren. Perspektivisch könnten Dialogsysteme das Ausfüllen vollständiger Anträge unterstützen“, erklärt Roland Krebs, Mitautor der Kurzstudie und ELSTER-Gesamtprojektleiter beim Bayerischen Landesamt für Steuern.

„Ein Steuer-Assistenzsystem könnte zum Beispiel dabei helfen, Belege zu erfassen oder Arbeitsfahrten zu protokollieren. Perspektivisch könnten Dialogsysteme das Ausfüllen vollständiger Anträge unterstützen“, erklärt Roland Krebs, Mitautor der Kurzstudie und ELSTER-Gesamtprojektleiter beim Bayerischen Landesamt für Steuern.

„Das Potenzial der Sprachsteuerung ist gewaltig, gerade bei Anwendungen für alle Bürger. Es gibt einfach keine natürlichere Interaktionsform“, ergänzt Janos Standt, Mitautor der Kurzstudie und stellvertretender Bereichsleiter Public Sector der mgm technology partners GmbH. „Für die sinnvolle Gestaltung der Dialoge ist KI alleine noch nicht die Antwort. Eine Ergänzung um domänenspezifische Modelle erscheint unbedingt notwendig. Ferner ist zu klären, woher die Daten für die Dialoglogik kommen und wie sie unter der Kontrolle der Behörden bleiben können.“

Für die sinnvolle Gestaltung der Dialoge ist KI alleine noch nicht die Antwort. Eine Ergänzung um domänenspezifische Modelle erscheint unbedingt notwendig. Ferner ist zu klären, woher die Daten für die Dialoglogik kommen und wie sie unter der Kontrolle der Behörden bleiben können.

Der technische Aufwand für die Realisierung überzeugender Sprachdialogsysteme ist deutlich höher als bei klassischen Benutzerschnittstellen. Ein entscheidender Schritt ist die Analyse der Benutzerabsicht, die hinter einer Eingabe steckt. State-of-the-Art-Verfahren verwenden hierfür Machine Learning Ansätze. Um die Systeme anzulernen, sind Sammlungen aus bis zu hunderttausenden analysierten themenspezifischen Dialogen nötig. Idealerweise werden auch Interaktionen aus dem laufenden Betrieb kontinuierlich ausgewertet und in die Datenbanken eingespeist. Bislang liegen im Bereich E-Government jedoch kaum entsprechende Dialogdaten vor. Komplexe Regeln lassen sich bei geringen Fallzahlen zudem nicht erlernen.

Eine weitere Herausforderung ist der Betrieb einer technischen Lösung, die die hohen Anforderungen an einen vertraulichen Umgang mit Daten erfüllt. Die Nutzung kommerzieller Cloud-basierter Dienste erscheint aufgrund der Verarbeitung vertraulicher Informationen in E-Government Diensten hochproblematisch. Es ist nicht akzeptabel, dass sensible Informationen wie sie zum Beispiel bei der Steuererklärung anfallen über Drittanbieter-Server laufen. Die Autoren der Kurzstudie plädieren dafür, auf sogenannte On-Premises-Lösungen zu setzen, bei denen die Dialoglogik inklusive Spracherkennung unter der Kontrolle der Betreiber bleibt – auch wenn dadurch der finanzielle und technische Aufwand höher ausfällt.

Für die Integration von Sprachsteuerung in E-Government Diensten empfehlen die Autoren ein schrittweises Vorgehen. So könnten bereits kurzfristig einfache Leistungen wie Statusabfragen und Fristverlängerungen sprachbasiert umgesetzt werden. Mittelfristig wird empfohlen, einen Interview-Modus zur Vorbereitung größerer Anträge umzusetzen. Auch eine Integration mit dem Steuerportal ELSTER wäre denkbar. Langfristiges Ziel sollte es sein, ein vollständiges, kontextbezogenes Ausfüllen komplexer Anträge wie der Steuer in Form eines Dialogs zu ermöglichen.
Integration von Sprachsteuerung in E-Government Diensten

Für die Integration von Sprachsteuerung in E-Government Diensten empfehlen die Autoren ein schrittweises Vorgehen. So könnten bereits kurzfristig einfache Leistungen wie Statusabfragen und Fristverlängerungen sprachbasiert umgesetzt werden. Mittelfristig wird empfohlen, einen Interview-Modus zur Vorbereitung größerer Anträge umzusetzen. Auch eine Integration mit dem Steuerportal ELSTER wäre denkbar. Langfristiges Ziel sollte es sein, ein vollständiges, kontextbezogenes Ausfüllen komplexer Anträge wie der Steuer in Form eines Dialogs zu ermöglichen.

Viele der in der Kurzstudie beschriebenen Szenarien lassen sich auf weitere Leistungen des Umsetzungskatalogs übertragen, die vom IT-Planungsrat von Bund und Ländern nach dem Gesetz zur Verbesserung des Onlinezugangs zu Verwaltungsleistungen (OZG) definiert wurden.

Fazit: Bis zur überzeugenden breitflächigen Umsetzung von Sprachsteuerungsangeboten in E-Government Diensten ist es noch ein längerer Weg. Die Entwicklung sollte jedoch zeitnah starten, um den Anschluss nicht zu verlieren.


FÜR EINEN MODERNEN STAAT

Das Nationale E-Government Kompetenzzentrum vernetzt Expertinnen und Experten aus Politik, Verwaltung, Wissenschaft und Wirtschaft. Das NEGZ versteht sich als die zentrale, unabhängige Plattform für Staatsmodernisierung und Verwaltungstransformation in Deutschland.

Über das DFKI

Das Deutsche Forschungszentrum für Künstliche Intelligenz GmbH (DFKI) wurde 1988 als gemeinnützige Public-Private-Partnership (PPP) gegründet. Es unterhält Standorte in Kaiserslautern, Saarbrücken, Bremen, ein Projektbüro in Berlin, ein Labor in Niedersachsen und eine Außenstelle in St. Wendel. Das DFKI ist auf dem Gebiet innovativer Softwaretechnologien auf der Basis von Methoden der Künstlichen Intelligenz die führende wirtschaftsnahe Forschungseinrichtung Deutschlands. In der internationalen Wissenschaftswelt zählt das DFKI zu den wichtigsten „Centers of Excellence“.

Das Finanzvolumen lag 2018 bei 48,8 Millionen Euro. DFKI-Projekte adressieren das gesamte Spektrum von der anwendungsorientierten Grundlagenforschung bis zur markt- und kundenorientierten Entwicklung von Produktfunktionen. Aktuell forschen ca. 1.100 Mitarbeiter aus über 65 Nationen an innovativen Software-Lösungen mit den inhaltlichen Schwerpunkten Smarte Daten & Wissensdienste, Cyber-Physical Systems, Multilinguale Technologien, Planbasierte Robotersteuerung, Educational Technologies, Interaktive Textilien, Robotik, Algorithmic Business and Production, Innovative Retail, Wirtschaftsinformatik, Eingebettete Intelligenz, Smart Service Engineering, Intelligente Analytik für Massendaten, Intelligente Netze, Agenten und Simulierte Realität, Erweiterte Realität, Sprachtechnologie, Kognitive Assistenzsysteme, Innovative Fabriksysteme, Marine Perception und Smart Enterprise Engineering. Der Erfolg: mehr als 140 Professorinnen und Professoren aus den eigenen Reihen und mehr als 95 Spin-off-Unternehmen mit ca. 2.500 hochqualifizierten Arbeitsplätzen.

Über das Bayerische Landesamt für Steuern (BayLfSt)

Das BayLfSt ist eine Landesbehörde des Freistaats Bayern und das Verbindungsglied zwischen dem Bayerischen Staatsministerium der Finanzen und für Heimat und den Finanzämtern. Es unterstützt die ihm nachgeordneten Finanzämter in fachlicher, organisatorischer und technischer Hinsicht und übt über diese die Fach- und Dienstaufsicht aus. Das BayLfSt erfüllt wichtige Aufgaben nach dem Steuerberatungsgesetz und ist in vielfältiger Hinsicht Serviceleister für die Steuerberater in Bayern.
www.finanzamt.bayern.de/LfSt

Über mgm

mgm technology partners folgt dem Ansatz der Digitalen Souveränität, nach der Organisationen die Hoheit und das Wissen über die eigenen IT-Systeme behalten. Auf dieser Basis entwickelt mgm Enterprise Applikationen für die Branchen Commerce, Insurance und Public Sector. Hauptsitz des 1994 gegründeten Technologieunternehmens ist München, hinzu kommen mittlerweile 16 Standorte im In- und Ausland, darunter in den Metropolen Berlin, Hamburg, Köln, Prag, Washington und Da Nang in Vietnam. Insgesamt sind über 700 Mitarbeiterinnen und Mitarbeiter in sieben Ländern für mgm tätig. Seit 2006 ist mgm eine Division der Allgeier SE in München, an der Spitze steht weiterhin einer der Gründer und Teilhaber.

www.mgm-tp.com