Skip to main content

Wie kann ein Chatbot erkennen was der Nutzer von ihm will?

Chatbots Versteht Nutzer

Sprachverständnis: Sagen, Meinen, Tun

Sprachverständnis ist die Voraussetzung dafür ist, dass Chatbots Nutzereingaben richtig verstehen. Um richtig auf die Nutzereingabe zu reagieren, muss ein Chatbot verstehen, was ein Nutzer mit seiner Äußerung meint. Ich hatte die daraus resultierende Problemstellung in meinem letzten Blogbeitrag folgendermaßen zusammengefasst:

Ein Sprecher kann mit einer Äußerung etwas anderes meinen, als seine Äußerung bedeutet.

Um richtig auf eine Nutzereingabe zu reagieren ist es wichtig, dass Chatbots verstehen, was ein Nutzer mit seiner Äußerung tut. In meinen heutigen Beitrag will ich genauer diskutieren, was es mit „Tun durch Sagen“ auf sich hat, denn:

Ein Sprecher kann mit einer Äußerung nicht nur etwas sagen, sondern auch etwas tun.

Was kann man mit Worten tun?

Dinge mit Sprache tun ist so selbstverständlich für Menschen, dass wir im Alltag nicht weiter darüber nachdenken:

  • Fragen: Ist meine Kreditkarte gesperrt?
  • Auffordern: Sperre meine Kreditkarte!
  • Warnen: Sperre bloß nicht meine Kreditkarte!
  • Beklagen: Meine Kreditkarte ist zu Unrecht gesperrt.
  • Berichten: Meine Kreditkarte ist gesperrt.

Wie man mit Worten etwas tut, funktioniert dem Prinzip nach ähnlich (und geht oft einher damit), mit einem Satz etwas bestimmtes zu meinen. Tatsächlich ist eine Trennung zwischen dem was man mit einer Äußerung meint, und dem was man mit einer Äußerung tut in vielen Fällen nicht einfach und auch gar nicht nötig. Die besonderen Erfordernisse, die mit dem Tun von Dingen durch Sprache einhergehen, sind trotzdem einen genaueren Blick wert.

Wie erkennt man, dass jemand etwas mit Worten tut?

Betrachten wir ein Beispiel. Wenn ein Paar getraut wird, wird so etwas gesagt werden wie „Hiermit erkläre ich Sie zu Lebenspartnern“. Damit ist nicht nur etwas gesagt, sondern auch etwas getan. Aber was ist das was man damit getan hat? Im Gegensatz zu „normalen“ Handlungen wie Handheben oder Autofahren kann man ja nicht sehen, dass etwas oder was passiert ist. Mit dem Sagen hat man aber eine bestimmte Handlung vollzogen, einen sogenannten Sprechakt. Und für einen Befehl oder eine Trauung kann ein Sprechakt eine genauso reale Wirkung haben wie jede andere „normale“ Handlung. Wie kommt diese Wirkung zustande, wenn Sagen doch nur aus Schallwellen besteht?

Wie kann man mit Sprache etwas tun?

Dass durch Sagen etwas getan werden kann, beruht auf den Umständen, unter denen etwas gesagt wird. Kurz gesagt: Ein Sprechakt bezieht seine Kraft aus den Umständen, unter denen er geäußert wird.

Die Umstände, die nötig sind, damit ein Sprechakt gelingt werden am deutlichsten, wenn dieser fehlschlägt. Lassen Sie mich das an einem Beispiel illustrieren.

Ein Standesbeamter folgt im Vollzug der Trauung durch Worte bestimmten, sowohl ihm selbst als auch den zu trauenden Partnern und den anwesenden Gästen bekannten Konventionen: einer festgelegten Abfolge von Äußerungen in bestimmten Umständen. Zum Beispiel sollte eine Standesbeamter ziemlich genau die Formel sagen „Hiermit erkläre ich Sie zu Lebenspartnern“ (und nicht: „Ihr armen Leute, jetzt ist es passiert“). Er muss die Berechtigung besitzen, durch solch eine Formel Paare zu trauen, und die zu trauenden Personen sollten auch getraut werden wollen, usw..

Wenn ich Leute auf der Straße anspreche und sage „Hiermit erkläre ich Sie zu Lebenspartnern“, wird das allein deshalb nicht funktionieren, weil ich kein Standesbeamter bin. Die Kraft und Wirkung einer Äußerung, resultiert also aus den Konventionen über Umstände und Abläufen, die nötig sind damit eine Äußerung tun kann, was mit ihr gesagt wird. Das gilt nicht nur für streng geregelte Rituale wie eine Trauung, sondern auch für einfache Fälle wie einen Befehl.

Sprachakt

Ohne Verständnis von Äußerungsumständen kein Sprachverständnis

Die Umstände einer Äußerung legen fest welche Kraft und Wirkung eine Äußerung hat. Genauso ist der Kontext einer Äußerung ausschlaggebend dafür, was man mit einer Äußerung meint.

Für Sprachverständnis ist also neben der Erkennung dessen was gemeint ist auch entscheidend, eine Äußerung mit den dazu passenden Umständen so zu kombinieren, dass die Äußerung ihre Wirkung erhält und der durch die Äußerung realisierte Sprechakt gelingt. Anders gesagt: damit ein Sprechakt gelingt, muss der Adressat in der Lage sein den Sprechakt als solchen zu erkennen.

Was macht das Verstehen von Sprechakten für Chatbots zu einer Herausforderung?

Frage und Antwort

Ein einfaches Erkennungsmerkmal für Sprechakte ist ihre Form. Zum Beispiel kann man in schriftlichen Eingaben Fragen anhand des Satzzeichens „?“ und ihren grammatischen Form erkennen. Damit können Chatbots verstehen, dass die Eingabe „Ist meine Kreditkarte gesperrt?“ eine Frage des Nutzers ist. Der Chatbot kann dann folgern, dass der Nutzer eine Reaktion erwartet. Diese besteht darin, dass der Chatbot mit einem Sprechakt der Art „Antwort“ reagiert. Wenn die Antwort spezifiziert, ob die Kreditkarte des Nutzers gesperrt ist, gelingt dadurch der Sprechakt „Frage“ des Nutzers. Dazu müssen die Chatbots verstehen, dass Äußerungen eine Frage sind.

Direkte und indirekte Sprechakte

Ein Nutzer kann aber auch fragen: „Könnt ihr meine Kreditkarte sperren?“. Wenn der Chatbot gleich reagieren würde wie auf die Frage „Ist meine Kreditkarte gesperrt?“, dann würde er (insofern das zutrifft) mit „Ja“ antworten. Was der Nutzer indirekt bezwecken möchte, ist die Bitte an den Chatbot die Karte zu sperren. Um die Äußerung des Nutzers als Bitte und nicht als Frage zu verstehen, muss der Chatbot unter der Annahme anderer Umstände als für „normale“ Fragen reagieren. Diese Umstände könnten zum Beispiel sein, dass der Sprecher eine Karte besitzt, welche er sperren will. Jedoch kann er diese aber nicht selbst sperren und deswegen fragt er den Chatbot um Hilfe. Dass der Bot eine Frage als Bitte versteht, ist allerdings nirgends niedergeschrieben, sondern zählt zu unserem Wissen darüber, wie mit Sprache Dinge getan werden können.

Nun wäre es natürlich einfacher (wenn auch nicht so höflich), wenn der Nutzer seinen Sprechakt nicht indirekt (als Frage) sondern direkt als Aufforderung formuliert: „Sperre bitte meine Karte“. Zu erkennen, dass dies eine Aufforderung an den Chatbot ist, ist wegen der speziellen grammatischen Form deutscher Imperative nicht sehr schwer. Während in „Sperre bitte meine Karte“ aus der Form des Imperativs ableitbar ist, dass der Chatbot aufgefordert wird etwas zu tun, ist aus „Ich will meine Karte sperren.“ nichts dergleichen direkt ersichtlich. Im Gegenteil sagt der Satz nur aus, was der Nutzer tun will. Es ist eine Ankündigung. Trotzdem erscheint die Antwort „Sehr gut, das freut mich, gutes Gelingen dabei.“ nicht angemessen. Denn was der Nutzer offensichtlich (für uns Menschen) will, ist indirekt den Chatbot zu den Folgerungen über Umstände und Absichten zu bewegen.

Chatbot Versteht Sprache

Sprechakte und Weltwissen

Damit die Chatbots einen Sprechakt richtig verstehen, muss er ziemlich detaillierte Informationen über die typischen Umstände besitzen, in denen bestimmte Äußerungen als bestimmte Sprechakte interpretiert werden können. „Ich will mein Konto überziehen“ sollte zum Beispiel, anders als „Ich will meine Karte sperren“, nicht als indirekte Variante des Sprechakts „Bitte überziehe mein Konto “ verstanden werden (während dies für „Karte sperren“ durchaus so ist.). Kontoüberziehungsumstände sind also grundsätzlich anders gelagert als Kontosperrungsumstände. Für Menschen sind solche Unterschiede vollkommen selbstverständlich. Für Computer sind solche Folgerungen eine enorm große Herausforderung, denn sie basieren auf dem, was man „Weltwissen“ oder „Allgemeinwissen“ nennt. Allgemeinwissen ist für Computer die wahrscheinlich größte Herausforderung. Denn Allgemeinwissen ist nicht einfach verfügbar, sondern muss Chatbots in der richtigen Form bereitgestellt werden.

Wenn sie selbst einen Chatbot betreiben, probieren sie gerne mal aus, ihrem Chatbot den Unterschied zwischen „Kannst du mein Konto sperren?“ und „Kannst du mein Konto überziehen?“ beizubringen. (Oder „Ich will Geld auf mein Konto einzahlen“ vs. „Kannst du Geld auf mein Konto einzahlen?“ „Ich will meinen Kundenberater sprechen“ vs. „Kannst du mit meinem Kundenberater sprechen?“).

Sprachverständnis als Ausgangspunkt der Chatbotentwicklung bei Kauz

Wenn sie mit solchen Fragestellungen bei ihrem Chatbot Probleme haben sollten, dann sind Ihre Probleme der Ausgangspunkt mit dem wir bei Kauz entwickeln. Wir bei Kauz glauben, dass die drei großen Herausforderungen für das Verstehen von Sprache – Auswahl richtiger Bedeutungen, Prinzipien gelungener Kommunikation, Allgemeinwissen – nicht nachgeordnete Probleme der Chatbotentwicklung sind, sondern dass diese drei Herausforderungen Ausgangspunkt der Entwicklung von Chatbots sein müssen. Das heißt, dass die Entwicklung und Funktionsweise der NLU-Engine von Kauz konsequent auf die Herausforderungen von Sprachverstehen durch Chatbots ausgerichtet ist.

Ähnliche Beiträge