Virtueller Finger zeigt auf "Natural Language Processing"-Konzept
Natural Language Processing steht für die maschinelle Verarbeitung natürlicher Sprache. (Symbolbild)

Wir profitieren täglich davon, nehmen dies oft aber gar nicht unmittelbar wahr. Die Rede ist von Natural Language Processing (NLP): E-Mail-Anbieter klassifizieren unsere E-Mails und stoppen Spam, bevor er im Posteingang ankommt. Beim Schreiben von Texten verwenden wir die Autokorrektur, Grammatik- und Rechtschreibprüfung. Google Translator hilft uns, Sprachnachrichten zu übersetzen. Chatbots verstehen unsere Anliegen und generieren sinnvolle Antworten. Welche Technologien hinter den drei Buchstaben stecken und wie weit die verschiedenen Anwendungen von NLP fortgeschritten sind – das soll dieser Beitrag aufzeigen.

Natural Language Processing – Was ist das?

Natural Language Processing steht für die maschinelle Verarbeitung natürlicher Sprache und ist ein Teilgebiet der künstlichen Intelligenz. Sie teilt sich in zwei Unterdisziplinen auf: Natural Language Understanding bzw. NLU (das Verstehen natürlicher Sprache) sowie Natural Language Generation bzw. NLG (das Erzeugen natürlicher Sprache). Ziel von NLP ist es, die Kommunikation zwischen Menschen und Computern – sei es in gesprochener oder geschriebener Form  – zu vereinfachen.

Wie die maschinelle Verarbeitung natürlicher Sprache funktioniert

Wenn Sie Chatbots wie Alexa oder Siri um eine Wettervorhersage oder Wegbeschreibung bitten, ist NLP im Hintergrund am Werk: Als Erstes müssen Ihre Sätze in eine Grundstruktur zerlegt werden, die vom NLP-System verwendet werden kann. Dies geschieht in der Regel mithilfe des Hidden-Markov-Model-Systems (HMM). Das heisst, dieses hört sich 10- bis 20-Millisekunden-Clips Ihrer Sprache an und sucht nach Phonemen (kleinste bedeutungsunterscheidende Laute), um sie mit der Aufzeichnung Ihrer Äusserung zu vergleichen. Die Phoneme /r/ und /t/ zum Beispiel unterscheiden die Wörter „rot“ und „tot“.

Als Nächstes werden die Wörter in ihre Wortarten (Substantiv, Verb, usw.) aufgeschlüsselt. Dies geschieht durch eine Reihe von kodierten Grammatikregeln, die Statistiken und maschinelles Lernen einbeziehen. Hier kommt auch die semantische Analyse zum Zug. Durch den Einbezug des Kontextes erhalten die Wörter eine "eindeutige" Bedeutung. Beispielsweise muss die Software die gleichklingenden Wörter "war" und "wahr" richtig interpretieren: Ist die Vergangenheitsform des Verbs "sein" oder das Adjektiv "wahr" gemeint? Sobald die Inhalte eindeutig identifiziert sind, ist der Prozess von Natural Language Understanding abgeschlossen.

Geht es nun darum, auf die identifizierten Inhalte zu reagieren, nutzen Siri und Alexa Natural Language Generation. Sie produzieren mittels eines Algorithmus menschenähnliche Sprache mit angemessenen Inhalten in Echtzeit. Voraussetzung dafür sind strukturierte Daten. Dazu greifen Siri und Alexa auf die Apps auf Ihrem Smartphone zu: Mail, Kontakte, Karten, Agenda, Safari, etc. Sie durchsuchen sie und liefern passende Antworten. Über maschinelles Lernen entwickelt sich die Präzision der generierten Aussagen fortlaufend weiter.

Zentrale Techniken von NLP

Zentrale Techniken, die bei der maschinellen Verarbeitung von Sprache eingesetzt werden, sind:

  • Textnormalisierung: Die Erkennung geschriebener Sprache verläuft nach einem ähnlichen Prinzip wie bei der gesprochenen Sprache. Bei der sogenannten Textnormalisierung wird der Text in kleinere Einheiten, sprich Tokens, aufgeteilt. Dazu wird der Text in ein Standardformat konvertiert. Alle Satzzeichen werden entfernt, alle Wörter kleingeschrieben, alle Abkürzungen und Akronyme erweitert. Wörter, die vom Algorithmus als vernachlässigbar taxiert werden, wie die Pronomen "ihre", "seine", "unsere" werden ebenfalls gelöscht.
  • Themenmodellierung: Die Themenmodellierung ist eine Technik, um Dokumente automatisch in verschiedene Kategorien einzuordnen. Dabei können auch versteckte Themen in einer Sammlung von Dokumenten entdeckt oder die wichtigsten Schlüsselwörter aus einem Dokument extrahiert werden. Mithilfe von NLP-Technologien wie der Themenmodellierung kann beispielsweise das Nutzerverhalten auf Websites, in sozialen Netzwerken und bei Suchanfragen analysiert werden. So finden Marketingspezialist/innen User, die wahrscheinlich einen Kauf tätigen werden und können ihnen personalisierte Werbung anbieten.
  • Stimmungsanalyse (Sentiment Analysis): Die Stimmungsanalyse dient dazu, Texte und Audiodateien automatisch zu klassifizieren: als positiv, negativ oder neutral. So lässt sich auch die Einstellung eines Autors oder einer Sprecherin zu einem bestimmten Thema ermitteln. Diese Technik kommt zuweilen beim Media Monitoring zum Einsatz. Bei der Überwachung von sozialen Medien oder News können Unternehmen beispielsweise feststellen, was Nutzer/innen über eine Dienstleistung oder ein Produkt sagen und die Stimmung dieser Informationen bewerten. Kritische Meinungen werden so frühzeitig erkannt. Gegebenenfalls lässt es sich mit entsprechender Kommunikation dagegen steuern.

Natural Language Processing – Anwendungsbeispiele in der Praxis

Praxis-Beispiele für die maschinelle Verarbeitung natürlicher Sprache sind:

  • Erkennung von Fake News: Die NLP-Gruppe am MIT hat ein System entwickelt, mit dem festgestellt werden kann, ob eine Quelle korrekt oder politisch voreingenommen ist und ob man einer Nachrichtenquelle vertrauen kann oder nicht.
  • Erkennung und Vorhersage von Krankheiten: Amazon Comprehend Medical extrahiert medizinische Informationen aus Arztnotizen, klinischen Studienreports oder Radiologieberichten und identifiziert die Beziehungen zwischen den gesammelten Gesundheitsinformationen. Diese Technologie verbessert nicht nur die Krankheitsdiagnose, sondern senkt auch die Gesundheitskosten. Patienten werden besser verstanden und können von einer besseren Gesundheitsversorgung profitieren.
  • Talentsuche: NLP wird auch in der Such- und Auswahlphase bei der Rekrutierung von Talenten eingesetzt, um die Fähigkeiten potenzieller Bewerbenden und Mitarbeitenden zu erkennen.
  • Investitionsentscheidungen: Im Investment Management wird NLP von den Finanzhändler/innen vor allem in der Pre-Trade-Phase eingesetzt, um Nachrichten, Berichte und Kommentare über mögliche Fusionen von Unternehmen zu sammeln, zu analysieren und zusammenzufassen. Die so gewonnenen Informationen tragen zum Fällen von Investitionsentscheidungen bei.
  • "Pre-Crime ("Predictive Policing"): Bei der vorausschauenden Polizeiarbeit werden NLP-Techniken eingesetzt, die auf der Verarbeitung von Personendaten und Persönlichkeitsprofilen durch Algorithmen beruhen, um mögliche Motive für ein Verbrechen zu ermitteln. Aufgrund der Analyse kann die Polizei eingreifen, bevor Straftaten begangen werden.
  • Automatisierung von Routineaufgaben von Rechtsteams: LegalMation hat auf der Grundlage der NLP-Technologie von IBM Watson eine Plattform entwickelt, die Routineaufgaben bei Rechtsstreitigkeiten automatisiert und Rechtsteams dabei hilft, Zeit zu sparen, Kosten zu senken und strategische Schwerpunkte zu setzen.
  • Umwandlung von Text in Gebärdensprache: SignAll ist ein Tool, das NLP nutzt, um Gebärdensprache in Text umzuwandeln. Dies kann Gehörlosen helfen, mit Menschen zu kommunizieren, die die Gebärdensprache nicht kennen.
  • Roboterjournalismus: Dieser findet sich vor allem bei Newsportalen und eignet sich für die Berichterstattung von Texten mit hoher Standardisierung wie Sportresultate, Börsennachrichten oder Wettervorhersagen. Der Algorithmus des Textroboters verarbeitet grosse Mengen an bereitgestellten Informationen wie Namen, Orte, Beträge, Rankings, Statistiken, etc. und generiert daraus vollständige Texte anhand einer vordefinierten Erzählstruktur und verschiedener Textbausteine.

Fazit

NLP beruht auf Technologien und Techniken, die Maschinen die Fähigkeit verleiht, menschliche Sprache zu lesen und Bedeutungen daraus abzuleiten sowie menschliche Sprache zu erzeugen. Dank der schier unbegrenzten Menge an Textdateien, die täglich online produziert werden und der Zunahme der Rechenleistung von Prozessoren können mittels NLP aussagekräftige Ergebnisse in Bereichen wie Gesundheitswesen, Medien, Finanzen und Personalwesen erzielt werden. Unternehmen profitieren von Einspareffekten und entbinden Mitarbeitende von monotonen Routinearbeiten.

Natürlich gibt es für NLP noch Entwicklungspotenzial. So ist die Technologie, die Bedeutung der Wörter in einem Satz zu verstehen, noch nicht ganz ausgereift. Ironie oder Sarkasmus sowie unterschiedliche Dialekte und Soziolekte richtig zu erkennen, bilden zurzeit eine Herausforderung.

Autor/in
Irene-Willi

Irene Willi Kägi

Zum Profil
Coaching | Digitalisierung | Führung | HR Management | Kommunikation | Leadership | Organisationsentwicklung | Wirtschaftspsychologie
more...

Bachelor of Science FH in Business Administration mit Vertiefung in Business Information Technology

Bachelor of Science/Arts (BSc/BA)

Mehr laden
Business Administration | Digitalisierung | Informatik | Wirtschaft | Wirtschaftsinformatik
more...
Facebook Twitter Xing LinkedIn WhatsApp E-Mail