Was vor einigen Jahren noch nach Science Fiction klang, ist heute längst Realität – wir sprechen mit unseren technischen Geräten, geben ihnen Befehle, fragen sie nach Informationen und stellen klare Aufgaben. In Zeiten von Siri, Alexa und anderen Sprachassistenten sowie Smart Technologies kommt vor allem eine Technologie aus der Welt der Artificial Intelligence zum Einsatz – Natural Language Processing (NLP).

In diesem Beitrag erhalten Sie einen Überblick über NLP, die gegenwärtigen Einsatzbereiche – und wir werfen gemeinsam einen Blick in die Zukunft. Erfahren Sie hier, wie auch Ihr digitaler Betrieb künftig davon profitiert.

→ Kostenloser Leitfaden: Wie man KI im Content-Marketing einsetzt [Jetzt  herunterladen]



Wie funktioniert Natural Language Processing?

Bei der Natural Language Generation generiert ein Computer eine eigenständige Kommunikation mit eigenen Inhalten. Das Natural Language Understanding hingegen ist auf Sprachverständnis ausgelegt. Linguistische Computer können damit die menschliche Sprache sowie Aussprache und sogar Slangs, Dialekte, Fachbegriffe und falsche Aussprachen von Wörtern verstehen und verarbeiten.

Das NLP bezog sich ursprünglich auf die Lesefähigkeit von Computersystemen. Die ersten Versuche gehen zurück auf die 1950er Jahre, als an einer amerikanischen Universität erste russische Sätze ins Englische übersetzt wurden. Seit den 1990er Jahren umfasst das NLP sämtliche Aspekte der Linguistik – inklusive einiger Subkategorien, darunter die Natural Language Generation sowie das Natural Language Understanding.

Aufgaben von Natural Language Processing

Das Natural Language Processing muss verschiedene Aufgaben erfüllen, um effizient zu arbeiten. So sollten die Maschinen und Algorithmen in der Lage sein, die Aussagen eines Menschen zu verstehen und angemessen darauf zu reagieren. Um das leisten zu können, zerlegen die NLP-Algorithmen die jeweiligen Aussagen in kleinere Bestandteile. Aus Texten werden Sätze, aus Sätzen Wörter, aus Wörtern Laute und so weiter. Die Maschinen nutzen diese einzelnen, kleinen Komponenten dann, um die Bedeutung einer Aussage zu erkennen.

NLP arbeitet bei der Zerlegung einzelner Sprachelemente in kleinere Untereinheiten mit verschiedenen Techniken und Verfahren. Unter anderem nutzt es Tokenization (Tokenisierung), Parsing, Lemmatization (Lemmatisierung) beziehungsweise Stemming, Part-of-Speech-Tagging, Spracherkennung und die Erkennung von Sprachzusammenhängen, um die Bedeutung einer Aussage zu verstehen.

So kompliziert diese Begriffe klingen, so einfach und automatisch führen Menschen sie alltäglich durch: Im Grunde können Sie sich diese Aufgaben als eine Art technische Herangehensweise an eine typische Satzbauanalyse vorstellen.

Natural Language Processing und Machine Learning

Das Natural Language Processing basiert auf den Grundlagen des Machine Learning (ML) und des Deep Learning (DL). Hierbei werden Wörter, Sätze und der grammatische Aufbau wie jede andere bekannte Form von Zahlen und Daten verarbeitet und gespeichert. Die Programmierer und Programmiererinnen „füttern“ die intelligenten Systeme dazu mit Zitaten und Redewendungen und bringen ihnen die grammatischen Grundregeln der Sprache bei.

Die Rechner erkennen darin Datenmuster und können vorhersagen, welche Wörter als nächstes folgen. Es besteht somit eine enge Verbindung zwischen maschinellem Lernen, Deep Learning, Natural Language Processing und anderen Spracherkennungsverfahren.

Natural Language Processing: Bekannte Methoden und Einsatzbereiche der Sprachtechnik

Was am Anfang wie ein exotisches technisches Experiment anmutete, ist heute längst Realität und fest im Bereich der künstlichen Intelligenz verankert. Internationale Übersetzungsagenturen nutzen Natural Language Processing zum Beispiel längst, um mit Machine Translations (MT) riesige Mengen an Texten von der einen in die andere Sprache zu übersetzen. Das mussten vor einigen Jahren noch jede Menge Übersetzer und Übersetzerinnen in langwieriger und mühevoller Kleinarbeit Wort für Wort leisten.

Selbst die Regierungen von Kanada und der Europäischen Union nutzen diese Form der Technologie bereits, um regelmäßig neue Gesetzestexte maschinell und sprachkonform in die jeweiligen Sprachen der anderen Länder zu übersetzen. Auch der statistische Bereich nutzt das NLP, um Informationen über Spracheingaben selbstständig zu speichern, zu verwalten und auszuwerten.

Für die verschiedenen Use Cases kommen im Natural Language Processing zahlreiche Methoden zum Einsatz. Die wichtigsten davon stellen wir Ihnen im Folgenden vor.

Vektoransicht

Bei der Vektoransicht stellt das NLP Zeichenketten als Vektoren mit Werten dar. Dabei etabliert es für jedes einzelne Wort einen dichten Vektor, womit Wörter in einem ähnlichen Kontext ähnliche Vektoren erhalten. Damit können die Systeme auch bei kleinen Datensätzen beispielsweise einen Text in einer fremden Sprache effektiv erfassen und analysieren.

Maschinelle Übersetzungen

Die maschinellen Übersetzungen, auch als Neural Machine Translation bekannt, nutzen Statistiken und erfasste Werte zum Wortgebrauch, um damit eigenständig sinnvolle Übersetzungen auszuführen. Das bekannteste Beispiel ist Google Translate mit ca. 100 Milliarden übersetzten Wörtern pro Tag. Auch große Anbieter wie Facebook, Twitter oder eBay nutzen maschinelle Übersetzungen, um gepostete Beiträge in Echtzeit in eine gewünschte andere Sprache zu übertragen.

Sprachassistenten

Die bereits erwähnten Sprachassistenten oder auch intelligenten persönlichen Assistentinnen sind das bisher bekannteste Ergebnis der NLP im Alltag. Hierbei werden seit 2012 die Spracherkennung und Sprachanalyse herangezogen, um diese semantisch zu interpretieren und durch Sprachsynthesen sinnvolle Antworten und Sätze zu formulieren.

Und nicht nur das – diese längst mit Ihrem Handy, Computer, Organizer oder Ihrer Smart Watch verbundenen Systeme steuern Ihre elektronischen Geräte auf Ihren Sprachbefehl hin. So notieren Sprachassistenten Termine in Ihrem Kalender, spielen Ihre Lieblingsmusik ab oder starten Anrufe, sobald Sie sie verbal dazu auffordern.

Frage- und Antwortsysteme (Dynamic Memory Network)

Frage- und Antwortsysteme haben die Aufgabe, Fragen von Nutzern und Nutzerinnen zu beantworten. Hierfür müssen die wissensbasierten Systeme die an sie gerichteten Fragen analysieren und verstehen, um dann aus einer Datenbank die vermutlich besten Antworten auf die jeweilige Frage zu ermitteln.

Bevor Frage- und Antwortsysteme erfolgreich zum Einsatz kommen können, müssen sie zunächst eine Lernphase durchlaufen. In dieser trainieren sie, die an sie gerichteten Fragen zu verstehen und sinnvoll zu beantworten.

Textzusammenfassungen (Text Mining)

Bei Textzusammenfassungen beziehungsweise Text Mining geht es darum, Sinnzusammenhänge und Bedeutungsmuster aus scheinbar unzusammenhängenden oder nur schwach zusammenhängenden Texten zu erkennen. NLP wird dabei eingesetzt, um innerhalb kürzester Zeit große Datensätze zu analysieren und die jeweiligen Kernaussagen zu extrahieren.

Spam-Filter

Auch in einfachsten Alltagsprozeduren treffen wir auf Ergebnisse des Natural Language Processing. Wenn Sie zum Beispiel morgens den Spam-Ordner Ihres E-Mail-Accounts öffnen und darin die üblichen Spam-Mails mit Gewinnspielen, Betrugsschreiben und Phishing-Mails finden, ist das ein Ergebnis des NLP.

Dieses analysiert im Einsatz als Spam-Filter wichtige Schlüsselbegriffe und Inhalte wie Gewinnbenachrichtigungen oder Links zu dubiosen Webseiten, um die ganze E-Mail als unseriöse Spam-Mail zu kategorisieren und aus dem Verkehr zu ziehen.

Kundendialog und Textverarbeitung

Ein weiterer wichtiger Bereich, in dem Sie auf NLP treffen, sind Sprachdialogsysteme, auch als IVR-Systeme bekannt. Mithilfe von Spracheingaben oder dem Drücken Ihrer Telefontasten können Sie mithilfe des Natural Language Processing zum Beispiel beim Anruf einer Hotline mit künstlicher Intelligenz kommunizieren, die Sie dann gezielt an die passenden Ansprechpersonen und Abteilungen weiterleiten. Dort können Sie direkt Ihre Beschwerde loswerden oder Waren bestellen, ohne dass Sie von Person zu Person weiterverbunden werden.

Um dies zu ermöglichen, kommen sogenannte Frage- und Antwortsysteme (Dynamic Memory Networks) zum Einsatz, mithilfe derer das System anhand kleiner Spracheingaben wie „Ja”, „Nein”, Namen oder Nummern eine Vorauswahl vornehmen oder gezielte Weiterleitungen einleiten kann. Dieses intelligente Verfahren erleichtert Ihrem IT- und Helpdesk-Bereich die gezielte Kommunikation mit Kunden und Kundinnen immens.

Medizinische Forschung

Mittels Natural Language Processing ist es in der Medizin inzwischen möglich, Krankheiten frühzeitig zu erkennen und entsprechende Therapien in die Wege zu leiten. Hierfür muss das jeweilige System Zugriff auf Patienten- und Patientinnendaten erhalten.

Anhand der Sprache der Betroffenen sind die Algorithmen dann in der Lage, Störungen frühzeitig zu erkennen und Alarm auszulösen. Auf diese Weise lassen sich beispielsweise Herz-Kreislauf-Erkrankungen, Schizophrenie oder Depressionen frühzeitig diagnostizieren und sinnvolle Behandlungen können eingeleitet werden.

In Kombination mit Deep Learning wird Natural Language Processing auch in der Arzneimittelforschung eingesetzt. Hier kommen Algorithmen zum Einsatz, welche große Datenmengen analysieren, aus diesen lernen und dadurch eigenständig fundierte Ja-Nein-Entscheidungen treffen. So erkennen sie bestimmte Muster, welche zur Entwicklung neuer Wirkstoffe beitragen können.

Analyse von Kundenmeinungen

Für Unternehmen ist es wichtig, Stimmungen bei ihrer Zielgruppe zu erkennen und darauf zu reagieren. Mit NLP ist es möglich, in großen Systemen wie den sozialen Netzwerken umfangreiche Datensätze zu analysieren. Anschließend analysieren sie darin vertretene Haltungen und Meinungen, erkennen diese und benennen sie.

Text-to-Speech-Konvertierung

Für Menschen, die viel und häufig Texte erstellen, bietet die Text-to-Speech-Konvertierung eine Pause für die emsig tippenden Finger. Hierbei erkennen die Programme gesprochene Sprache und wandelt sie in Text um, der dann veröffentlicht werden kann. Das Vorgehen ist im Vergleich zum manuellen Eintippen von Texten extrem zeitsparend.

Alles in allem bietet Natural Language Processing viele verschiedene Möglichkeiten für Unternehmen, um die Zufriedenheit ihrer Kundschaft deutlich zu verbessern.

Die Royal Bank of Scotland setzt zum Beispiel das Natural Language Processing Verfahren „Text Analytics“ konsequent ein, um Feedback, Beschwerden und Wünsche aus E-Mails, Callcenter-Gesprächen, Social-Media-Kanälen und Umfragen auszuwerten. Damit erkennt das Unternehmen schon im Vorfeld, wo Probleme auftreten und wie diese zu lösen sind. Die Zufriedenheit ihrer Kundschaft konnte die Bank damit jedenfalls deutlich erhöhen.

Die Herausforderungen des Natural Language Processing

Mit der fortlaufenden Entwicklung von sprachlicher Kommunikation zwischen Menschen und Computern, mobilen Geräten (Wearables) und Chatbots hat sich das NLP längst zu einer wichtigen Technologie innerhalb des Feldes der künstlichen Intelligenz entwickelt. Die Technik erfasst die komplexe menschliche Sprache und ihre Zusammenhänge zunehmend flexibler und umfangreicher.

Die besondere Herausforderung dieser maschinellen Intelligenz liegt darin, diese Besonderheiten zu erkennen und zu interpretieren. Sprache ist eine komplexe Übertragung von Signalen, die mitunter Laute (der Zustimmung oder Missbilligung) enthalten, aber auch Gesten, Mimik, Dialekte, Slangs, Grammatik, Syntaxregeln und sprachliche Besonderheiten zum Austausch nutzt.

Hier liegt es am Natural Language Processing, die entsprechenden Codes zu verstehen und richtig zu deuten. Dabei erwarten wir längst, dass die Maschinen unsere einfachen Fragen und Befehle verstehen und entsprechend ausführen.

Bekannte Softwares im Natural Language Processing

Wollen Sie NLP-Anwendungen in der Praxis nutzen, benötigen Sie dazu die richtigen Tools. Wir präsentieren Ihnen einige der populärsten Software-Lösungen.

Natural Language Toolkit (NLTK)

Das Natural Language Toolkit (NLTK) ist ein Open-Source-Netzwerk, welches Ihnen ermöglicht, eigens programmierte Applikationen für die Verarbeitung der Sprache zu starten. Es enthält zahlreiche Textressourcen und Bibliotheken, um daraus progressive NLP-Entwicklungen zu fördern.

SpaCy

SpaCy ist eine Software-Bibliothek mit offenem Quellcode und ist weniger für Forschungszwecke, sondern zum Einsatz im Alltag gedacht. Der Kern liegt dabei im Deep-Data-Mining, bei dem die Software große Datenbestände natürlicher Sprache auf sprachliche Trends und Entwicklungen hin analysiert.

Gensim

Gensim ist eine weitere sogenannte Language Library (Sprachbibliothek) für Natural Language Processing. Hier werden große Textmengen ohne menschliche Unterstützung semantisch skaliert und ausgewertet.

Amazon Comprehend

Amazon Comprehend ist ein NLP-Service von Amazon und unterstützt Ihr Unternehmen unter anderem darin, gezielte Informationen aus E-Mails, Bewertungen im Internet, Social-Media-Kanälen, Call-Center-Anrufen und Helpdesk-Tickets herauszufiltern und auszuwerten.

IBM Watson Tone Analyzer

Der IBM Watson Tone Analyzer ist eine NLP-Lösung auf Cloud-Basis von IBM und dient ebenfalls der Auswertungen von Feedback Ihrer Kundschaft. Ausgewertet werden beispielsweise Rezensionen auf Social-Media-Kanälen (Social Listening), Interaktionen mit Chatbots und Statistiken aus dem Customer Service.

Das Hauptaugenmerk des Tone Analyzers liegt dabei auf einer sogenannten Sentiment Analysis. Im Zuge einer solchen Sentimentanalyse werden Emotionalität und Tonfall der Kundschaft untersucht. Das Tool kann also sowohl positives, neugieriges, als auch negatives Feedback von Kunden und Kundinnen aus Mails, Postings, Anrufen oder Chats herausfiltern.

MonkeyLearn

MonkeyLearn ist ein Tool, welches speziell darauf trainiert ist, das Feedback der Kundschaft zu analysieren, zu bewerten und Handlungsempfehlungen für die Zukunft daraus abzuleiten. Die Software zeichnet sich durch eine hohe Benutzungsfreundlichkeit aus und kann mit zahlreichen Apps kombiniert werden.

Aylien

Aylien arbeitet mit Deep Learning Models und Natural Language Processing, um große Datenmengen innerhalb kürzester Zeit auszuwerten. Unter anderem ist es mit Aylien leicht möglich, wissenschaftliche Publikationen, Social-Media-Inhalte sowie Echtzeitmeldungen aus Nachrichtenportalen auszuwerten und hinsichtlich bestimmter Themen oder Keywords zu analysieren.

TextBlob

TextBlob eignet sich hervorragend dazu, die persönliche Haltung, die Menschen mit einem Text oder einer Aussage zum Ausdruck bringen, zu analysieren und zu bewerten. TextBlob nutzt hierfür eine Python-Bibliothek, wodurch es eine deutlich höhere Lernkurve hat, als das bei Open-Source-Bibliotheken der Fall wäre.

Google Cloud Translation

Google Cloud Translation ist eine der bekanntesten NLP-Lösungen. Im Zuge der zunehmenden Digitalisierung hilft sie dabei, die Sprache eines Textes auf der Google-Webseite zu erkennen und ganze Texte dynamisch auf einem hohen Sprachniveau zu übersetzen.

Fazit: So könnte die Zukunft des NLP aussehen

Das Natural Language Processing ist ausgesprochen vielseitig und kann für die Spracherkennung in zahlreichen Bereichen genutzt werden. Neben der Auswertung von Sprache und Texten dient es vor allem der Interaktion mit Kunden und Kundinnen, um Aufträge abzuwickeln, Daten zu sammeln, Beschwerden anzunehmen und zu lösen.

Die Herausforderung für das NLP der Zukunft liegt in noch präziseren, realistischeren Analysen Ihrer Daten und Interaktionen mit Ihrer Kundschaft in noch kürzerer Zeit. Dafür sind enorme Rechenleistungen nötig, aber auch mehr Sicherheit gegen unbefugte Eingriffe und eine zunehmende Akzeptanz der Menschen bei Interaktionen mit maschinellen „Gegenüber“.

Diese Weiterentwicklung ist besonders im Umfeld von Big Data und Business Intelligence bereits in vollem Gange – langfristig gesehen dürfen wir uns also auf weitere Entwicklungen im Natural Language Processing freuen.

Kostenloser Download: Nutzung generativer KI

 Kostenloser Download: Nutzung generativer KI

Titelbild: RossHelen / iStock / Getty Images Plus

Ursprünglich veröffentlicht am 14. Februar 2023, aktualisiert am April 14 2023

Themen:

Künstliche Intelligenz