Verlage als „Verwerter“ von Inhalten sollten ein Auge auf Sprachtechnologien haben, denn auf ihrer Basis könnten ihnen ebenso Wettbewerber wie Helfer entstehen. Die Technologie macht sehr schnelle Fortschritte – und ein Ende ist nicht absehbar.
Sebastian Küchenmeister von Retresco, einem Anbieter von KI-Lösungen zur automatisierten Verwertung von Inhalten und Sprache, erklärt in einer Serie im IT-Channel von buchreport.de die verschiedenen Aspekte von KI und Sprache. Teil 1: Natural Language Processing, die Verarbeitung natürlicher Sprache.
Was ist Natural Language Processing?
Eigentlich verstehen Mensch und Computer einander sehr schlecht: Während die Maschine nur spezielle Programmiersprachen „spricht“ oder zumindest strukturierte Daten für die Verarbeitung benötigt, spricht und versteht selbst ein Kind ab einem gewissen Alter unstrukturierte „natürliche“ Sprache mit ihren Ungenauigkeiten und Mehrdeutigkeiten.
Daher besteht eine der Grundideen des Natural Language Processing (NLP) darin, den Austausch zwischen maschinellen und menschlichen Systemen zu vereinfachen. Natural Language Processing ist ein Teilgebiet des großen Feldes Künstliche Intelligenz und ist eine Gruppe von Technologien, die Computern das Verstehen, die Interpretation und die Erzeugung unstrukturierter menschlicher Sprache ermöglichen.
„Computer machen Sachen mit Sprache“ – so ließe sich Natural Language Processing umgangssprachlich definieren. Eine wissenschaftliche Definition des Begriffes stammt von der Informatikerin Elizabeth D. Liddy: „Die Verarbeitung natürlicher Sprache ist eine theoretisch motivierte Reihe von Computertechniken zur Analyse und Darstellung natürlich vorkommender Texte auf einer oder mehreren Ebenen der Sprachanalyse, um eine menschenähnliche Sprachverarbeitung für eine Reihe von Aufgaben oder Anwendungen zu erreichen.“
Sprache verstehen vs. Sprache generieren vs. Sprache verarbeiten
Weil die Verarbeitung natürlicher Sprache so vielschichtig ist, hat es sich etabliert, Anwendungen mit eng definiertem Fokus in einen von zwei anerkannten Bereichen einzuordnen. Als Teildisziplinen von Natural Language Processing gelten Natural Language Understanding (NLU) und Natural Language Generation (NLG):
- Natural Language Understanding (NLU) konzentriert sich in erster Linie darauf, einer Maschine das Verständnis eines Textes oder von gesprochenem Wort zu ermöglichen. Analysiert etwa eine Anwendung den Newsbeitrag eines Online-Portals und identifiziert daraus mittels Entitäten-Extraktion Elemente wie Personen, Orte und Ereignisse, handelt es sich dabei „nur“ um Natural Language Understanding. Sobald es darum geht, auf einen identifizierten Inhalt zu reagieren, etwa in einem Chatbot, wird die Anwendung zur NLP.
- Natural Language Generation bezeichnet die Produktion von Text durch einen Algorithmus. Voraussetzung dafür sind strukturierte Daten, wie sie etwa in Form von Börseninformationen, Produktmerkmalen, Sport- oder Wetterdaten vorliegen. Automatische Textgenerierung macht daraus dann in Echtzeit Inhalte beliebiger Anzahl. Da Natural Language Generation Daten zu Sprache verarbeitet, wird auch dieses Teilgebiet unter den Überbegriff Natural Language Processing gefasst.
Wie Language Processing funktioniert
Unabhängig davon, welcher Wissensdomäne die sprachlichen Inhalte entspringen, die ein Computer verarbeitet, muss er erst einmal die einzelnen Teile unterscheiden und voneinander abgrenzen, bevor er deren Bedeutung erkennen und schließlich das Ganze verstehen kann. Das Methodeninventar des Natural Language Processing liefert daher die Linguistik und hier vor allem die Computerlinguistik. Am anschaulichsten wird die Funktionsweise eines NLP-Systems, wenn man die einzelnen Phasen von Sprache und Sprachverarbeitung Schicht für Schicht unter die Lupe nimmt. Je nachdem, ob gesprochener oder geschriebener Text verarbeitet wird, steht einer der folgenden Aspekte im Mittelpunkt.
Egal, ob es sich um Input in Form einer Audio-Datei oder geschriebenen Text handelt: Um in späteren Schritten die Bedeutung einer Äußerung zu erkennen, muss ein NLP-System die Eingabe in einzelne Bestandteile zerlegen.
Ein NLP-System nimmt gesprochene Eingaben auf, analysiert und übersetzt die Schallwellen in ein digitales Signal und interpretiert die Daten anschließend nach einem Regelwerk oder durch Vergleich mit einem zugrundeliegenden Sprachmodell. Die linguistischen Teildisziplinen Phonologie und Phonetik bilden bei der Spracherkennung die theoretischen Grundlagen.
Auf der Ebene von Sätzen und Phrasen, der Syntax, ermittelt Natural Language Processing die grammatikalische Struktur einer Äußerung. Unterhalb der Syntax bestimmen morphologische Verfahren einzelne Wörter und deren Einheiten. Ziel ist es hierbei, auf der lexikalischen Ebene die Bedeutung jedes einzelnen Begriffes zu verstehen und so die Voraussetzung für das Verständnis der gesamten Äußerung zu schaffen.
Im Zusammenspiel aus Informationen über Struktur eines Satzes und der Bedeutung einzelner Teile ergeben sich Hinweise auf die Bedeutung eines Satzes. Die einzelnen Teile in einen Kontext einzuordnen und so idealerweise mehrere Elemente einer zusammenhängenden Aussage korrekt zu verstehen, ist schließlich Aufgabe der Semantik.
Unterschiedliche, der Semantik zuzuordnende Verfahren können in einem NLP-System einen Beitrag leisten oder Teilaspekte liefern. Dazu zählen etwa die Named Entity Recognition (Entitäten-Extraktion), die Sentiment-Analyse oder die Disambiguierung (Vereindeutigung).
Mehr zum Thema IT und Digitalisierung lesen Sie im IT-Channel von buchreport und Channel-Partner knk.
Hier mehr…
Natural Language Processing in der Praxis – drei Beispiele
- Chatbots
Laut Gartner werden bis 2022 70% der Kundeninteraktionen ohne menschliche Eingriffe auskommen und komplett automatisiert sein. 2018 waren es noch 15%. Und in der Tat werden bereits heute zahlreiche Kundenanfragen via Chatbots, die häufig auf Künstlicher Intelligenz basieren, bearbeitet. Sie verwenden Natural Language Processing – im engeren Sinne eine Kombination aus Natural Language Understanding und Natural Language Generation – um Anfragen zu verstehen und Fragen angemessen, automatisch und in Echtzeit zu beantworten.
- Mailautomatisierung
Autokorrektur, Grammatik- und Rechtschreibprüfung sowie Autocomplete sind Funktionen, die durch NLP ermöglicht werden. Ebenso verwendet der Spamfilter in zahlreichen E-Mail-Systemen Natural Language Processing, um festzustellen, welche E-Mails besser aussortiert werden sollten.
- Sentiment-Analyse
Natural Language Processing kann u.a. das Media Monitoring für Unternehmen durch sogenannte Sentiment-Analyse verfeinern: Indem relevante Informationen aus Quellen wie Social Media oder News identifiziert und extrahiert und anschließend die Stimmung dieser Informationen bewertet werden, können Unternehmen kritische Kommunikation frühzeitig erkennen und gegebenenfalls gegensteuern.
Anwendungen, in denen Natural Language Processing steckt
Die Anfänge von Natural Language Processing gehen zurück in die vierziger Jahre des 20. Jahrhunderts. NLP war damals eine eher theoretische Disziplin, die vor allem in amerikanischen Universitäten und Forschungsinstitutionen gepflegt wurde. Mehrere Jahrzehnte lang entwickelte sie sich nur langsam fort. Erst mit der leistungsfähigen Hardware von heute und Innovationen wie Maschinellem Lernen ist Natural Language Processing ein hochdynamisches Feld geworden.
Dieser Aufschwung ist mit Sicherheit noch längst nicht am Ende angelangt. Aber bereits jetzt bildet natürliche Sprachverarbeitung die Grundlage zahlreicher spezieller Anwendungen, die heute den Alltag vieler Verbraucher bestimmen:
- Intelligente Online-Suchfunktionen komplettieren die Eingaben eines Users
- Spam-Filter erkennen die Inhalte von E-Mails
- Textanalysen prüfen Dokumente wie Verträge auf formale und inhaltliche Fehler
- Chatbots verarbeiten Eingaben eines Nutzers und antworten adäquat
- Virtuelle Sprachassistenten verstehen Spracheingaben und formulieren Output
- Maschinelles Übersetzen von Texten sorgt für Arbeitserleichterung.
Mit freundlicher Genehmigung von Retresco.
Kommentar hinterlassen zu "Was ist Natural Language Processing?"