Realistische Sprachschnittstelle in Entwicklung

Ein EU-Team hat dazu beigetragen, die computergestützte Erkennung der menschlichen Sprache zu verbessern. Die Arbeit umfasste das Eingeben großer Mengen an Ausgangsmaterialien in einem vorstrukturierten Format in die Computer in Kombination mit neuen Algorithmen, die eine automatische Strukturierung gestatten.

Computer bleiben sind sehr begrenzt in Hinsicht auf die Interpretation der natürlichen menschlichen Kommunikation. Ein Grund dafür ist, dass das Hauptverfahren zur Befehlserteilung an Computer, die Expertenannotation, an sich schon langsam, teuer und unflexibel ist.

Das EU-finanzierte Projekt HELENLP (Heterogeneous learning for natural language processing) zielte darauf ab, Systeme zu entwickeln, die besser in der Lage sind, mit Menschen zu interagieren. Das Projekt konzentrierte sich auf verbesserte Leistungsfähigkeit durch Hinzufügen eines riesigen neuen Spektrums an digitalen Quellen und auf die Variation von Annotationsgraden. Unter Einsatz der geplanten Algorithmen könnten die Computer die Quellen durch Abfragen eines Annotators automatisch interpretieren. Das Team beabsichtigt, zusätzliche Annotationsalgorithmen mit dem Endziel der Verbesserung der Maschinenverständnisses für natürliche Sprache und natürlichen Text zu entwickeln.

Bei der Arbeit konzentrierte man sich auf neue theoretische und statistische Methoden zur Integration und Analyse von digitalen Quellen. Die Forscher entwickelten passive Wege der Annotation von teilweise annotierten Daten, ohne Annotator, sowie aktive Verfahren, bei denen ein Annotator zum Einsatz kommt. Die neuen Algorithmen widmeten sich gleichermaßen dem simultanen Lernen durch Kombination verschiedener Quellen annotierter Daten. Die Anwendungen beinhalten Textkategorisierung sowie Phonemsegmentierung und -erkennung.

Das Vorhaben erreichte sein Ziel, erneut eine starke Forschungsgruppe einzugliedern. Ein Forscherpool, zusätzliche Finanzmittel und Forschungspublikationen waren das Ergebnis dieser Arbeit.

Die neue Algorithmen von HELENLP können nun dazu beitragen, die computergestützte Verarbeitung der natürlichen menschlichen Kommunikation zu verbessern.

veröffentlicht: 2016-03-15
Kommentare


Privacy Policy