KI übertrifft Mensch bei Spracherkennung

Besser als der Mensch

Ein alltägliches Gespräch zu verfolgen und genau wiederzugeben ist eine große Herausforderung in der Forschung an künstlicher Intelligenz (KI). Forschern des Karlsruher Instituts für Technologie (KIT) ist es nun gelungen, mit einem Computersystem die Erkennungsgenauigkeit des Menschen beim Erkennen solcher spontan gesprochener Sprache zu übertreffen.

(Bild: ©WrightStudio/AdobeStock.com)

Schneller als andere Systeme

Ein Team aus KIT-Wissenschaftlern und Mitarbeitern der Firma KITES, einer Ausgründung aus dem KIT, hat nun ein Computersystem programmiert, das diese Aufgabe besser erledigt als Menschen und schneller als andere Systeme. Waibel hat bereits einen automatischen Live-Übersetzer entwickelt, der Universitätsvorlesungen aus dem Deutschen oder Englischen schritthaltend mit der Vorlesung in die Sprachen ausländischer Studierender überträgt. Der ‘Lecture Translator’ ist seit 2012 in den Hörsälen des KIT im Einsatz. “Die Erkennung spontaner Sprache ist die wichtigste Komponente in diesem System”, erläutert Waibel, “da Fehler und Verzögerungen bei der Erkennung die Übersetzung unverständlich machen. Die menschliche Fehlerrate liegt hier bei um die 5,5 Prozent. Unser System erreicht nun 5 Prozent.” Allerdings sei nicht nur die Genauigkeit ausschlaggebend, sondern auch, wie rasch das System das Ergebnis ausgibt, damit Studierende der Vorlesung live folgen können. Diese Verzögerung reduzierten die Forscher auf eine Sekunde. Das sei der niedrigste Latenz-Wert, den je ein Spracherkennungssystem dieser Qualität erreicht habe, betont Waibel. Gemessen werden Fehlerrate und Verzögerung mit dem standardisierten und wissenschaftlich international anerkannten ‘Switchboard-Benchmark’-Test.

Nur akustische Erkennung

Inhalte oder Zusammenhänge verstehen könne ein Erkennungs-System alleine aber noch nicht, so Waibel. “Es geht hier ausschließlich um die akustische Erkennung unter wissenschaftlich vergleichbaren Bedingungen.” Dialog-, Übersetzungs- und weitere KI Module können nun aber schneller und mit größerer Genauigkeit sprachliche Interaktion ermöglichen.

Das könnte Sie auch interessieren

Transition Technologies PSC eröffnet als Spezialist im Bereich der digitalen Transformation einen Firmensitz in Deutschland. Die Leitung übernimmt Stefan Zeiler.‣ weiterlesen

Anzeige

Ein Forschungsteam vom Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA hat ein Monitoringsystem für den niederschwelligen Einstieg in die digitale Produktion entwickelt. Damit können alten Bestandsmaschinen Daten entlockt werden. IT-Fachkenntnisse und Prozesswissen sind dafür nicht nötig.‣ weiterlesen

Anzeige

Mit dem QUTAC haben sich zehn Unternehmen in einem Konsortium zusammengeschlossen um industrielle Anwendungen für Quantencomputing zu entwickeln.‣ weiterlesen

Die digitale Fabrik dient dazu, Prozesse und Pläne zu testen, bevor diese in der realen Fabrik umgesetzt werden. Wie dieses digitale Abbild entsteht? Zu Beginn können bereits Bestandsdaten helfen.‣ weiterlesen

Eine Umfrage von Amazon Web Services (AWS) zeigt, dass Unternehmen durch die Pandemie ihre Pläne für die digitale Transformation beschleunigen und sich nach einem Jahr der Veränderungen 'neu erfinden'‣ weiterlesen

Exklusiv für Abonnenten

Die wenigsten Fertigungsumgebungen sind homogen. Maschinen unterschiedlicher Hersteller und unterschiedliche Steuerungen bringen Herausforderungen mit sich, wenn es darum geht, einen Wert aus ihren Daten zu ziehen. Bei FactoryPal will man diesen Herausforderungen mittels Machine Learning begegnen - unter Einbeziehung der Mitarbeiter.‣ weiterlesen