About: Word error rate     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : owl:Thing, within Data Space : dbpedia.demo.openlinksw.com associated with source document(s)
QRcode icon
http://dbpedia.demo.openlinksw.com/describe/?url=http%3A%2F%2Fdbpedia.org%2Fresource%2FWord_error_rate&invfp=IFP_OFF&sas=SAME_AS_OFF

Word error rate (WER) is a common metric of the performance of a speech recognition or machine translation system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence (supposedly the correct one). The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. The WER is a valuable tool for comparing different systems as well as for evaluating improvements within one system. This kind of measurement, however, provides no details on the nature of translation errors and further work is therefore required to identify the main source(s) of error and to focus any research effort.

AttributesValues
rdfs:label
  • Word Error Rate (ca)
  • Hitz errore-tasa (eu)
  • Word Error Rate (es)
  • Taux d'erreur de mots (fr)
  • Word error rate (en)
rdfs:comment
  • WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática. (es)
  • Word Error Rate (WER) és una mesura utilitzada habitualment en l'avaluació de sistemes de reconeixement de la parla o de traducció automàtica. Calcula el nombre mínim d'insercions, esborrats i substitucions d'una paraula per una altra, necessaris per transformar una frase en una altra. Aquesta mesura es basa en la distància d'edició o de Levensthein, amb l'excepció que aquesta última es calcula a nivell de lletra i WER ho fa a nivell de paraula. on Per trobar el valor mínim de WER entre dos frases s'utilitza un algorisme de programació dinàmica. (ca)
  • Hitz errore-tasa (Ingelesez, Word Error Rate edo WER) ahots-hautematearen edo itzulpengintza-automatikoko sistemen portaeraren neurketa metodo arrunta da. Errendimendua neurtzeko zailtasun orokorra aitortzen den hitz sekuentzian erreferentziaren sekuentzian luzapen desberdina izan daitekeela uste da (ustez zuzena). WER tik dator, hitz-mailan lan egiten duena, fonema- mailaren ordez. WER sistema, sistema baten hobekuntzak ebaluatzeko edota sistema ezberdinak alderatzeko tresna baliagarria da. Hala ere, neurketa mota honek ez du xehetasunik eskaintzen erroreen akatsen izaerari buruz; beraz, esfortzu gehiago beharrezkoa da errore-iturri nagusia(k) identifikatzeko eta edozein ikerketa-esfortzutan zentratzeko . (eu)
  • Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance de la parole. Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Plus le taux est faible (minimum 0.0) plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions. où : (fr)
  • Word error rate (WER) is a common metric of the performance of a speech recognition or machine translation system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence (supposedly the correct one). The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. The WER is a valuable tool for comparing different systems as well as for evaluating improvements within one system. This kind of measurement, however, provides no details on the nature of translation errors and further work is therefore required to identify the main source(s) of error and to focus any research effort. (en)
dcterms:subject
Wikipage page ID
Wikipage revision ID
Link from a Wikipage to another Wikipage
Link from a Wikipage to an external page
sameAs
has abstract
  • Word Error Rate (WER) és una mesura utilitzada habitualment en l'avaluació de sistemes de reconeixement de la parla o de traducció automàtica. Calcula el nombre mínim d'insercions, esborrats i substitucions d'una paraula per una altra, necessaris per transformar una frase en una altra. Aquesta mesura es basa en la distància d'edició o de Levensthein, amb l'excepció que aquesta última es calcula a nivell de lletra i WER ho fa a nivell de paraula. En tasques tant de traducció automàtica com de reconeixement de la parla, es calcula WER entre la frase generada pel sistema i una frase de referència correcta. on * S és el nombre de substitucions, * B és el nombre d'esborrats, * I és el nombre d'insercions, * N és el nombre de paraules que té la frase de referència. Per trobar el valor mínim de WER entre dos frases s'utilitza un algorisme de programació dinàmica. Si considerem que són les primeres paraules de la frase generada i les primeres de la frase de referència: on és 1 si les paraules i són diferents i 0 si són iguals. (ca)
  • Hitz errore-tasa (Ingelesez, Word Error Rate edo WER) ahots-hautematearen edo itzulpengintza-automatikoko sistemen portaeraren neurketa metodo arrunta da. Errendimendua neurtzeko zailtasun orokorra aitortzen den hitz sekuentzian erreferentziaren sekuentzian luzapen desberdina izan daitekeela uste da (ustez zuzena). WER tik dator, hitz-mailan lan egiten duena, fonema- mailaren ordez. WER sistema, sistema baten hobekuntzak ebaluatzeko edota sistema ezberdinak alderatzeko tresna baliagarria da. Hala ere, neurketa mota honek ez du xehetasunik eskaintzen erroreen akatsen izaerari buruz; beraz, esfortzu gehiago beharrezkoa da errore-iturri nagusia(k) identifikatzeko eta edozein ikerketa-esfortzutan zentratzeko . Arazo hau, hasieran ezagutzen den hitz-sekuentzia erreferentziaren (ahozko) hitz-sekuentziarekin lerrokatuz konpontzen da, horretarako kate dinamikoaren lerrokatzea erabiltzen da. Gai honen azterketa, "perpausaren eta hitzaren erroreen arteko korrelazioa adierazten duen botere legea" izena duen teorian ikusi daiteke. Hitzen errore-tasa kalkulatzeko, honela kalkulatu daiteke: non * S ordezkapenen kopurua da, * D ezabatze kopurua da, * I txertaketa kopurua da, * C hitz zuzenen kopurua da, * N, (N = S + D + C) erreferentziaren hitz kopurua da. "Ezabatzea" eta "txertaketa" atzean dagoen intuisioa da nola heltzen garen erreferentzia batetik hipotesi batera. Beraz, "Hau da wikipedia" erreferentzia badaukagu eta "Hau _ wikipedia" hipotesia, ezabaketa deituko diogu. Hizketa-hautemate sistema baten errendimendua jakinarazten denean, batzuetan, hitz zehaztasuna (Ingelesez, Word accuracy edo WAcc) erabiltzen da horren ordez: non * H, N-(S+D) den, ongi ezagutu diren hitz kopurua. I= 0 baldin bada, orduan, WAcc, zuzen ezagututako 'H' hitzen tasa bat , 'N'-ren hitz guztien kopurura atzera-egitearen (informazio-berreskuratzea) baliokidea izango da. Kontuan izan N, erreferentziaren hitz kopurua dela eta, hitzaren errore-tasa 1.0 baino handiagoa izan daiteke eta, beraz, hitzaren zehaztasuna 0.0 baino txikiagoa izan daiteke. (eu)
  • WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática. (es)
  • Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance de la parole. Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Plus le taux est faible (minimum 0.0) plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions. Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par : où : * est le nombre de mots de référence, * est le nombre de substitutions (mots incorrectement reconnus), * est le nombre de suppressions (mots omis), * est le nombre d'insertions (mots ajoutés), * est le nombre de mots correctement reconnus. Le taux de reconnaissance de mots, ou word accuracy (WAcc) en anglais, est défini ainsi : Ce taux de reconnaissance peut être négatif. (fr)
  • Word error rate (WER) is a common metric of the performance of a speech recognition or machine translation system. The general difficulty of measuring performance lies in the fact that the recognized word sequence can have a different length from the reference word sequence (supposedly the correct one). The WER is derived from the Levenshtein distance, working at the word level instead of the phoneme level. The WER is a valuable tool for comparing different systems as well as for evaluating improvements within one system. This kind of measurement, however, provides no details on the nature of translation errors and further work is therefore required to identify the main source(s) of error and to focus any research effort. This problem is solved by first aligning the recognized word sequence with the reference (spoken) word sequence using dynamic string alignment. Examination of this issue is seen through a theory called the power law that states the correlation between perplexity and word error rate. Word error rate can then be computed as: where * S is the number of substitutions, * D is the number of deletions, * I is the number of insertions, * C is the number of correct words, * N is the number of words in the reference (N=S+D+C) The intuition behind 'deletion' and 'insertion' is how to get from the reference to the hypothesis. So if we have the reference "This is wikipedia" and hypothesis "This _ wikipedia", we call it a deletion. When reporting the performance of a speech recognition system, sometimes word accuracy (WAcc) is used instead: Note that since N is the number of words in the reference, the word error rate can be larger than 1.0, and thus, the word accuracy can be smaller than 0.0. (en)
prov:wasDerivedFrom
page length (characters) of wiki page
foaf:isPrimaryTopicOf
is Link from a Wikipage to another Wikipage of
is Wikipage redirect of
is Wikipage disambiguates of
is foaf:primaryTopic of
Faceted Search & Find service v1.17_git139 as of Feb 29 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 08.03.3330 as of Mar 19 2024, on Linux (x86_64-generic-linux-glibc212), Single-Server Edition (378 GB total memory, 67 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software