Array

Desambiguación en Lingüística y Lingüística Computacional

Person of ambiguous identity

En lingüística, la desambiguación es el proceso de determinar qué sentido de una palabra se usa en un contexto particular. También conocida como desambiguación léxica .

En lingüística computacional, este proceso discriminatorio se llama desambiguación de sentido de palabra (WSD) .

Ejemplos y observaciones

& amp; quot; Sucede que nuestra comunicación, en diferentes idiomas por igual, permite que la misma forma de palabra se use para significar cosas diferentes en transacciones comunicativas individuales. La consecuencia es que uno tiene que descubrir, en una transacción en particular, el significado previsto de una palabra dada entre sus sentidos potencialmente asociados. Si bien las ambigüedades que surgen de tales asociaciones de múltiples formas están en el nivel léxico, a menudo tienen que resolverse mediante un contexto más amplio del discurso que incorpora la palabra. De ahí los diferentes sentidos de la palabra & amp; apos; service & amp; apos; solo se podría distinguir si se podía mirar más allá de la palabra misma, como en contraste con el servicio de jugador y apostos en Wimbledon & amp; apos; con & amp; apos; the waiter & amp; apos; s en Sheraton.& amp; apos; Este proceso de identificación de significados de palabras en un discurso se conoce generalmente como desambiguación del sentido de la palabra (WSD).& amp; quot; (Oi Yee Kwong, Nuevas perspectivas sobre estrategias computacionales y cognitivas para la desambiguación del sentido de la palabra . Springer, 2013)

Video destacado

Desambiguación léxica y desambiguación del sentido de la palabra (WSD)

& amp; quot; La desambiguación léxica en su definición más amplia es nada menos que determinar el significado de cada palabra en contexto, que parece ser un proceso en gran medida inconsciente en las personas. Como problema computacional, a menudo se describe como & amp; apos; AI-complete, & amp; apos; es decir, un problema cuya solución presupone una solución para completar la comprensión del lenguaje natural o el razonamiento de sentido común (Ide y V & amp; # xE9; ronis 1998).

& amp; quot; En el campo de la lingüística computacional, el problema generalmente se llama desambiguación del sentido de la palabra (WSD) y se define como el problema de determinar computacionalmente qué & amp; apos; sense & amp; apos; de una palabra se activa mediante el uso de la palabra en un contexto particular. WSD es esencialmente una tarea de clasificación: los sentidos de las palabras son las clases, el contexto proporciona la evidencia y cada aparición de una palabra se asigna a una o más de sus posibles clases en función de la evidencia. Esta es la caracterización tradicional y común de WSD que lo ve como un proceso explícito de desambiguación con respecto a un inventario fijo de sentidos de palabras. Se supone que las palabras tienen un conjunto finito y discreto de sentidos de un diccionario, una base de conocimiento léxico o una ontología (en este último, los sentidos corresponden a conceptos que una palabra lexicaliza). También se pueden usar inventarios específicos de la aplicación. Por ejemplo, en una configuración de traducción automática (MT), uno puede tratar las traducciones de palabras como sentidos de palabras, un enfoque cada vez más factible debido a la disponibilidad de grandes corporaciones paralelas multilingües que pueden servir como datos de capacitación.

El inventario fijo de WSD tradicional reduce la complejidad del problema, pero existen campos alternativos . . ..& amp; quot; (Eneko Agirre y Philip Edmonds, & amp; quot; Introducción.& amp; quot; Desambiguación del sentido de la palabra: algoritmos y aplicaciones . Springer, 2007)
& lt; p / & gt ;

Homonimia y desambiguación

& amp; quot; La desambiguación léxica es muy adecuada particularmente para casos de homonimia, por ejemplo, una aparición de bajo debe asignarse a cualquiera de los elementos léxicos bass1 o bass2, dependiendo del significado previsto.

& amp; quot; La desambiguación exéxica implica una elección cognitiva y es una tarea que inhibe los procesos de comprensión. Debe distinguirse de los procesos que conducen a una diferenciación de los sentidos de las palabras. La tarea anterior se realiza de manera bastante confiable también sin mucha información contextual, mientras que la segunda no (cf. Veronis 1998, 2001). También se ha demostrado que las palabras homónimas, que requieren desambiguación, ralentizan el acceso léxico, mientras que las palabras polisémicas, que activan una multiplicidad de sentidos de palabras, aceleran el acceso léxico (Rodd e.a. 2002).

& amp; quot; sin embargo, tanto la modificación productiva de los valores semánticos como la elección directa entre elementos lexicamente diferentes tienen en común que requieren información no lírica adicional.& amp; quot; (Peter Bosch, & amp; quot; Productividad, Polisemia e Indexicalidad de predicado.& amp; quot; Lógica, lenguaje y computación: sexto simposio internacional de Tbilisi sobre lógica, lenguaje y computación , ed. por Balder D. ten Cate y Henk W. Zeevat. Springer, 2007)

Desambiguación de categoría léxica y el principio de probabilidad

& amp; quot; Corley y Crocker (2000) presentan un modelo de cobertura amplia de desambiguación de categoría léxica basado en el Principio de probabilidad . Específicamente, sugieren que para una oración que consiste en palabras w0 . . . wn , el procesador de oraciones adopta la secuencia más probable de parte del discurso t0 . . . tn . Más específicamente, su modelo explota dos probabilidades simples: ( yo ) La probabilidad condicional de la palabra wi dada una parte particular del discurso ti , y ( ii) ) la probabilidad de ti dada la parte anterior del discurso ti-1 . A medida que se encuentra cada palabra de la oración, el sistema le asigna esa parte del habla ti , que maximiza el producto de estas dos probabilidades. Este modelo capitaliza la idea de que muchas ambigüedades sintácticas tienen una base léxica (MacDonald et al., 1994), como en (3):

(3) Los precios / marcas del almacén son más baratos que el resto.

& amp; quot; Estas oraciones son temporalmente ambiguas entre una lectura en la que los precios o hacen es el verbo principal o parte de un sustantivo compuesto. Después de ser entrenado en un gran corpus, El modelo predice la parte más probable del discurso precios , contabilizando correctamente el hecho de que la gente entiende precio como sustantivo pero hace como verbo (ver Crocker & amp;amperio; Corley, 2002, y referencias citadas en el mismo). El modelo no solo representa una gama de preferencias de desambiguación enraizadas en la ambigüedad de la categoría léxica, sino que también explica por qué, en general, las personas son muy precisas para resolver tales ambigüedades.& amp; quot; (Matthew W. Crocker, & amp; quot; Modelos racionales de comprensión: abordar la paradoja del rendimiento.& amp; quot; Psicolingüística del siglo XXI: cuatro piedras angulares , ed. por Anne Cutler. Lawrence Erlbaum, 2005)

& amp; # x203A; Inglés

Dejar respuesta

Please enter your comment!
Please enter your name here

FOLLOW US

Related Stories