prucommercialre.com


¿Qué es una lista de frecuencias?

Una lista de frecuencias es una herramienta para el análisis lingüístico cuantitativa, una lista de todo lo que aparece en un bloque de texto elegido y la frecuencia con que se produce. El análisis lingüístico es un campo interdisciplinario que estudia la estructura de la lengua y cómo se utiliza. Combinando elementos de la antropología, matemáticas, ciencias de la computación y la lógica, el análisis lingüístico se utiliza para proyectos como la traducción mecánica, la criptografía y el desciframiento de escrituras antiguas.

Listas de frecuencia pueden ser listas de palabras o de letras. Frecuencias de las letras normalmente se utilizan en la criptografía. Uno de los códigos más simple es un cifrado de sustitución, donde cada letra se sustituye con otra letra o símbolo. Por ejemplo, el "ataque al amanecer" mensaje puede ser codificado como "zoozhl zo azqp." El beneficio de códigos de sustitución es que no requieren un libro de códigos, pero la debilidad es que pueden ser descifradas mediante la comparación de la frecuencia de letras y combinaciones de letras en el mensaje a una lista de frecuencias de uso común.

En Arthur Conan Doyle Los bailarines, el detective de ficción Sherlock Holmes utiliza el análisis de frecuencia para romper un cifrado de sustitución. Históricamente, codemakers trataron varios trucos para hacer que sus sistemas de cifrado más difícil de descifrar con una lista de frecuencias: cifras ondulantes donde la sustitución utilizado dependía de la posición de una carta dentro del mensaje, la eliminación o la codificación de espacios para que las frecuencias de palabras no podían ser utilizados, se mantendrá el mensaje palabras cortas y evitando que se espera por lo descifradores de códigos no tendrían suficiente cantidad de muestra que se utilizará para el análisis de frecuencia. En última instancia, cualquier sistema de cifrado se puede romper con una muestra lo suficientemente grande, por lo que los protocolos de cifrado más sofisticados se han convertido en estándar.

Listas de frecuencia de palabras y tipos de palabras también se utilizan en estudios de idiomas antiguos. Cuando Jean-Francois Champollion tradujo el Rosetta Stone en la década de 1820, su proceso utiliza una mezcla de frecuencias que comparan y transliteraciones de reconstruir el lenguaje jeroglífico. Los estudios han demostrado que para las lenguas antiguas, como para Inglés moderno, un vocabulario básico de 1.500 a 2.000 palabras cubre el 85-90 por ciento de textos comunes, un nivel que permite al lector a ampliar su vocabulario de contexto.

La ley de Zipf, llamado así por profesor de lingüística de Harvard George Kingsley Zipf, es una observación empírica sobre el comportamiento de las calificaciones de frecuencia. Afirma que la frecuencia de un evento es inversamente proporcional a la clasificación del evento. El evento es generalmente una palabra o letra en una lista de frecuencias lingüística, pero la ley de Zipf se ha generalizado para cubrir otros fenómenos como las poblaciones de la ciudad y de los beneficios empresariales.

Una lista de frecuencias es una herramienta importante en proyectos para ayudar a los equipos tienen sentido del lenguaje hablado y escrito. Traducción mecánica - el uso de computadoras para traducir documentos de un idioma a otro - es un ejemplo. Otro ejemplo es el de Watson, el superordenador de lenguaje natural que se lució como concursante en el programa de televisión Jeopardy! En febrero de 2011. Las frecuencias tanto de las palabras y de los tipos de uso se incorporan a su programación como herramienta para la búsqueda de significado.

  • La primera traducción de los jeroglíficos consistió en comparar las frecuencias.
  • Una lista de frecuencias es una herramienta para el análisis lingüístico cuantitativo.