` ChatGPT no conoce el 20% del léxico español y en el 80% restante comete errores - Monitoreamos
Monitoreamos
  • Inicio
  • Presidenciales
  • Venezuela
  • Mundo
  • Negocios
  • Entretenimiento
  • Salud
  • Tecnología
  • Deporte
Sin resultados
Ver todos los resultados
Monitoreamos
Sin resultados
Ver todos los resultados

Portada » ChatGPT no conoce el 20% del léxico español y en el 80% restante comete errores

ChatGPT no conoce el 20% del léxico español y en el 80% restante comete errores

Redacción MonitoreamosporRedacción Monitoreamos
13 noviembre 2023
en Tecnología
0
0
COMPARTIDO
FacebookTwitterWhatsapp

Desde que llegó al mercado hace un año, ChatGPT, una inteligencia artificial capaz de crear contenidos originales y tareas relacionadas con la lengua, se ha convertido en una herramienta de enorme popularidad. Ahora, un estudio señala que desconoce el 20 % del léxico español y que comete errores en el 80 % restante.

Según datos de OpenAI -la empresa que creadora-, cada semana, cien millones de personas usan este chatbot para hacer tareas relacionadas con el lenguaje.

Pero aunque esta herramienta está entrenada para mantener conversaciones y generar textos, se sabe que puede producir respuestas que parecen plausibles pero que son completamente erróneas.

Para evaluar el rendimiento de ChatGPT y su capacidad real, un equipo de investigadores españoles ha desarrollado una aplicación, denominada ChatWord, que permite evaluar el conocimiento léxico de ChatGPT en varios idiomas.

Para ello, se usó como referencia las palabras recogidas en el diccionario de la Real Academia de la Lengua y las que aparecen en El Quijote de Miguel de Cervantes.

El estudio reveló que de las más de 90.000 palabras incluidas en el diccionario de la Real Academia de la Lengua, el modelo ChatGPT3.5turbo desconoce aproximadamente el 20 %, es decir, unas 18.000 palabras.

Además, del 80 % restante de las palabras del diccionario y del 90 % de las palabras del Quijote, ChatGPT cometió errores en cerca del 5 % de los términos.

NoticiasRelacionadas

La ruta de Santa Claus: tecnología y tradición en Navidad

24 diciembre 2025

La plataforma musical Spotify sufre un robo masivo de datos

23 diciembre 2025

Un conocimiento muy pobre

El estudio recuerda que un hispanohablante reconoce 30.000 palabras de media, es decir, casi un tercio del léxico español, un dato que puede parecer pobre comparado al de una máquina, advierten los autores.

Pero, «como pasa muchas veces con los sistemas de inteligencia artificial, no es oro todo lo que reluce, y al analizar los significados que da ChatGPT de las palabras, vemos que hay un porcentaje no despreciable en que el sentido que señala es incorrecto», explica Javier Conde, coautor del trabajo.

«Quizás ChatGPT no sea hoy en día tan sabio como aparenta», añade.

Además, el estudio recuerda que los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés), basados en inteligencia artificial y diseñados para procesar y comprender lenguaje natural en una escala enorme -como ChatGPT- no usan palabras que no conocen.

Pero para Pedro Reviriego, también coautor de la investigación, el dato es preocupante porque si estos sistemas solo usan las palabras que conocen, resulta «muy factible un escenario en que el contenido recién generado tenga un número cada vez menor de palabras distintas», y de escasa riqueza léxica, avisa.

La aplicación ChatWords es un sistema de acceso público, diseñada para ser fácil de usar y ampliar.

Los investigadores quieren evaluar otros idiomas y LLM para comprender mejor el conocimiento léxico que tienen las herramientas de inteligencia artificial y cómo evoluciona a medida que aparecen nuevas versiones y herramientas.

EFE

FacebookTwitterWhatsapp

Noticias Relacionadas

Tecnología

La ruta de Santa Claus: tecnología y tradición en Navidad

24 diciembre 2025
Tecnología

La plataforma musical Spotify sufre un robo masivo de datos

23 diciembre 2025
Tecnología

El cometa 3I/ATLAS alcanza su máximo acercamiento al planeta Tierra

18 diciembre 2025
Siguiente publicación

La Unión Europea prorrogó hasta el 14 de mayo de 2024 sus sanciones contra el régimen

Deportes

Mundial 2026: México lanza programa de formación en inglés en restaurantes y hoteles

13 enero 2026

Foto https://www.fifamuseum.com

El museo de la FIFA expone el trofeo del Mundial de Clubes 2025

13 enero 2026

Mbappé, Rodrygo y Mendy, ausentes en el primer entrenamiento con Álvaro Arbeloa

13 enero 2026

Así va el round robin 2025-2026: Cardenales de Lara lidera y Navegantes del Magallanes detrás de la ambulancia

12 enero 2026

Mundo

FILE PHOTO: Costa Rica's former President Laura Chinchilla speaks during a news conference in Caracas, Venezuela, July 17, 2017. REUTERS/Andres Martinez Casares/File Photo

Laura Chinchilla advierte que Latinoamérica ha perdido relevancia por su fragmentación

14 enero 2026

Ex rehenes italianos revelan el horror vivido en prisión venezolana: “Era peor que Alcatraz”

13 enero 2026

Bill y Hillary Clinton rechazan testificar en el Congreso por el caso Jeffrey Epstein

13 enero 2026

Marco Rubio recibe al canciller de Panamá y conversaron sobre el tema Venezuela

13 enero 2026

  • Inicio
  • Presidenciales
  • Venezuela
  • Mundo
  • Negocios
  • Entretenimiento
  • Salud
  • Tecnología
  • Deporte

© 2020 Monitoreados - Todos los derechos reservados.

Sin resultados
Ver todos los resultados
  • Inicio
  • Presidenciales
  • Venezuela
  • Mundo
  • Negocios
  • Entretenimiento
  • Salud
  • Tecnología
  • Deporte

© 2020 Monitoreados - Todos los derechos reservados.