Modelos de inteligencia artificial generativa y grandes modelos de lenguaje(LLM): Análisis sistemático basado en metodología PRISMA de evolución, rendimiento y aplicaciones (2020-2025)

Autores/as

DOI:

https://doi.org/10.69639/arandu.v12i3.1543

Palabras clave:

grandes modelos de lenguaje, inteligencia artificial generativa, transformers, evaluación de modelos, análisis sistemático

Resumen

El presente trabajo presenta un análisis sistemático basado en metodología PRISMA que examina 89 estudios primarios y 20 fuentes de alta calidad sobre Inteligencia Artificial Generativa (IAGen) y los grandes modelos del lenguaje (LLM, Large Language Models), publicados entre 2020-2025. La revisión identifica más de 50 LLMs existentes y documenta aplicaciones en 10 dominios críticos, estableciendo un marco de evaluación destinado a orientar futuras investigaciones. Los hallazgos revelan que GPT-4 (88.7% MMLU), Claude 3.5 Sonnet, y los modelos emergentes de razonamiento como DeepSeek-R1 lideran el rendimiento actual, siendo aplicados principalmente en atención sanitaria (94.4% de estudios), educación, desarrollo de software, e investigación científica. Los resultados demuestran mejoras significativas de eficiencia: 40% reducción en tiempo de documentación clínica, 35% incremento en productividad de desarrollo de software, y 58% reducción en tiempo de revisiones sistemáticas. El sector evoluciona aceleradamente hacia capacidades de razonamiento especializado, con modelos como DeepSeek-R1 alcanzando 97.3% en MATH-500, multimodalidad nativa que permite procesamiento integrado de texto, imagen, audio y video, y democratización mediante modelos de código abierto competitivos como LLaMA-4. Los desafíos persistentes incluyen alucinaciones (15-25% de resultados), sesgo cultural documentado, y necesidad urgente de marcos éticos estandarizados para aplicaciones críticas que requieren garantías de seguridad.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Boiko, D. A., et al. (2023). "Autonomous chemical research with large language models." Nature, 619, 423-428. DOI: https://doi.org/10.1038/s41586-023-06792-0 .

Bommasani, R., et al. (2022). "Holistic Evaluation of Language Models (HELM)." Transactions on Machine Learning Research. DOI: https://doi.org/10.48550/arXiv.2211.09110 .

Brown, T., et al. (2020). "Language Models are Few-Shot Learners." Advances in Neural Information Processing Systems, 33, 1877-1901. DOI: https://doi.org/10.48550/arXiv.2005.14165 .

Chang, Y., et al. (2024). "A Survey on Evaluation of Large Language Models." ACM Transactions on Intelligent Systems and Technology, 15(3). DOI: https://doi.org/10.1145/3641289

García-Peñalvo, F.J. (2024). "La nueva realidad de la educación ante los avances de la inteligencia artificial generativa." RIED-Revista Iberoamericana de Educación a Distancia, 27(1), 15-31. DOI: https://doi.org/10.5944/ried.27.1.37716

Hendrycks, D., et al. (2020). "Measuring Massive Multitask Language Understanding." ICLR. DOI: https://doi.org/10.48550/arXiv.2009.03300 .

Hoffmann, J., et al. (2022). "Training Compute-Optimal Large Language Models." NeurIPS. DOI: https://doi.org/10.48550/arXiv.2203.15556 .

Luo, X., et al. (2024). "Large language models surpass human experts in predicting neuroscience results." Nature Human Behaviour. DOI: https://doi.org/10.1038/s41562-024-02046-9 .

McKinsey Global Institute. (2023, junio 14). The economic potential of generative AI: The next productivity frontier. McKinsey & Company. https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier

Mendoza-Castillo, L. et al. (2024). "Perspectiva de estudiantes de nivel medio superior respecto al uso de la inteligencia artificial generativa en su aprendizaje." Apertura, 16(1), 628-647. DOI: https://doi.org/10.32870/Ap.v16n1.2343

Ouyang, L., et al. (2022). "Training language models to follow instructions with human feedback." NeurIPS. DOI: https://doi.org/10.48550/arXiv.2203.02155

Singhal, K., et al. (2023). "Large language models encode clinical knowledge." Nature, 620, 172-180. DOI: https://doi.org/10.1038/s41586-023-06291-2

Vaswani, A., et al. (2017). "Attention Is All You Need." NIPS, 5998-6008. DOI: https://doi.org/10.5555/3295222.3295349

Wei, J., et al. (2022). "Emergent Abilities of Large Language Models." Transactions on Machine Learning Research. DOI: https://doi.org/10.48550/arXiv.2206.07682

Descargas

Publicado

2025-10-07

Cómo citar

Hernández García, R. A., Mejia Gracia, C. A., Aguilera Rueda, V. J., Domínguez Domínguez , C. F., & Corona Morales , L. E. (2025). Modelos de inteligencia artificial generativa y grandes modelos de lenguaje(LLM): Análisis sistemático basado en metodología PRISMA de evolución, rendimiento y aplicaciones (2020-2025). Arandu UTIC, 12(3), 3123–3134. https://doi.org/10.69639/arandu.v12i3.1543

Número

Sección

Ciencias y Tecnologías

Artículos similares

<< < 5 6 7 8 9 10 11 12 13 14 > >> 

También puede Iniciar una búsqueda de similitud avanzada para este artículo.