Modelos de inteligencia artificial generativa y grandes modelos de lenguaje(LLM): Análisis sistemático basado en metodología PRISMA de evolución, rendimiento y aplicaciones (2020-2025)
DOI:
https://doi.org/10.69639/arandu.v12i3.1543Palabras clave:
grandes modelos de lenguaje, inteligencia artificial generativa, transformers, evaluación de modelos, análisis sistemáticoResumen
El presente trabajo presenta un análisis sistemático basado en metodología PRISMA que examina 89 estudios primarios y 20 fuentes de alta calidad sobre Inteligencia Artificial Generativa (IAGen) y los grandes modelos del lenguaje (LLM, Large Language Models), publicados entre 2020-2025. La revisión identifica más de 50 LLMs existentes y documenta aplicaciones en 10 dominios críticos, estableciendo un marco de evaluación destinado a orientar futuras investigaciones. Los hallazgos revelan que GPT-4 (88.7% MMLU), Claude 3.5 Sonnet, y los modelos emergentes de razonamiento como DeepSeek-R1 lideran el rendimiento actual, siendo aplicados principalmente en atención sanitaria (94.4% de estudios), educación, desarrollo de software, e investigación científica. Los resultados demuestran mejoras significativas de eficiencia: 40% reducción en tiempo de documentación clínica, 35% incremento en productividad de desarrollo de software, y 58% reducción en tiempo de revisiones sistemáticas. El sector evoluciona aceleradamente hacia capacidades de razonamiento especializado, con modelos como DeepSeek-R1 alcanzando 97.3% en MATH-500, multimodalidad nativa que permite procesamiento integrado de texto, imagen, audio y video, y democratización mediante modelos de código abierto competitivos como LLaMA-4. Los desafíos persistentes incluyen alucinaciones (15-25% de resultados), sesgo cultural documentado, y necesidad urgente de marcos éticos estandarizados para aplicaciones críticas que requieren garantías de seguridad.
Descargas
Citas
Boiko, D. A., et al. (2023). "Autonomous chemical research with large language models." Nature, 619, 423-428. DOI: https://doi.org/10.1038/s41586-023-06792-0 .
Bommasani, R., et al. (2022). "Holistic Evaluation of Language Models (HELM)." Transactions on Machine Learning Research. DOI: https://doi.org/10.48550/arXiv.2211.09110 .
Brown, T., et al. (2020). "Language Models are Few-Shot Learners." Advances in Neural Information Processing Systems, 33, 1877-1901. DOI: https://doi.org/10.48550/arXiv.2005.14165 .
Chang, Y., et al. (2024). "A Survey on Evaluation of Large Language Models." ACM Transactions on Intelligent Systems and Technology, 15(3). DOI: https://doi.org/10.1145/3641289
García-Peñalvo, F.J. (2024). "La nueva realidad de la educación ante los avances de la inteligencia artificial generativa." RIED-Revista Iberoamericana de Educación a Distancia, 27(1), 15-31. DOI: https://doi.org/10.5944/ried.27.1.37716
Hendrycks, D., et al. (2020). "Measuring Massive Multitask Language Understanding." ICLR. DOI: https://doi.org/10.48550/arXiv.2009.03300 .
Hoffmann, J., et al. (2022). "Training Compute-Optimal Large Language Models." NeurIPS. DOI: https://doi.org/10.48550/arXiv.2203.15556 .
Luo, X., et al. (2024). "Large language models surpass human experts in predicting neuroscience results." Nature Human Behaviour. DOI: https://doi.org/10.1038/s41562-024-02046-9 .
McKinsey Global Institute. (2023, junio 14). The economic potential of generative AI: The next productivity frontier. McKinsey & Company. https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier
Mendoza-Castillo, L. et al. (2024). "Perspectiva de estudiantes de nivel medio superior respecto al uso de la inteligencia artificial generativa en su aprendizaje." Apertura, 16(1), 628-647. DOI: https://doi.org/10.32870/Ap.v16n1.2343
Ouyang, L., et al. (2022). "Training language models to follow instructions with human feedback." NeurIPS. DOI: https://doi.org/10.48550/arXiv.2203.02155
Singhal, K., et al. (2023). "Large language models encode clinical knowledge." Nature, 620, 172-180. DOI: https://doi.org/10.1038/s41586-023-06291-2
Vaswani, A., et al. (2017). "Attention Is All You Need." NIPS, 5998-6008. DOI: https://doi.org/10.5555/3295222.3295349
Wei, J., et al. (2022). "Emergent Abilities of Large Language Models." Transactions on Machine Learning Research. DOI: https://doi.org/10.48550/arXiv.2206.07682
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Rodrigo Aryan Hernández García, Cesar Augusto Mejia Gracia, Vicente Josue Aguilera Rueda, Carlos Francisco Domínguez Domínguez , Luis Enrique Corona Morales

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.