ChatGPT ya tiene una alternativa de código abierto, aunque usarlo no es nada fácil aunque ambos requiere conocimientos altos a nivel de programacion.
Para los que no saben que es ChatGPT es un prototipo de chatbot de inteligencia artificial desarrollado en 2022 por OpenAI que se especializa en el diálogo. El chatbot es un gran modelo de lenguaje ajustado con técnicas de aprendizaje tanto supervisadas como de refuerzo. Se basa en el modelo GPT-3.5 de OpenAI, una versión mejorada de GPT-3.
ChatGPT tiene costo para su uso por lo que hay empresas que se han dedicado a desarrollar algo similar de forma gratuita.
En términos generales, esta inteligencia artificial es una implementación de RLHF sobre la arquitectura PaLM. El modelo de lenguaje desarrollado por Google ha sido entrenado usando un conjunto de datos multilingües de alta calidad entre los que se incluyen libros, documentos, entradas de Wikipedia y código de GitHub. PaLM puede realizar razonamientos aritméticos, explicar chistes o adivinar la película a partir de un emoji.
PaLM + RLHF sería capaz de predecir las palabras usando el conjunto de datos y la retroalimentación humana. RLHF, presente en ChatGPT, usa un modelo de lenguaje entrenado previamente y tiene como objetivo alinearlo hacia los resultados que los usuarios esperan. Esto es posible gracias a un modelo de recompensa que define cómo se integran las preferencias humanas en un sistema.
Bloom, un modelo de código abierto que tiene una cifra parecida de parámetros a GPT-3, requirió tres meses de entrenamiento usando 384 tarjetas NVIDIA A1000, cada una con un valor estimado de 32.200 dólares. Como referencia, PaLM tiene 540.000 millones de parámetros.
Philip Wang menciona que incluso con el barco y mapa en la mano — como define a PaLM + RLHF — todavía se requiere de marinos profesionales para guiarlo a buen puerto. Otros expertos aseguran que no solo es necesario contar con hardware potente, sino también con una infraestructura adecuada y software capaz de llevar a cabo la tarea de entrenamiento.
De cualquier modo, si estás interesado en conocer más sobre PaLM + RLHF puedes acceder al repositorio de GitHub.
Comentarios
Publicar un comentario