OpenAI anunció la semana pasada que está entrenando un nuevo modelo de IA llamado… «CriticGPT», que es capaz de detectar errores en la salida del código ChatGPT. Según la empresa, cuando los usuarios reciben ayuda de la tecnología para revisar el código generado, superan la precisión de los resultados en el 60% de los casos.
Con el tiempo, ChatGPT se vuelve más preciso y sus errores se vuelven más sutiles. Esto puede dificultar la detección de imprecisiones y errores de salida cuando ocurren. Con esto, CriticGPT puede escribir «reseñas» que destaquen imprecisiones en las respuestas del chatbot que de otro modo podrían pasar desapercibidas para los humanos.
CriticGPT se basa en el conjunto de modelos GPT-4, que está diseñado para reforzar el aprendizaje basado en la retroalimentación humana, un sistema llamado Aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). Esta técnica consiste en un análisis comparativo en el que los usuarios de AI Trainer evalúan las respuestas de ChatGPT.
Se enfatiza que las sugerencias hechas por el nuevo modelo pueden no siempre ser correctas, sin embargo Ayudar a los formadores a descubrir muchos problemas Con respuestas escritas por otros modelos. Su flexibilidad permite adaptarse a diferentes actividades formativas más allá de la revisión del código de programación.
Los investigadores intentaron aplicar el nuevo modelo a un subconjunto de datos de entrenamiento de ChatGPT que el equipo de entrenadores humanos había calificado como «impecable». Sin embargo, CriticGPT encontró errores e inexactitudes en el 24% de los casos que los revisores habían considerado perfectos anteriormente.
CriticGPT todavía tiene ciertas limitaciones. Por ejemplo, fue entrenado con información relativamente corta generada por ChatGPT, por lo que aún no está claro si hay comentarios sobre la efectividad del modelo en tareas más grandes y complejas. Además, todavía tiene inteligencia artificial y puede tener sus propias «alucinaciones».
proteccion
27 de junio
curiosidad
junio 21
OpenAI dice que planea integrar el nuevo modelo en su sistema de aprendizaje reforzado con retroalimentación humana para brindar soporte basado en inteligencia artificial a sus entrenadores y simplificar la evaluación de resultados de servicios como ChatGPT.
¡Ver más!