RLHF
Aprendizaje por refuerzo con retroalimentación humana en modelos de lenguaje.
-
En los últimos años, los modelos de inteligencia artificial han dado saltos extraordinarios. Pero detrás de su comportamiento cada vez más natural, coherente y útil, hay un ingrediente poco conocido pero fundamental: el Aprendizaje por Refuerzo con Retroalimentación Humana, conocido como RLHF (por sus siglas en inglés: Reinforcement Learning with Human Feedback).