instruction-fine-tuning

Acronyme : IFT.

Aussi nommé : Reinforcement Learning with Human Feedback (RLHF).

Quitter le mode Zen