RM-NLHF - a Tongyi-ConvAI Collection

Tongyi-ConvAI 's Collections

updated Feb 25

Official collection for paper "Reward Modeling from Natural Language Human Feedback".