문제 › 220

220. RLHF

Hard 단답형 AICELLM단답형
문제 설명
ChatGPT가 사용한 학습 방법으로, 인간의 피드백을 통해 모델을 개선하는 기법은?
로그인하고 풀기 AI가 자동 채점하고 즉시 정답·해설을 알려줘요. 무료.