Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
搜索内容
搜索
Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
登录
包含标签:RLHF 的文章
LLM
【理论】RLHF实现框架
RLHF(Reinforcement Learning with Human Feedback)即带有人工反馈的强化学习。它是强化学习(RL)的一种变体,结合了人工反馈来提升学习过程的效率和效果。……
Zhang, Hongxing
2024年12月16日
110
0
Tag Cloud
Recent Posts
2025年二月学习总结
2025年一月学习总结
【理论】深度学习的三种并行方式
【理论】NLP语言模型概览-语言模型结构分类、BERT
【理论】GPT和Bert的区别