Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
搜索内容
搜索
Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
登录
包含标签:RLHF 的文章
LLM
【理论学习】RLHF实现框架
RLHF(Reinforcement Learning with Human Feedback)即带有人工反馈的强化学习。它是强化学习(RL)的一种变体,结合了人工反馈来提升学习过程的效率和效果。……
Zhang, Hongxing
2024年12月16日
196
0
Tag Cloud
Recent Posts
2025年五月学习总结
【重点】Bert – 双向Encoder
2025年四月学习总结
【清深CVML组实习】基于LLM的图表理解-文献阅读汇报
【重点】Transformer