Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
搜索内容
搜索
Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
登录
包含标签:RLHF 的文章
LLM
【理论学习】RLHF实现框架
RLHF(Reinforcement Learning with Human Feedback)即带有人工反馈的强化学习。它是强化学习(RL)的一种变体,结合了人工反馈来提升学习过程的效率和效果。……
Zhang, Hongxing
2024年12月16日
141
0
Tag Cloud
Recent Posts
2025年三月学习总结
【在审论文】通过基于分层特征融合的LLM以桥接文本生成和分数回归的自动作文评分
2025年二月学习总结
2025年一月学习总结
【理论学习】深度学习的三种并行方式