Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
搜索内容
搜索
Newest
Project
NLP
CV
AI
LLM
ACM
Study
English
Tool
登录
包含标签:RLHF 的文章
LLM
【理论学习】RLHF实现框架
RLHF(Reinforcement Learning with Human Feedback)即带有人工反馈的强化学习。它是强化学习(RL)的一种变体,结合了人工反馈来提升学习过程的效率和效果。……
Zhang, Hongxing
2024年12月16日
237
0
Tag Cloud
Recent Posts
【PRICAI 2025会议(CCF-C类)已录用论文】TBERT: Bridging Text Generation and Score Regression through Hierarchical Feature Fusion based LLM for Automated Essay Scoring
2025年七月学习总结
【重点】Bert – 双向Encoder
【重点】Transformer
2025年六月学习总结