强化学习教材和实战项目,哪里有7个免费视频教程?

摘要:原文:https:mp.weixin.qq.comsnfN0dWT3ZfDuW7ZGfaG6dA 学习资源 经典教材 《大模型算法:强化学习、微调与对齐》 原创 100+ 架构图,系统讲解大模型、强化学习,涵盖:L
原文:https://mp.weixin.qq.com/s/nfN0dWT3ZfDuW7ZGfaG6dA 学习资源 经典教材 《大模型算法:强化学习、微调与对齐》 原创 100+ 架构图,系统讲解大模型、强化学习,涵盖:LLM / VLM 等大模型原理、训练算法(RL、RLHF、GRPO、DPO、SFT 与 CoT 蒸馏等)、效果优化与 RAG 等。 https://github.com/changyeyu/LLM-RL-Visualized | 1.5k⭐ Deep Reinforcement Learning Hands-On 以简洁易懂的方式讲解深度强化学习,结合 PyTorch 等现代库,通过游戏、股票交易等多样化应用案例,帮助读者从基础逐步掌握到高级概念。 v1版代码:https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On | 3k⭐ v2版代码:https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On-Second-Edition | 1.3k⭐ Reinforcement Learning: An Introduction 强化学习之父Richard sutton的书,强化学习圣经级的入门书籍 第一版: http://incompleteideas.net/book/first/the-book.html 翻译版: https://rl.qiwihui.com/zh-cn/latest/index.html 第二版: http://incompleteideas.net/book/the-book.html https://github.com/ShangtongZhang/reinforcement-learning-an-introduction | 14.4k⭐ UCL课程:https://dennybritz.com/posts/wildml/learning-reinforcement-learning/ https://github.com/dennybritz/reinforcement-learning | 21.7k⭐ 动手学强化学习 本书一共分为三个部分,分别为动手学习基础篇、动手学习进阶篇和动手学习前沿篇。基础篇关注于 tabular 场景下的 RL,即状态和动作空间都是有限的;进阶篇的内容突破这一限制,考虑连续的状态或动作,此时我们会使用到神经网络。最后,在前沿篇我们会介绍强化学习领域一些有趣的方向,以及相对应的前沿算法 动手学强化学习 B站视频链接 https://github.com/boyu-ai/Hands-on-RL | 4.1k ⭐ 蘑菇书EasyRL 整理了李宏毅老师的《深度强化学习》中文视频、周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料。包含RL经典论文解读,见github地址。 蘑菇书EasyRL https://github.com/datawhalechina/easy-rl | 12.8k ⭐ 博客 OpenAI Spinning Up OpenAI 的 Spinning Up 仓库是一个深度学习强化学习的教育资源,包含入门介绍、论文列表、关键算法的独立实现及练习等内容 https://spinningup.openai.com/en/latest/index.html https://github.com/openai/spinningup | 11.3k⭐ Andrej Karpathy blog 应用强化学习的策略梯度算法的乒乓球游戏,Andrej Karpathy通过130行代码实现的,帮助理解强化学习算法。
阅读全文