强化学习教材和实战项目，哪里有7个免费视频教程？

摘要：原文：https:mp.weixin.qq.comsnfN0dWT3ZfDuW7ZGfaG6dA 学习资源经典教材《大模型算法：强化学习、微调与对齐》原创 100+ 架构图，系统讲解大模型、强化学习，涵盖：L

原文：https://mp.weixin.qq.com/s/nfN0dWT3ZfDuW7ZGfaG6dA 学习资源经典教材《大模型算法：强化学习、微调与对齐》原创 100+ 架构图，系统讲解大模型、强化学习，涵盖：LLM / VLM 等大模型原理、训练算法（RL、RLHF、GRPO、DPO、SFT 与 CoT 蒸馏等）、效果优化与 RAG 等。 https://github.com/changyeyu/LLM-RL-Visualized | 1.5k⭐ Deep Reinforcement Learning Hands-On 以简洁易懂的方式讲解深度强化学习，结合 PyTorch 等现代库，通过游戏、股票交易等多样化应用案例，帮助读者从基础逐步掌握到高级概念。 v1版代码：https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On | 3k⭐ v2版代码：https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On-Second-Edition | 1.3k⭐ Reinforcement Learning: An Introduction 强化学习之父Richard sutton的书，强化学习圣经级的入门书籍第一版: http://incompleteideas.net/book/first/the-book.html 翻译版: https://rl.qiwihui.com/zh-cn/latest/index.html 第二版: http://incompleteideas.net/book/the-book.html https://github.com/ShangtongZhang/reinforcement-learning-an-introduction | 14.4k⭐ UCL课程：https://dennybritz.com/posts/wildml/learning-reinforcement-learning/ https://github.com/dennybritz/reinforcement-learning | 21.7k⭐ 动手学强化学习本书一共分为三个部分，分别为动手学习基础篇、动手学习进阶篇和动手学习前沿篇。基础篇关注于 tabular 场景下的 RL，即状态和动作空间都是有限的；进阶篇的内容突破这一限制，考虑连续的状态或动作，此时我们会使用到神经网络。最后，在前沿篇我们会介绍强化学习领域一些有趣的方向，以及相对应的前沿算法动手学强化学习 B站视频链接 https://github.com/boyu-ai/Hands-on-RL | 4.1k ⭐ 蘑菇书EasyRL 整理了李宏毅老师的《深度强化学习》中文视频、周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料。包含RL经典论文解读，见github地址。蘑菇书EasyRL https://github.com/datawhalechina/easy-rl | 12.8k ⭐ 博客 OpenAI Spinning Up OpenAI 的 Spinning Up 仓库是一个深度学习强化学习的教育资源，包含入门介绍、论文列表、关键算法的独立实现及练习等内容 https://spinningup.openai.com/en/latest/index.html https://github.com/openai/spinningup | 11.3k⭐ Andrej Karpathy blog 应用强化学习的策略梯度算法的乒乓球游戏，Andrej Karpathy通过130行代码实现的，帮助理解强化学习算法。

强化学习教材和实战项目，哪里有7个免费视频教程？

相关推荐