专题:深度学习
共147篇相关文章

如何高效记录使用Transformers包的每个细节?
Transformers是著名的深度学习预训练模型集成库,包含NLP模型最多,CV等其他领域也有,支持预训练模型的快速使用和魔改,并且模型可以快速在不同的深度学习框架间(PytorchTensorflowJax)无缝转移。以下记录基于H...

如何将PyTorch的四个hook函数整合为一个?
训练神经网络模型有时需要观察模型内部模块的输入输出,或是期望在不修改原始模块结构的情况下调整中间模块的输出,pytorch可以用hook回调函数来实现这一功能。主要使用四个hook注册函数:register_forward_hook、reg...

深度变分信息瓶颈是什么?
Deep Variational Information Bottleneck (VIB) 变分信息瓶颈 论文阅读笔记。本文利用变分推断将信息瓶颈框架适应到深度学习模型中,可视为一种正则化方法。 变分信息瓶颈 假设...

如何定位和编辑GPT中的事实关联?
论文发表于人工智能顶会NeurIPS(原文链接),研究了GPT(Generative Pre-trained Transformer)中事实关联的存储和回忆,发现这些关联与局部化、可直接编辑的计算相对应。因此: 1、开发了一种因果干预方法,...

如何构建基于YOLOv12v11v8v5的深度学习铁轨缺陷检测系统并实现Django web展示及训练代码编写?
本文介绍了一个基于YOLO算法的铁轨缺陷检测系统,该系统实现了多模态检测、多模型切换、结果保存等功能。系统采用Python3.10开发,使用Django框架和SQLite数据库,集成了YOLOv5YOLOv8YOLOv11YOLOv1...

如何用3分钟深度理解AI大脑中的感知机原理?
感知机是AI最基础模型,像“带及格线的投票委员会”:给各条件赋予权重,加权求和超阈值(bias)则决策。通过试错自动调整权重学习规律,是神经网络核心积木,堆叠成ChatGPT等现代AI。核心就是简单加乘法。...

如何用3分钟理解深度学习AI中的梯度下降:在迷雾中找到下山的最佳路径?
AI是如何学会自我纠错的?秘密就在“梯度下降”。它就像蒙眼在浓雾中寻找谷底,通过不断试探最陡的下坡路,一步步迈向最低点。这正是AI微调参数、寻找最小误差的学习过程。3分钟零基础,轻松搞懂深度学习的核心魔法!...

深度学习AI反向传播:链式法则的归责游戏,如何解释的原理?
反向传播是AI自我纠错的核心机制。当AI犯错时,它像追究一碗咸汤的责任一样,从最终错误出发,由后向前逐层倒推,精准计算每个神经元的“责任大小”。这种定向问责让机器告别盲目,明确知道错在哪并做出改正。...

如何用最简五步法3分钟掌握深度学习AI的自我进化技巧?
AI训练总原地踏步?因为你忘了“清空错题本”!本文用通俗类比,3分钟带零基础的你搞懂深度学习“五步法”闭环:前向、算损、清零、反传、更新。无复杂公式,助你秒懂极简代码,轻松建立真正的AI训练直觉!...

如何快速掌握深度学习AI:环境搭建与工具应用技巧?
本文专为零基础读者打造,带你快速通关深度学习环境配置。从底层硬件(GPU与CUDA)原理讲起,串联 Conda 与极速工具 uv 进行高效环境管理,带你玩转 Jupyter 交互式编程,并手把手完成 PyTorch 框架安装与避坑。一站式打...

如何通过卷积层实操掌握深度学习AI?
AI如何看懂图片?秘密在于“卷积层”。它就像一把内置模具的“手电筒”,在图像上滑动扫描,高效寻找并提取关键的局部特征。本文通过通俗的比喻与极简的 Python 可视化实操,带你零基础搞懂其核心原理,3分钟轻松建立深度学习直觉!...

如何通过池化层在深度学习AI中实现处理?
针对生活中的高清影像,最大池化通过“保留局部最强特征”实现高效压缩,既大幅节省算力,又赋予AI平移不变性。文末附带极简PyTorch实操,3分钟带你零基础搞懂AI特征提取的核心逻辑!...
