专题:机器学习
共115篇相关文章

深度学习进阶中,如何理解归纳偏置与蒸馏的深层联系?
在上一篇,我们已经完成了 Vision Transformer的完整逻辑:把图像切成 patch 当作 token,送入 Transformer Encoder 做全局建模。 但我们也提到了, ViT 存在一个绕不开的痛点: 没有足够大的数...

深度学习进阶(七)Data-efficient Image Transformer如何实现高效数据利用?
在前面的分析中,我们已经明确了 ViT 的核心问题: 由于归纳偏置较弱,ViT 对数据规模高度依赖。 就这个问题,我们又展开了一种改进思路: 通过蒸馏人为引入一个“软约束”,缩小搜索空间,从而减少数据依赖。 于是,我们就得到了 ViT 的其...

如何用Magpie开源库给中文文本分类并打标签?
当下人工智能是真心的火热呀,各种原来传统的业务也都在尝试用人工智能技术来处理,以此来节省人工成本,提高生产效率。既然有这么火的利器,那么我们就先来简单认识下什么是人工智能吧,人工智能是指利用语音识别、语义理解、图像识别、视觉处理、机器学习、...

深度学习进阶(四)中,Transformer整体结构是如何设计的?
在上一篇中,我们已经完整展开了 Transformer Block 的内部结构,包括多头注意力、残差连接、LayerNorm 以及 FFN。 至此,就可以正式进入 Transformer 的整体结构了。 在原论文中,Transformer...

深度学习进阶(五)Vision Transformer有哪些应用?
在上一篇,我们已经完整介绍了原始 Transformer 的结构和整体传播逻辑。 从结果上看,Transformer 在 NLP 领域带来了范式级的突破:通过自注意力机制实现了对序列的全局建模能力。 然而,实际上,原始 Transforme...

深度学习进阶(一)从注意力到自注意力,哪个概念更复杂?
新分类续接之前的注意力机制内容开始,展开一些更现代的理论。 在之前的深度学习内容中,我们已经介绍了注意力机制的核心流程,其本质可以概括为:在解码的每一个时间步增加注意力计算得到上下文向量,让模型可以根据当前状态,从输入序列中动态选择相关信息...

深度学习进阶(二)中,多头自注意力机制(Multi-Head Attention)的原理是什么?
在第一篇中,我们已经得到了自注意力的核心公式: [mathrm{Attention}(mathbf{Q},mathbf{K},mathbf{V})=mathrm{softmax}left(frac{ mathbf{Q}m...

深度学习进阶(三)Transformer Block是什么?
在上一篇我们已经完成了多头自注意力机制的内容,并知道了它是 Transformer Block 中的一个子模块。 Transformer Block 是 Transformer 模型的核心计算单元,它不仅创造并应用了多头自注意力机制,还结合...

MindSpore 快速入门,如何从零构建第一个神经网络?
MindSpore 快速入门:从零到第一个神经网络 作者:whitea133 邮箱:1309848726@qq.com 📌 摘要 MindSpore 是华为开源的全场景 AI 框架,支持移动、边缘和云场景。本...

如何利用LMM进行高光谱成像中的端元提取?
在上一篇中,我们已经介绍了光谱解混的基本思想。光谱解混通常以 LMM 为基础模型,其一个像素的光谱被表示为多个端元光谱的线性组合: [mathbf{x} = sum_{i=1}^{p} a_i mathbf{s}_i &#x...

高光谱成像基础中,RX与KRX异常检测算法有哪些特点?
在上一篇中,我们简单了解了提取端元光谱的基础方法,从而可以应用在我们前面介绍过的 MF 和 ACE 等经典高光谱目标检测方法中。这类方法的共同特点在于:需要预先给定目标光谱 (mathbf{s}),再通过不同的判别准则衡量像素与目标之...

高光谱成像基础中,如何实现光谱重建技术?
在前面的内容里,我们已经围绕高光谱数据的降维、检测与解混展开了很多方法。 这些方法其实都有一个共同点: 它们都假设光谱数据是“已知且完整”的。 但在实际应用中,这个假设往往并不成立。 例如传感器只能采集少量波段、成像设备成本或带宽受限、数据...

高光谱成像基础(完)中的光谱融合(Spectral Fusion)是如何实现的?
在上一篇里,我们介绍了光谱重建的相关内容。这一类方法的核心问题是:当光谱信息缺失时,如何从“有限观测”中恢复完整光谱。 但在实际应用中,还还还存在另一类同样常见的情况: 我们并不是“没有数据”,而是“拥有多种不完整但彼此互补的数据”。 要解...

如何构建基于YOLOv581112的深度学习工程车辆检测系统并实现Pyqt5界面展示?
本文介绍了一个基于YOLO算法的工程车辆检测系统,该系统融合了YOLOv5v8v11v12等多种模型,能高效识别复杂场景中的工程车辆。系统具备用户管理、多模态检测(图片视频摄像头)、结果保存导出等功能,并支持模型切换。技术分析显示...

如何构建基于YOLOv5的深度学习水表读数识别系统并实现Django web展示?
本文介绍了一款基于YOLO算法的水表读数识别系统。该系统采用Python3.10开发,前端使用bootstrap,后端为django,数据库采用SQLite,集成了YOLOv5YOLOv8YOLOv11YOLOv12多种模型。系统具备...
