专题:深度学习
共147篇相关文章

对比学习下,自适应稀疏注意力跨模态语义对齐是否绝对最优?
对比学习下的跨模态语义对齐是最优的吗?---自适应稀疏化注意力对齐机制 IEEE Trans. MultiMedia...

如何改进视觉语言跨模态特征语义相似度计算,构建表征空间维度语义依赖感知聚合算法?
论文链接:Unlocking the Power of Cross-Dimensional Semantic Dependency for Image-Text Matching (ACM MM23) 代码主页:https:github...

可解释人工智能中的概念瓶颈模型如何推动可解释决策进展?
深度神经网络虽然表现出优异的性能,但其不透明性限制了其在需要透明度和人工监管的高风险领域中的应用。概念瓶颈模型(Concept Bottleneck Models, CBMs)通过引入一个人类可理解的概念层来连接输入与决策,从而解决了这一差...

**菜鸟学深度学习日记****第1天:初识深度学习**今天是我开始学习深度学习的第一天,感觉既兴奋又有些迷茫。在了解了深度学习的基本概念后,我意识到它其实是一种模拟人脑神经网络进行数据处理的算法。虽然听起来很复杂,但我相信只要一步步来,一定能掌握。**第2
本文以作者阅读《Dive into Deep Learning》为线索,融合串联了自身理解感悟、原始论文、优秀文章等。如有无意侵权,请联系本人删除。 填充 & 步幅 & 下采样 由上一节,可以...

深度卷积神经网络如何应用于ImageNet图像分类,AlexNet原文是什么?
课余时间,手动翻译了 AlexNet 的原文,感觉这篇文章比较适合小白学习,顺便完成了导论作业
但是没有专门去插入引用部分(
经过llm检查,改正了少许翻译错误...

深度学习训练中模型评估、梯度难题、科学初始化等关键问题,如何逐一攻克?
要解决模型泛化能力与训练稳定性两大难题,关键在于理解偏差-方差权衡、梯度传播和参数初始化三者间的深层联系。...

GAN训练中,如何用detach()实现的梯度截断?
我最近在学使用Pytorch写GAN代码,发现有些代码在训练部分细节有略微不同,其中有的人用到了detach()函数截断梯度流,有的人没用detch(),取而代之的是在损失函数在反向传播过程中将backward(retain_graph=T...

如何实现TensorFlow和PyTorch的参数初始化调用?
神经网络中最重要的就是参数了,其中包括权重项$W$和偏置项$b$。 我们训练神经网络的最终目的就是得到最好的参数,使得目标函数取得最小值。参数的初始化也同样重要,因此微调受到很多人的重视, 只列一些常用的! Tensorflow 常数初始化...

在神经网络中,降维和升维是处理数据时常用的技术。降维可以减少数据的维度,从而减少计算量和过拟合的风险;升维则是增加数据的维度,以便神经网络能够更好地捕捉数据中的复杂特征。以下是一些在TensorFlow中常用的降维和升维方法:### 降维方法1. **主成
大名鼎鼎的UNet和我们经常看到的编解码器模型,他们的模型都是先将数据下采样,也称为特征提取,然后再将下采样后的特征恢复回原来的维度。这个特征提取的过程我们称为“下采样”,这个恢复的过程我们称为“上采样”,本文就专注于神经网络中的下采样和上...

改变网络结构设计,如何实现模型压缩与加速的效应?
Group convolution Group convolution最早出现在AlexNet中,是为了解决单卡显存不够,将网络部署到多卡上进行训练而提出。Group convolution可以减少单个卷积1g的参数量。如何计算的呢?...

如何设计轻量级神经网络以处理?
引言 深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中,并取得了巨大成功。然而,由于存储空间和功耗的限制,神经网络模型在嵌入式设备上的存储与计算仍然是一个巨大的挑战。 目前工业级和学术界设计轻量化神经网络模型主要有4个方向:...

深度学习模型压缩与加速,有哪些策略?
深度神经网络在人工智能的应用中,包括语音识别、计算机视觉、自然语言处理等各方面,在取得巨大成功的同时,这些深度神经网络需要巨大的计算开销和内存开销,严重阻碍了资源受限下的使用。模型压缩是对已经训练好的深度模型进行精简,进而得到一个轻量且准确...

移动端深度学习开源框架及部署有哪些选择?
TensorFlow Lite 开源企业:谷歌 GitHub地址:https:github.comtensorflowtflite-micro TensorFlow Lite for Microcontrollers&...

如何搭建并高效使用Linux系统下的深度学习环境?
作为一个AI工程师,对Linux的一些技能的掌握也能从一定层面反应工程师的资深水平。 要求1:基于SSH的远程访问(本篇文章) 能用一台笔记本电脑,远程登陆一台linux服务器 能随时使用笔记本电脑启动训练任务 能熟练的让代码和文件在笔记本...

Transformer模型如何实现的精准匹配与高效处理?
2013年 word Embedding 2017年 Transformer 2018年 ELMo、Transformer-decoder、GPT-1、BERT 2019年 Transformer-XL、XLNet、GPT-2 2020年...
