人人都能搞定的大模型原理,神经网络是什么?

摘要:​人工智能的发展起步于1950年,期间经历了各种里程碑和变革,与此相关的神经网络技术也从最初的单层感知到复杂的层级和卷积神经网络一路创新和变革,不断推动人工智能领域的发展,直到 2022 
​人工智能的发展起步于1950年,期间经历了各种里程碑和变革,与此相关的神经网络技术也从最初的单层感知到复杂的层级和卷积神经网络一路创新和变革,不断推动人工智能领域的发展,直到2022年 ChatGPT的问世,彻底引爆了大众的目光。 人工智能技术经历了漫长的迭代过程,无论如何变革都离不开最早的神经网络模型“感知机”的启蒙,作为人工智能领域的一个重要里程碑,本篇文章就聚焦于“感知机”的实现进行说明。 让我们从理解感知机开始,彻底搞懂到底什么是神经网络。 原创声明,文章原创地址:人人都能搞定的大模型原理 - 神经网络 01、神经网络 -感知机 神经网络技术是从神经科学中汲取灵感,并试图捕捉人类隐藏在所谓的“快速感知”背后的一些无意识的思考过程,如人脑自动识别人脸或识别语音等。 20世纪50年代末,心理学家弗兰克·罗森布拉特受到人脑中神经元处理信息的方式的启发,一个神经元就是大脑中的一个细胞,它能够接收与之相连的其他神经元的电或化学输入信号。 简单的说,一个神经元把它从其他神经元接收到的所有输入信号加起来,如果达到某个特定的阈值水平,它就会被激活。 重要的是,一个给定的神经元与其他神经元的不同连接(突触)有不同的强度,当计算信号输入总和的时候,给定的神经元会给弱连接分配较少的权重,而将更多的权重分配给强连接的输入。 而对于计算机科学家来说,信息在神经元中的处理过程可以通过一个有多个输入和一个输出的计算机程序(感知机)进行模拟。 神经元和感知机之间的类比:大脑中的神经元(A)和一个简单的感知机(B) 图中(A)展示了一个神经元及其树突(为细胞带来输入信号的结构)、胞体和轴突(即输出通道);图中(B)则展示了一个简单的感知机结构。 与神经元类似,感知机将其接收到的输入信号相加,如果得到的和等于或大于感知机的阈值,则感知机输出1(被激活),否则感知机输出0(未被激活)。 为了模拟神经元的不同连接强度,罗森布拉特建议给感知机的每个输入分配一个权重,在求和时,每个输入在加进总和之前都要先乘以其权重。 而感知机的阈值则是由程序员设置的一个数值,它也可以由感知机通过自身学习得到。这个文章后面会再次进行说明。 简而言之,感知机是一个根据加权输入的总和是否满足阈值来做出是或否(输出1或0)的决策的简易程序。 而在生活中,你可能会以下面这样的方式做出一些决定。 例如,你会从一些朋友那里了解到他们有多喜欢某一部电影,但你相信其中几个朋友对于电影的品位比其他人更高,因此,你会给他们更高的权重。 如果朋友喜爱程度的总量足够大的话(即大于某个无意识的阈值),你就会决定去看这部电影。如果感知机有朋友的话,那么它就会以这种方式来决定是否看一部电影。 原创声明,文章原创地址:人人都能搞定的大模型原理 - 神经网络 02、图片识别 受大脑神经元网络的启发,罗森布拉特提出可以应用感知机网络来执行视觉任务,例如人脸和物体识别。为了了解感知机网络是如何开展工作的,我们接下来将探索一个感知机如何执行特定的视觉任务,比如,识别如下图所示的手写数字。 我们将感知机设计为“8”探测器,也就是说,如果其输入是一幅数字8的图像,则输出1;如果输入图像的内容是其他数字,则输出0。 设计这样一个探测器需要我们先弄清楚如何将图像转换为一组数值输入,再确定感知机的权重分配和阈值,以使感知机能够产生正确的输出(8为1,其他数字为0) 注:18×18像素图像中的每个像素对应感知机的一个输入,该感知机共有324(18×18)个输入 上图(A)展示了一个放大的手写数字8,其中 X 轴有 18 个网络方块,Y 轴也有 18 个网络方块,所以一共有 18x18 共 324 个网络方块。 图中每个网格方块(像素)都有一个可以用数字表示的强度值——像素强度(pixel intensity),在黑白图像中,纯白色方块的像素强度为255;纯黑色方块的像素强度为0;而灰色方块的像素强度介于其间。 该感知机具有324(18×18)个输入,每个输入对应于网格中的一个像素强度,同时每个输入都有自己的权重。 那么我们如何为一个给定的任务准确地设定正确的权重和阈值呢?罗森布拉特再次给出了一个受大脑启发的答案:感知机应该通过自己的学习获得这些数值。 从行为心理学上来看,给老鼠和鸽子以正向和负向的强化可以用来训练它们执行任务。 而感知机也应该在样本上进行类似的训练:在触发正确的行为时奖励,而在犯错时惩罚。如今,这种形式的条件计算在人工智能领域被称为监督学习(supervised learning)。
阅读全文