深圳设计产业园中哪个机械网站建设得最好?

摘要:机械网站建设比较好的,深圳设计产业园,自己做软件需要学什么,wordpress站点备份1. Encoder-Decoder 想象一下你正在和一个会说多种语言的朋友对话。你用中文对他说了一句话,他将其“编码”成他
机械网站建设比较好的,深圳设计产业园,自己做软件需要学什么,wordpress站点备份1. Encoder-Decoder 想象一下你正在和一个会说多种语言的朋友对话。你用中文对他说了一句话#xff0c;他将其“编码”成他的“内部语言”#xff0c;然后再“解码”成英语给你回复。在这个过程中#xff0c;“编码”就是Encoder#xff0c;而“解码”就是Decoder。 在机…1. Encoder-Decoder 想象一下你正在和一个会说多种语言的朋友对话。你用中文对他说了一句话他将其“编码”成他的“内部语言”然后再“解码”成英语给你回复。在这个过程中“编码”就是Encoder而“解码”就是Decoder。 在机器学习领域我们经常遇到需要将一个序列转换为另一个序列的问题。例如将一段英文文本翻译为中文。在这个过程中Encoder先将英文文本转换成计算机能够理解的内部表示然后Decoder再将这个内部表示转换为中文输出。 2. Attention 仍然使用上述对话为例。当你的朋友听你说话时他可能会更加关注你说话中的某些关键词这样他才能更准确地理解你的意思。这就是Attention机制的核心思想。它让机器更加关注输入数据中的某些部分以更好地完成任务。 3. Transformer BERT 当你和你的朋友对话时你的朋友不仅仅是听你的每一个词他会综合理解你说的每一个词来准确翻译。Transformer就是这样一种模型它能够同时考虑到句子中的每一个词而不是像传统的模型那样逐个考虑。 BERT是基于Transformer结构的一个模型它特别强大因为它能够理解文本中的上下文信息。例如“苹果”这个词在“我喜欢吃苹果”和“苹果公司发布了新产品”这两句话中含义是完全不同的。BERT可以通过学习大量的文本数据来理解这种上下文信息。 总结一下 Encoder-Decoder: 就像一个会多种语言的翻译者先听懂你说的话然后再用另一种语言回答你。Attention: 让机器更加关注输入中的关键信息。Transformer BERT: 一种高级的翻译者能够同时理解你说的每一个词并根据上下文准确翻译。 希望这样的解释能够帮助你更好地理解这些概念 2.2 Encoder-Decoder结构原理 **想象一下这样一个场景**你有一个秘密你先要把这个秘密写在纸上编码然后把这张纸传给朋友朋友读了纸条后再口头告诉大家这个秘密解码。 Encoder编码器 就是这个把秘密写在纸上的过程。你的秘密可能很长但你要试着用最短的话把它写下。这张纸就像是语义编码C它保存了整个秘密的精髓。 编码是怎么做到的 现在的编码方式很多就像我们有多种方法可以简化或者总结我们的秘密。其中RNN、LSTM、GRU等都是帮我们做这个总结的工具。 以RNN为例想象你有一个很长的秘密x1,x2,x3,x4这就像是一个故事的四个部分。RNN会从故事的第一部分开始读一部分思考一部分然后写下一点纸条上。这样当RNN读完整个故事后纸条上的内容h4就是这个故事的精髓或总结。 Decoder解码器 就是你的朋友读纸条并告诉大家的过程。他要确保他告诉大家的内容和纸条上的意思是一致的。解码器也有多种方式就像我们可以选择不同的方式来讲述一个故事。 所以总结一下Encoder-Decoder的过程就像是你有一个故事长序列你选择一个方法把它总结成一句话编码成C然后你的朋友再把这句话扩展成一个故事解码成序列。这里的“方法”可以是RNN、LSTM、GRU等。 Decoder是如何解码的呢 想象一下当你去餐馆吃饭你向厨师描述了你想吃的菜。这个描述被厨师理解为一个“食谱”然后他会根据这个食谱制作出一道菜。 这里描述就是我们输入给编码器的序列而食谱或叫语义编码C就是编码器的输出它是一个总结或表示。接着解码器就是这个厨师它会根据这个“食谱”制作出即解码成最终的结果也就是你想吃的那道菜。 根据两篇论文解码器制作菜的方式有所不同 [论文1]: 厨师在做菜的每一步骤时都会反复查看你给的“食谱”。比如他在放盐的时候会看一下食谱做鱼的时候又看一下等等。简单说他在每一步都要确保他的动作是根据食谱的。 [论文2]: 厨师只在开始做菜的时候看了一次食谱然后就开始照着自己的经验做菜了。 但两种方式都有问题。 问题1: 想象厨师每次都要查看完整的食谱来确定下一步的动作但食谱对于做每道小菜的每个步骤的建议都是一样的。这就好像给厨师的食谱上每道小菜的步骤都写着“加盐、加醋、加糖”一样没有差异。 问题2: 如果食谱非常长涉及很多食材和步骤那么仅仅通过一个简短的总结来告诉厨师如何制作会导致丢失很多细节。这好比给一个厨师一个超长的食谱但只允许他用一眼扫过后开始制作很可能会忘记某些步骤或食材。
阅读全文