如何为DNF辅助服务创建有效的竞价广告并吸引玩家?
摘要:眼镜网站怎么做竞价,做dnf辅助官方网站,html前端网站开发PPT,网站内容和功能清单目录1、基于词典的方法2、基于词袋或 Word2Vec 的方法2.1 词袋模型2.2 Word2Vec3、案例:用户评论情
眼镜网站怎么做竞价,做dnf辅助官方网站,html前端网站开发PPT,网站内容和功能清单目录1、基于词典的方法2、基于词袋或 Word2Vec 的方法2.1 词袋模型2.2 Word2Vec3、案例#xff1a;用户评论情绪分析3.1 数据读取3.2 语料库分词处理3.3 Word2Vec 处理3.4 训练情绪分类模型3.5 对评论数据进行情绪判断目的#xff1a;去判断一段文本、评论的情绪偏向在这里用户评论情绪分析3.1 数据读取3.2 语料库分词处理3.3 Word2Vec 处理3.4 训练情绪分类模型3.5 对评论数据进行情绪判断目的去判断一段文本、评论的情绪偏向在这里我们针对文本进行情绪分析时只处理两种情绪状态积极和消极。针对文本情绪分析的方法有两种一种基于词典另一种基于机器学习方法。
1、基于词典的方法
概括来讲首先有一个人工标注好的词典。词典中的每一个词都对应着消极或积极的标签。 这个词典可能有上万条或者几十万条当然是越多越好。 情绪分析流程 1收到评论”这门课程很好啊“ 2分词”[‘这门’, ‘课程’, ‘很’, ‘好’, ‘啊’, ‘’]“ 3拿分好的词依次去匹配词典。匹配的方法很简单
如果词典中存在该词且为积极标签那么我们记 11;如果词典中存在该词且为消极标签那么我们记 -1−1;如果词典中不存在该词我们记 00。
4匹配完一个句子之后我们就可以计算整个句子的得分。总得分 00 表示该句子情绪为积极总得分小于零代表该句子为消极总得分 00 表示无法判断情绪。
此方法优点简单 缺点1往往需要一个很大的词典且不断更新。这对人力物力都是极大的考验。 缺点2该方法还有无法通过扩充词典解决的情绪判断问题。 例如当我们人类在判断一句话的清晰时我们会往往更偏向于从整体把握语言环境尤其是在乎一些语气助词对情绪的影响。而基于词典进行情绪分析的方法就做不到这一点将句子拆成词就会影响句子的整体情绪表达。 缺点3准确率并不高
目前针对中文做情绪标注的词典少之又少。比较常用的有
台湾大学 NTUSD 情绪词典。《知网》情绪分析用 词语集。
以《知网》情绪词典举例它包含有 5 个文件分别列述了正面与负面的情绪词语以及程度词汇。
“正面情感”词语如爱赞赏快乐感同身受好奇喝彩魂牵梦萦嘉许 … “负面情感”词语如哀伤半信半疑鄙视不满意不是滋味儿后悔大失所望 … “正面评价”词语如不可或缺部优才高八斗沉鱼落雁催人奋进动听对劲儿 … “负面评价”词语如丑苦超标华而不实荒凉混浊畸轻畸重价高空洞无物 … “程度级别”词语 “主张”词语
2、基于词袋或 Word2Vec 的方法
2.1 词袋模型
词袋不再将一句话看做是单个词汇构成而是当作一个 1 \times N1×N 的向量。 举例 我们现在有两句话需要处理分别是 我爱你我非常爱你。 我喜欢你我非常喜欢你。 我们针对这两句话进行分词之后去重处理为一个词袋 [‘我’, ‘爱’, ‘喜欢’, ‘你’, ‘非常’] 然后根据词袋我们对原句子进行向量转换。其中向量的长度 N 为词袋的长度而向量中每一个数值依次为词袋中的词出现在该句子中的次数。 我爱你我非常爱你。 → [2, 2, 0, 2, 1] 我喜欢你我非常喜欢你。 → [2, 0, 2, 2, 1] 有了词袋有了已经人工标注好的句子就组成了我们的训练数据。再根据机器学习方法来构建分类预测模型。从而判断新输入句子的情绪。
词袋模型和独热编码非常相似。其实这里就是将之前独热编码里的词变成了句子而已。
词袋模型固然比简单的词典对比方法更好但独热编码无法度量上下文之间的距离也就无法结合上下文进行情绪判断。引入词向量的 Word2Vec 处理方法来克服这个缺点。
2.2 Word2Vec
Word2Vec故名思意就是将句子转换为向量也就是词向量。它是由浅层神经网络组成的词向量转换模型。
Word2Vec 的输入一般为规模庞大的语料库输出为向量空间。Word2Vec 的特点在于语料库中的每个词都对应了向量空间中的一个向量拥有上下文关系的词映射到向量空间中的距离会更加接近。
Word2Vec 的主要结构是 CBOWContinuous Bag-of-Words Model模型和 Skip-gramContinuous Skip-gram模型结合在一起。简单来讲二者都是想通过上下文得到一个词出现的概率。
CBOW 模型通过一个词的上下文各 N 个词预测当前词。而 Skip-gram 则恰好相反他是用一个词预测其上下文得到了当前词上下文的很多样本因此可用于更大的数据集。
