基于深度学习的文字情感分析模型的设计与实现开题报告

 2022-11-25 23:51:10

1. 研究目的与意义

随着互联网的飞速发展,信息的传播和增长也越来越快。

民众通过互联网参与信息的互动也越来越频繁。

如何有效的获取民众对相关事件、商品、活动等评价信息并挖掘出一些其中有价值的内容,成为互联网技术的一项研究热点。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

1.文本表示:1)分布表示:词是承载语义的最基本的单元,而传统的独热表示(One-hot representation)是将文本中的词转变为计算机可以识别的语言表示。

2)词向量表示: 基于神经网络的分布表示一般称为词向量、词嵌入(word embedding)或者分布式表示(distribute representation)。

2.机器学习模型1)朴素贝叶斯:朴素贝叶斯算法是一种基于概率统计的算法,在文本分类中有着良好的效果,他的核心思想基于贝叶斯理论,假设输入数据文本的特征词之间没有关联,对结果的判断都有发言权。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

情感分析是对带有主观型的文本进行情感色彩的分析、 处理、 归纳和推理的过程 [1] 。

一般地, 文本情感分析按照处理文本对象的粒度不同, 可以分为这几级:篇章级、 段落级、 句子级、 词语级甚至是混合的几个研究层次。

本文研究的主要是针对句子级别的文本分析任务, 已有的算法一般包含基于词典和基于机器学习的方法, 近年来, 随着深度学习方法的不断研究与发展, 其在学术界和工业界已经引起了广泛的关注, 目前在图像识别、 语音识别及自然语言处理等多个领域取得了重大的进展, 关于深度学习的研究成果表明其方法中的诸多模型能在多个任务中能表现出更加良好的效果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

为了验证 Bi-LSTM 模型的有效性, 设计了三个对比实验, 与传统的机器学习算法支持向量机(SVM) 方法、 循环神经网络(RNN) 以及长短是记忆网络(LSTM)方法来进行对比, 利用 ChnSentiCorp-Htl-ba-6000 数据集进行交叉验证来进行实验分析, 输入词向量采用 word2vec 工具进行处理。

CNN: 采用随机初始化的向量对输入文本数据进行表示之后, 利用卷积神经网络模型来进行文本分类, 其中卷积核大小设置为 3, 隐藏层单元数量 200,模型中的激活函数选为 Relu 函数, 最后采用随机梯度下降算法来进行权重的更新迭代以得到稳定的模型。

RNN: 采用随机初始化的向量对输入文本数据进行表示之后, 利循环神经网络模型进行文本分类, 其中特征提取部分采用的是经典的 RNN 结构, 隐层节点个数设置为 256, 学习率设置为 0.01, 采用随机梯度下降算法来进行权重的更新迭代以得到稳定的模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

本学期至下学期第一周:收集有关资料,熟悉语言工具,并在网上查阅相关资料、学习有关文献,完成开题报告,提交上传,同时提交英文外文原文以及翻译;第2至6周:文本情感分析的设计;第7至8周:录音转文字识别文本情感分析的实现;撰写毕业设计文档初稿;第9至10周:进一步完善文本情感分析;完成毕业设计文档;第11至12周:修改、完善毕业设计文档;并打印、装订成册;进一步完善文本情感分析;第13至14周:自审、互申,完成修改工作,准备答辩。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。