[1]王 磊,曾 诚,奚雪峰*,等.基于Spark的海量文本评论情感分析[J].苏州科技大学学报(自然科学版),2018,35(01):71-75.[doi:10.12084/j.issn.2096-3289.2018.01.014]
点击复制
基于Spark的海量文本评论情感分析()
苏州科技大学学报(自然科学版)[ISSN:2096-3289/CN:32-1871/N]
- 卷:
-
35
- 期数:
-
2018年01期
- 页码:
-
71-75
- 栏目:
-
- 出版日期:
-
2018-03-20
文章信息/Info
- 文章编号:
-
doi:10.12084/j.issn.2096-3289.2018.01.015
- 作者:
-
王 磊1; 2; 曾 诚3; 奚雪峰1; 2*; 皮 洲1; 2; 顾建伟1; 2; 卓文婕1; 2; 陈帅天1; 2
-
1.苏州科技大学 电子与信息工程学院,江苏 苏州 215009;2.苏州市虚拟现实智能交互及应用技术重点实验室,江苏 苏州 215009;3.昆山市公安局指挥中心,江苏 苏州 215300
- 关键词:
-
Spark; 情感分析; 支持向量机; 多层感知器
- 分类号:
-
TP391
- DOI:
-
10.12084/j.issn.2096-3289.2018.01.014
- 文献标志码:
-
A
- 摘要:
-
为实现对批量评论的情感分析,高效挖掘评论价值,该文设计并实现了基于Spark 的文本评论情感分析工具。首先,该文对数据进行预处理,使各类训练数据保持平衡,并使用结巴分词对文本进行切分;其次,利用Wor2Vec模型对分词后的评论进行词向量转换;最后,将转化得到的句子向量作为分类器的输入,训练分类模型。同时,该文还基于C/S架构设计了相关应用程序,实现了批量数据的提交以及结果的快速获取。在利用Wor2Vec模型对文本进行特征提取的情况下,该文比较了几种常见分类器的性能差异,结果表明多层感知器在几种算法的比较中取得了较好的结果,能对文本情感作出较为准确的分类。
备注/Memo
- 备注/Memo:
-
国家自然科学基金项目(61472264;61472267;61673290);苏州市科技发展计划(重点实验室SZS201609);江苏省研究生实践创新计划项目(SJCX17_0681);2017年江苏省大学生创新创业训练计划资助项目;苏州市科技发展计划(产业前瞻性项目 SYG201707)
更新日期/Last Update:
1900-01-01