[1]王 磊,曾 诚,奚雪峰*,等.基于Spark的海量文本评论情感分析[J].苏州科技大学学报(自然科学版),2018,35(01):71-75.[doi:10.12084/j.issn.2096-3289.2018.01.014]
点击复制

基于Spark的海量文本评论情感分析()
分享到:

苏州科技大学学报(自然科学版)[ISSN:2096-3289/CN:32-1871/N]

卷:
35
期数:
2018年01期
页码:
71-75
栏目:
出版日期:
2018-03-20

文章信息/Info

文章编号:
doi:10.12084/j.issn.2096-3289.2018.01.015
作者:
王 磊12 曾 诚3 奚雪峰12* 皮 洲12 顾建伟12 卓文婕12 陈帅天12
1.苏州科技大学 电子与信息工程学院,江苏 苏州 215009;2.苏州市虚拟现实智能交互及应用技术重点实验室,江苏 苏州 215009;3.昆山市公安局指挥中心,江苏 苏州 215300
关键词:
Spark情感分析支持向量机多层感知器
分类号:
TP391
DOI:
10.12084/j.issn.2096-3289.2018.01.014
文献标志码:
A
摘要:
为实现对批量评论的情感分析,高效挖掘评论价值,该文设计并实现了基于Spark 的文本评论情感分析工具。首先,该文对数据进行预处理,使各类训练数据保持平衡,并使用结巴分词对文本进行切分;其次,利用Wor2Vec模型对分词后的评论进行词向量转换;最后,将转化得到的句子向量作为分类器的输入,训练分类模型。同时,该文还基于C/S架构设计了相关应用程序,实现了批量数据的提交以及结果的快速获取。在利用Wor2Vec模型对文本进行特征提取的情况下,该文比较了几种常见分类器的性能差异,结果表明多层感知器在几种算法的比较中取得了较好的结果,能对文本情感作出较为准确的分类。

备注/Memo

备注/Memo:
国家自然科学基金项目(61472264;61472267;61673290);苏州市科技发展计划(重点实验室SZS201609);江苏省研究生实践创新计划项目(SJCX17_0681);2017年江苏省大学生创新创业训练计划资助项目;苏州市科技发展计划(产业前瞻性项目 SYG201707)
更新日期/Last Update: 1900-01-01