报告时间:2017年4月17日(周一)上午9:00
报告地点:计算机楼A521
报告人简介:
韩霄松博士于2016年3月至2017年3月以访问学者的身份对美国密苏里大学哥伦比亚分校(University of Missouri-Columbia)计算机科学系(Computer Science Department)进行了为期一年的访问。访学期间的研究课题为:基于新闻的大数据挖掘(Big Data Mining from News),外方合作导师为许东教授。
报告内容简介:
报告题目为“基于新闻的大数据挖掘”。
不同于网络上的其它数据,新闻具有较高的可信度,因此,在新闻中挖掘到的知识也具有较高的可信性。首先,利用爬虫技术得到了美国,欧洲和亚洲七个主要英文新闻网站近五年的新闻。然后利用这些数据主要做了两方面的工作:
(1)疾病关注度趋势预测:利用疾病本地统计出各种疾病每天的关注度,并利用深度学习网络训练分类器对关注度趋势做预测;此外,还开发了一系列可视化工具,展示关注度变化以及疾病之间的关系。
(2)新闻人物评价:通过新闻对热点人物的进行了分析,主要从新闻中找到和人物相关的句子,利用情感分析技术对该句子进行分析,得到评价结果;并针对评价时间轴上的高峰和低谷做了新闻数据回溯来验证评价的准确性。
主办单位:太阳成集团tyc122cc
太阳成集团tyc122cc软件学院
太阳成集团tyc122cc计算机科学技术研究所
符号计算与知识工程教育部重点实验室