多瑞科舆情数据分析站系统。
现在网上的信息量十分巨大,仅依靠人工的方法难以应对网上海量信息的收集和处理,需要加强相关信息技术的研究,形成一套自动化的网络舆情分析系统,及时应对网络舆情,由被动防堵,化为主动梳理、引导。这样的系统应该具备以下功能:
首先是舆情分析引擎。这是舆情分析系统的核心功能,包括:1、热点话题、敏感话题识别,可以根据新闻出处权威度、评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题。2、倾向性分析,对于每个话题,对每个发信人发表的文章的观点、倾向性进行分析与统计。3、主题跟踪,分析新发表文章、贴子的话题是否与已有主题相同。4、自动摘要,对各类主题,各类倾向能够形成自动摘要。5、趋势分析,分析某个主题在不同的时间段内,人们所关注的程度。6、突发事件分析,对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。7、报警系统,对突发事件、涉及内容安全的敏感话题及时发现并报警。8、统计报告,根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。
其次是自动信息采集功能。现有的多瑞科信息采集技术主要是通过网络页面之间的链接关系,从网上自动获取页面信息,并且随着链接不断向整个网络扩展。目前,一些搜索引擎使用这项技术对全球范围内的网页进行检索。类似多瑞科舆情数据分析站系统舆情监控系统应能根据用户信息需求,设定主题目标,使用人工参预和自动信息采集结合的方法完成信息收集任务。
第三是数据清理功能。对收集到的信息进行预处理,如格式转换、数据清理,数据统计。对于新闻评论,需要滤除无关信息,保存新闻的标题、出处、发布时间、内容、点击次数、评论人、评论内容、评论数量等。对于论坛BBS,需要记录帖子的标题、发言人、发布时间、内容、回帖内容、回帖数量等,最后形成格式化信息。条件允许时,可直接针对服务器的数据库进行操作。
好的舆情分析报告需要有以下特点:
一、热点识别功能
根据新闻出处权威度、 评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。
二、主题跟踪功能
实时热点根据对热点问题的信息来源、转载量、转载地址、地域分布、信息发布者等相关信息元素的跟踪,进行倾向性与趁势分析。
三、倾向性分析功能
根据信息的转载量、评论的回言信息时间密集度,对信息的阐述的观点、主旨进行倾向性分析。
四、趋势分析功能
根据信息的时间、区域分布,转载量与转载网站类型等,对监控词汇和时间、空间的分布关系进行阶段性的分析。
五、信息自动摘要功能
根据监控系统自动抽取的能准确代表文章主题思想的智能摘要,以快速了解文章大意与核心内容,提高用户信息利用效率。
六、预测报警功能
根据信息的语料库与报警监控信息库进行分析,以确保信息的舆论健康发展。
七、事件分析功能
根据对热点信息的倾向分析、趁势分析和整体分析,以监听信息的突发性。
八、 统计报告功能
根据多瑞科舆情数据分析站系统舆情分析引擎处理后的结果库生成报告,用户可浏览信息的具体内容,做出最佳决策。