搜档网
当前位置:搜档网 › 微博舆情管理平台数据分析系统的设计与实现_学位论文

微博舆情管理平台数据分析系统的设计与实现_学位论文

微博舆情管理平台数据分析系统的设计与实现_学位论文
微博舆情管理平台数据分析系统的设计与实现_学位论文

题目:微博舆情管理平台的设计与实现——数据分析系统

适合专业:信息安全专业

指导教师(签名):提交日期:2013年03月08日学院: 计算机学院专业:信息安全学生姓名学号:

题目:微博舆情管理平台设计与实现——数据分析系统设计实现

学院:计算机学院专业:信息安全学生姓名:张骁学号:09283050

指导教师签名:审核日期:年月日

微博社交网络舆情监测指标体系构建

科技广场2012.4 0引言 微博作为Web2.0时代新兴起的开放化的互联网社交服务,至2006年Evan Williams等人联合推出Twitter以来,发展迅猛。2007年,王兴首先建立了饭否网,将微博概念引入国内。其他类似的微博网站相继出现,如叽歪、做啥、嘀咕、贫嘴、同学网、9911等。除了上述专业类微博网站外,2010年国内微博迎来春天,微博像雨后春笋般崛起,四大门户网站均开设微博。其中,新浪借助网站平台及名人资源优势使得其用户数超过1亿。2011年上半年,我国微博用户数量从6331万增至1.95亿,半年增幅高达208.9%。微博在网民中的普及率从13.8%增至40.2%。从2010年底至今,手机微博在网民中的使用率从15.5%上升到34%。 微博快速发展的同时,不可避免地会带来一些新的问题,其中一个突出问题就是虚假信息。比较典型的事件就是2009年西方媒体借助“Twitter”散发小道消息,导致伊朗在大选后政治动荡。由于微博信息共享便捷迅速,内容短小精悍,内容限定为140字左右,这样产生大量的信息内容,使得现有的系统审核方式或人工实时监控模式难以达到杜绝虚假信息的目的。微博在带来沟通的流畅和信息分享的高效的同时,也带来了虚假信息的泛滥。一则未经核实的具备轰动效应的消息,常会在极短时间以几何级数爆炸式传播,如果消息不实,事后的澄清和辟谣将非常困难。可见,微博在网络媒体中作用越来越显著。 舆情分析指标体系大多针对互联网舆情设计, 微博社交网络舆情监测指标体系构建Construction of Microblogging Social Network Public Opinion Monitoring Index System 李保秀 Li Baoxiu (九江学院信息科学与技术学院,江西九江332005) (School of Information Science and Technology,Jiujiang University,Jiangxi Jiujiang332005) 摘要:在研究微博信息传播模式的基础上,借鉴网络传播中采用的信息空间模型构建了微博舆情的三维空间,对微博舆情的主客体进行分析,建立了微博舆情监测指标体系。该指标体系充分考虑了主客体的不同特点和关系,并提出体系中不同指标的量化方法,为管理者对微博舆情进行疏导提供了决策上的支持。 关键词:微博;舆情;指标体系;主客体 中图分类号:G202文献标识码:A文章编号:1671-4792(2012)04-0148-05 Abstract:Based on the dissemination model of microblogging information,and learn from the information space model used in network communication to construct the three-dimensional space of the public opinion,this article analyzes the object microblogging of the public opinion and constructs microblogging public opinion moni-toring index system.This index system fully considers the different characteristics and relationships of the object, and proposes quantified method for different indicators of the system,which provides support of decision-making for managers to divert the microblogging public opinion. Keywords:Microblogging;Public Opinion;Index System;Subject and Object 148

舆情案例分析

网络舆情案例分析 一、舆情危机管控现状 近年来,随着互联网技术的发展,以微博、社交类网站、视频类网站及移动通信为代表的社会化媒体呈现出日新月异的变革,其对网络舆情状态的影响更加复杂深刻,舆情已成为当前社会和谐度和稳定度的标志,成为社会各界的关注焦点。互联网信息具有丰富性、海量性、复杂性、虚拟性、隐蔽性、发散性、渗透性和随意性等特点,对其理解和把握越来越需要用科学、精准、可信的方法。然而,一些部门在网络舆情的收集分析、监测研判、回应沟通、引导说明和危机管理过程中,尚处于粗放式阶段,相关工作较为感性主观,一些部门仍然停留在“部分网民认为”、“某网友认为”等定性描述上,缺乏科学、扎实、直观、量化、可比对的数据基础,难以全面反映特定区域和特定时域网络舆情发生、发展状况与趋势,更谈不上形成系统、规范的网络舆情分析研判体系。如何从主观判断迈向客观分析和量化管理,建立定向分析、定量研究与有效管理体系,成为我们及待解决的重要课题。 二、案例分析:济源“瘦肉精”事件中双汇的危机公关 1、概述:2011年3月15日,中央电视台的维权行动中曝光了济源双汇集团所用生猪中含有大量瘦肉精,严重危害人体健康,此次事件引起广泛热议。双汇集团进行了一些列危机公关行动,

但其中漏洞百出。面对如此状况,如何突出重围重塑企业良好的信誉和形象呢?下面将针对双汇集团“瘦肉精”事件做一个全面的分析,包括:双汇“瘦肉精”事件的经过,双汇在此事件中的危机公关的手段和效果分析,以及双汇危机公关手段的改进和思考,用危机公关中的危机处理原理,分析制定危机公关策略。 2、瘦肉精事件回顾 2011-03-15双汇被爆使用瘦肉精猪肉,“健美猪”大行其道2011-03-16双汇集团承认使用瘦肉精猪肉,发声明致歉 2011-03-17商务部派出督导组前往河南,督查双汇集团下属企业,农业部,开展瘦肉精拉网式监测,双汇集团再次声明,高管被免,产品收回 2011-03-19 国务院派人督查瘦肉精,河南沁阳清查被指过场2011-03-20 河南首次通报:双汇冷鲜肉瘦肉精抽检呈阳性2011-03-21 济源双汇无限期停产整顿,双汇发展重组存隐2011-03-22 济源双汇公司确认17头瘦肉精生猪,国务院工作组要求彻查“瘦肉精”事件,严肃究责 2011-03-23 双汇紧急召开4000多人规模的全国经销商视频会议,以应对下架危机,希望能重新启动市场 2011-03-25 河南“瘦肉精”肇事来源基本查明,发现3个制造窝点 2011-03-30 农业部排查称河南瘦肉精事件属于个案 2011-04-01 双汇召开万人大会二度致歉,拟引入第三方检测产

济南舆情监测系统平台数据分析报告

济南舆情监测系统平台数据分析报告 监测周期:2020-02-20 00:00:00~2020-02-20 23:59:59 分析范围:济南 媒体类型:全部 信息类型:全部 信息倾向性:全部 去重类型:相同URL去重 查询类型:发布信息 报告导出:2020-02-20 18:33:21 一、趋势分析 在整体发展趋势中,2020.02.20 00:00声量最高,共产生1688条信息。在2020.02.20 00:00重要媒体声量最高,共产生63条信息。 (一)整体趋势 监测时间全部声量重要媒体声量2020.02.20 00:00 1688 63 2020.02.20 01:00 0 0 2020.02.20 02:00 0 0 2020.02.20 03:00 0 0 2020.02.20 04:00 0 0 2020.02.20 05:00 0 0 2020.02.20 06:00 0 0 2020.02.20 07:00 0 0 2020.02.20 08:00 0 0 2020.02.20 09:00 0 0 2020.02.20 10:00 0 0 2020.02.20 11:00 0 0 2020.02.20 12:00 0 0 2020.02.20 13:00 0 0

2020.02.20 14:00 0 0 2020.02.20 15:00 0 0 2020.02.20 16:00 0 0 2020.02.20 17:00 0 0 2020.02.20 18:00 0 0 (二)原创/转发趋势 (三)原创/转发分布

类型数据量占比 原创声量1013 60.01% 转发声量675 39.99% (四)媒体/网民趋势 (五)媒体/网民分布 类型数据量占比

网络舆情中的大数据分析方法研究

网络舆情中的大数据分析方法研究 网络舆情是指在网络空间中对网民和生活中的社会事件尤其是一些突发事件的看法和态度。网络舆情通常涉及社会的热点事件,因而经常在网络中快速传播,成为人们谈论的焦点。因而,对网络舆情进行分析和正确的引导显得尤为重要。文章采用大数据分析方法分析网络数据,通过聚类的方法发掘网络舆情中的热点问题。实验证明该分析方法具有较高的热点挖掘能力和及时的能力。 标签:网络舆情;大数据分析;统计方法 一、舆情信息的获取 舆情分析的第一步是要对网页中的信息进行抓取,第二步是对抓取的网页的信息进行预处理。 对网页信息抓取主要采用网络爬虫,爬虫的主要作用是将互联网上的网页下载到本地形成一个互联网内容的镜像备份。它既可以爬取网页链接,又可以爬取网页的文本信息和图像信息。它通过关键字的搜索将对应的统一资源定位为相关的网页页面进行抓取,通過对其进行文本和图像的解析,提取对应网页的文本和图像信息并进行保存。本文中主要提取的是网页的文本信息。 而中文分词是把中文中的汉字系列分割为一个个独立的中文词汇。由于中文词汇与词汇之间的界限远不如英文单词那样清晰,因此,中文分词也是一个技术难点。当前中文分词主要是从主要包括字符串匹配分词方法和机器学习的统计分词方法。字符串匹配分词方法是事先通过一定的方法建立一个庞大的数据库字典,按照一定的方法把待分词的词汇与数据库字典中的词进行匹配从而实现分词的方法。机器学习的统计分词方法是通过词汇出现的频率和在文中的含义等信息对汉字的这些特征进行训练,从而实现分词。字符串匹配分词方法比较准确,但缺乏灵活性,机器学习的统计分词方法能对词的语意进行识别,但由于算法的不完善,准确率不高,因此,在实际中通常是将这两种结合来实现分词。 中文分词的词性主要包括名词、动词、形容词和副词等,形容词和副词常表示事物的状态和特征,因而经常能表明作者对事件的喜怒哀乐之情;动词一般就是用来表示动作或状态,它是对事物采取的动作的直接体现。这些词在舆情分析中就显得尤为重要。 二、文档特征的提取 一个网页的文本通过分词后会有成百上千个中文词汇,如果直接对其分类会影响分类的效率和准确性。因此,在分类前要去除一些无关的词语,留下最能代表文档特征的一些分词作为文档的特征。文档特征提取最主要的方法是把文档的内容和词频进行结合。

基于大数据的舆情分析系统架构

基于大数据的舆情分析系统架构 前言 互联网的飞速发展促进了很多新媒体的发展,不论是知名的大V,明星还是围观群众都可以通过手机在微博,朋友圈或者点评网站上发表状态,分享自己的所见所想,使得“人人都有了麦克风”。不论是热点新闻还是娱乐八卦,传播速度远超我们的想象。可以在短短数分钟内,有数万计转发,数百万的阅读。如此海量的信息可以得到爆炸式的传播,如何能够实时的把握民情并作出对应的处理对很多企业来说都是至关重要的。大数据时代,除了媒体信息以外,商品在各类电商平台的订单量,用户的购买评论也都对后续的消费者产生很大的影响。商家的产品设计者需要汇总统计和分析各类平台的数据做为依据,决定后续的产品发展,公司的公关和市场部门也需要根据舆情作出相应的及时处理,而这一切也意味着传统的舆情系统升级成为大数据舆情采集和分析系统。 分析完舆情场景后,我们再来具体细化看下大数据舆情系统,对我们的数据存储和计算系统提出哪些需求: ?海量原始数据的实时入库:为了实现一整套舆情系统,需要有上游原始输出的采集,也就是爬虫系统。爬虫需要采集各类门户,自媒体的网页内容。在抓取前需要去重,抓取后还需要分析提取,例如进行子网页的抓取。 ?原始网页数据的处理:不论是主流门户还是自媒体的网页信息,抓取后我们需要做一定的数据提取,把原始的网页内容转化为结构化数据,例如文章的标题,摘要等,如果是商品点评类消息也需要提取有效的点评。 ?结构化数据的舆情分析:当各类原始输出变成结构化的数据后,我们需要有一个实时的计算产品把各类输出做合理的分类,进一步对分类后的内容进行情感打标。根据业务的需求这里可能会产生不同的输出,例如品牌当下是否有热点话题,舆情影响力分析,转播路径分析,参与用户统计和画像,舆论情感分析或者是否有重大预警。

微博舆情对青年价值观的冲击

微博舆情对青年价值观的冲击 [摘要]随着技术革命的不断发展和移动终端的不断革新,许多年轻人倾向于利用微博来表达自己对社会的认知和思考,而越来越多的媒体也开始运用微博发布新闻信息,而这种自媒体平台的力量也在不断得改变着社会生活和青年人的价值观。本文以微博平台为基础,思考微博舆情的力量对青年价值观的影响,并提出对正确价值观引导的方法。 [关键词] 微博舆情青年价值观 当今的科技发展日新月异,而新兴的社交平台发展的势头更是迅猛,尤其是微博这一平台更是突出,截止到2013年上半年,新浪微博的注册用户有5.36亿人,2012年第三季度,腾讯微博注册用户达到5.07亿。如今,仅仅运营了四年的微博不仅成为了人们娱乐休闲的工具,更是成为了媒体及个人发布新闻讯息的一大重要阵地。据相关数据显示有的微博用户为青年人,可以说微博这一媒体平台已经逐渐渗透进了青年人的社会生活中。因此青年人对微博中所传播内容的判断以及甄别,对微博的使用以及认识,在一定程度上不断改变着青年的认知以及价值观。 一、微博对青年人的传播优势 微博(英语:microblogging或microblog),是一个基于

用户关系信息分享、传播以及获取的平台。用户可以通过WEB、WAP等各种客户端组建个人社区,以140字的文字更新信息,并实现即时分享。 问卷调查(表1 ―表5):该组问卷针对微博用户中的青年群体,通过给微博用户投递私信、网络问卷投放、纸质问卷发放的形式,用以调查青年微博用户对微博的使用状况。 从表1中可以看出微博对于青年人吸引力体现在如下几个方面: (1)便捷性与及时性。 随着PC产品以及移动终端的普及化和移动网络3G、4G 网络的迅速发展,微博用户可以通过下载客户端到终端机上进行操作,可以及时发布信息,也可以及时阅览新闻。在调查中显示有28%的青年微博用户在吸引力选项中选择“方便快捷发布自己的信息”,这体现出微博方便快捷的特点。这一特点体现得较为突出,例如2011年温州动车事故发生时,最先发布的信息就是在微博平台上。 (2)互动性与裂变性。 如今的微博不再如同博客等早期的网络社交平台是单 向性的,它的传播是交互性的、裂变式的。一条热门微博可以被评论、转发上十万次,而36%的青年微博注册用户选择“方便与他人沟通及交流”,显示出普通人有时可以实现和

舆情监控系统

舆情监控系统 设 计 方 案

目录目录

网络舆情监测系统解决方案 网络舆情监测系统利用互联网信息采集技术、智能信息处理技术和全文检索技术;结合网络舆情的传播分析模型:对境内外网络中的新闻网页、论坛、贴吧、博客、微博等网络资源进行全网监控、定向采集和智能分析,把互联网读薄,读透,提供相关舆情、负面舆情、热点信息的发现、主题事件监测、分类监测、舆情实进预警、舆情监管、统计分析、辅助决策支持等多层次,多维度的舆情信息的服务,根据用户有网络舆情监测和定向追踪等信息需求,形成简报、报告、图表等分析结果,从而帮助用户及时掌握舆情动向.为领导和舆情工作部门提供信息参考和决策支持. 一、背景概述 随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活.网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,涉军涉警事件更是成为部分网民炒作对象,通过这种网络来表达观占、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步.可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器. 网络舆情是通过互联网传播的公众对现实生活中某些热点、焦

点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴(回贴) 、转帖等实现并加以强化.当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元.对部队来说,如何加强对涉军涉警网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护部队声誉、促进部队健康发展具有重要的现实意义. "网络舆情监控系统"是针对在一定的社会空间内,围绕涉军涉警事件的发生、发展和变化,民众对部队的态度天网络上表达出来意愿集合而进行的计算机监测的系统统称. "网络舆情"是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和.网络舆情形成迅速,对社会影响巨大,加强互联网信息监管的同时,组织力量开展信息汇集整理和分析,对于及时应对网络突发的涉军涉警事件和全面掌握社情民意很有意义. 二、建设必要性 由于舆情有突发性,随机性,多样性等特点,传统舆情监控已经无法满足目前的形势需要,互联网舆情监测系统应运而生. 各单位对于突发事件,如果有工具能及时监测发现舆情信息及其根源,及时做好危机公关,做好积极的舆论引导工作,处理还处

微博舆情传播规律研究

情报学报 I SSN1000-0135 第31卷第12期1299- 1304 2012年12月J O U R N A LO FT H EC H I N ASO C I E T YF O RSC I E N T I F I C A N DT E C H N I C A LI N F O R M A T I O N I SSN1000-0135V o i .31 N o .12 1299-1304D e c e m be r 2012 do i Z 10.3772/j .i s s n.1000-0135.2012.12.010 收稿日期Z 2012年7月18日 作者简介Z 钱颖 女 1976年生 博士 讲师 主要研究方向Z 信息资源管理\新媒体传播O 张植 女 1988年生 硕士研究生 主要研究方向Z 网络舆情传播\新媒体传播O E -m a i i Z z ha ng na n339@126.c o m O 赵来军 男 1970年生 博士 教授 高级工程师 主要研究方向Z 物流与供应链管理\安全管理\环境管理O 钟永光 男 1972年生 博士 教授 博士生导师 主要研究方向Z 系统动力学与运营管理O 1) 基金项目Z 国家自然科学基金资助(90924030) 上海浦江人才项目资助(11P J C 075) 上海市教育委员会 曙光计划 项目(09SG 38) 教育部人文社会科学研究一般项目(项目编号Z 10Y J A 630021)O 微博舆情传播规律研究 1) 钱 颖1 张 捕1 赵来军1 钟永光 2 (1.上海大学管理学院 上海 200444;2.青岛大学管理科学与工程系 青岛 266071) 摘要 随着用网络户数的增加 微博已成为网民表达意愿的重要渠道 成为当前最具影响力的传播工具之一O 由突发事件导致的舆情在微博上传播迅速 影响广泛O 基于传统传染病模型(SI R 模型) 本文对微博上舆情传播规律进行研究 建立了微博舆情传播模型 并用2011年甘肃校车事故在新浪微博上的传播进行实证研究O 研究发现Z 原创 转发帖子爆发迅速 第二天达到峰值 衰退的速度较慢 六天后帖子数稳定在较低水平O 用微博传播模型对甘肃校车事件中舆情传播规律进行仿真 仿真结果与历史数据拟合度高 验证了此模型用来研究微博舆情传播规律的可行性O 最后利用此模型 研究了不同情景下的微博舆情传播规律O 关键词 新浪微博 突发事件 SI R 模型 微博舆情模型T h e s p r e adof p u b l i c s e n t i m e n t onmi c r o-b l oggi n g u n d e r e m e r ge n c i e s O i a n Y i ng 1 Z ha ng N a n 1 Z ha o L a i j un 1a nd Z ho ng Y o ng g ua ng 2 (1.m anage m e nt sc ho o l shanghai u ni u e r s i t y shanghai 200444; 2.m anage m e nt sc i e nc e and E ngi e e r i ng de p ar t m e nt @i ngdao u ni u e r s i t y @i ngdao 266071) A b s t r ac t Wi t h t hei nc r e a s i ngnum be ro f us e r s m i c r o -bi o g g i ngha sbe c o m et hem o s t i nf i ue nt i a i c o m m uni c a t i o n c ha nne i .T he pubi i c o pi ni o n g e ne r a t e d by e m e r g e nc y s pr e a ds r a pi di y o n t he m i c r o -bi o g g i ng a nd ha s g r e a t i m pa c t .b a s e d o n t he t r a di t i o na i r um o r s pr e a di ng m o de i (SI Rm o de i ) w e s t udi e d t hepa t t e r n o f pubi i co pi ni o n di s s e m i na t i o n o n t hem i c r o -bi o g g i ng .T hes c ho o i bus a c c i de nt ha ppe ne d i n G a ns u pr o v i nc ei n N o v 2011i s us e d a s a n e m pi r i c a i e x a m pi e .D a t as ho w s t ha t t ha t t he num be r o f o r i g i na i po s t s a nd f o r w a r de d po s t s i nc r e a s e d r a pi di y a t t he be g i nni ng r e a c hi ng pe a k o n t hes e c o nd da y w hi i er e duc e d s i o w i y r e a c hi ngai o ws t a bi ei e v e i s i xda y s i a t e r .T hem o de i s i m ui a t i o n r e s ui t f i t s t hehi s t o r i c a i da t a w e i i w hi c h i s a n e v i de nc e t ha t t he m o de i c o ui d be us e d t o s t udy t he pubi i c o pi ni o n s pr e a di ng o n m i c r o -bi o g g i ng .b a s e d o n t he m o de i s i m ui a t i o n w e a na i y z e d ho wpubi i c o pi ni o n s pr e a d unde r di f f e r e nt s c e na r i o s . K e yw or d s Si na m i c r o -bi o g g i ng e m e r g e nc y SI Rm o de i pubi i c s e nt i m e nt s pr e a di ng m o de i o n m i c r o -bi o g g i ng 1 引 言 微博自2009年8月上线以来得到全面推广与应用O 截止到2011年12月31日 我国微博用户数 量已达到2. 5亿O 由于微博信息产生和获取具有很强的自主性 内容短小精悍 信息共享便捷迅速等特点 微博已经成为网民们表达意愿\分享心情的重要渠道O 人民网舆情分析专家预测 在未来的突发事件中 微博将成为最具影响力的传播工具O 突发事 - 9921- 万方数据

大数据-云计算-微博-舆情-指标-指标体系-微博舆情监测指标体系研究[1]

收稿日期:2011-02-22 修回日期:2011-06-28 基金项目:国家社会科学基金重大项目 “突发事件网络舆情演化模型和仿真系统研究”(编号:09&ZD014)。作者简介:高承实(1973-),男,博士,研究方向:网络信任管理、网络行为认知;荣星(1986-),男,博士研究生,研究方向:可信计算、网络安 全;陈 越(1965-),男,教授,博士生导师,研究方向:信息技术、网络安全。 微博舆情监测指标体系研究 * 高承实 荣 星 陈 越 (解放军信息工程大学电子技术学院 郑州450004) 摘 要 在研究微博信息传播机制的基础上,结合信息空间模型构建了微博舆情的三维空间,运用层次分析法,建 立了微博舆情监测指标体系。该指标体系综合考查了社会类指标与技术类指标、舆情主体与舆情受众之间的关系,并给出了不同指标的量化计算方法,为管理者实行舆情疏导提供了决策上的支持。关键词 微博 舆情指标体系 层次分析法中图分类号 G353.1 文献标识码 A 文章编号1002-1965(2011)09-0066-005 Research on Public Opinion Monitoring Index -system in Micro -blogging GAO Chengshi RONG Xing CHEN Yue (Institute of Electronic Technology ,PLA Information Engineering University ,Zhengzhou 450004) Abstract Based on the research of information broadcasting mechanism in Micro-blogging ,three-dimensional space of public opinion in Micro-blogging is constructed by integrating Information Space model ,and a monitoring index-system is established through AHP (Ana-lytic Hierarchy Process ).The system takes both social and technical indexes ,the relationship between subjects and audiences into consid-eration ,and presents quantization calculation method of each index ,which provides decision-making support to dredge public opinion for managers.Key words micro-blogging public opinion index-system AHP 0引言 微博,即微型博客(Micro -blogging ),是Web2.0 时代新兴起的一种集成化、开放化的互联网社交服务。2006年Evan Williams 等人联合创建最具有代表性的Twitter ;2007年之后,国内陆续出现了微博客网站,如饭否、 做啥、叽歪、嘀咕、贫嘴、同学网、腾讯滔滔、9911等[1] 。2009年8月,新浪加入微博领域,借助网站平 台及名人资源优势启动内测,引来众多网民的关注与参与。 信息的真实性是微博中存在的一大严重问题,2009年6月,西方媒体和政治势力借助“Twitter ”散发小道消息,造成了伊朗大选后发生的政治动荡。由于微博中存在大量的碎片化文本信息, 目前采取的系统审核或人工实时监控,并不能很好地限制这些虚假信息的传播。微博的开放环境为网络舆论的自由化提供了便利,网络谣言、偏激和报复性的人身攻击行为层出 不穷,部分网络舆论给国家的稳定和社会的和谐带来 了严重的挑战[2] 。2010年在我国, 随着微博井喷式的发展,网民爆料的首选媒体更多地转向微博,论坛、博 客在事件曝光方面的功能明显弱化,舆情热度靠前的50起重大舆情案例中,微博首发的有11起,占22%,2010年的大事件中几乎都有微博在发生着作用[3]。被称为“女厕攻防战”的微博直播,是今年以来国内微博最吸引眼球、威力显现最突出、影响最始料未及的事件, 对社会的和谐稳定产生了消极的影响。可见,微博在网络媒体中主导地位越来越明显。 现有的舆情分析指标体系多针对互联网舆情,曾润喜 [4] 等设计了网络舆情突发事件预警系统,构建了 警源、警兆、警情3类指标体系,指标侧重于反映舆情本身的演化。李雯静 [5] 等从舆情主题的角度重点列出 了网络舆情信息分析的指标,并给出了具体的指标计算方法,但未突出舆情受众的能动性作用。张一文 [6] 等尝试建立了一种非常规突发事件网络舆情指标体 第30卷第9期2011年9月 情报杂志 JOURNAL OF INTELLIGENCE Vol.30No.9Sep.2011

基于微博的舆情监测与分析的研究

科技创新导报 Science and Technology Innovation Herald 165 信息科学 DOI:10.16660/https://www.sodocs.net/doc/346388745.html,ki.1674-098X.2018.06.165 基于微博的舆情监测与分析的研究 陈忠菊 (辽宁公安司法管理干部学院 辽宁沈阳 110161) 摘 要:微博具有很多的特点,比如:传播迅速、互动性强、操作简单等,凭借这些优势,微博近年来得到了飞速发展。当前,社会的方方面面都已经渗透进了微博,并且它已经成为了新闻舆论的主要源头。传播和形成网络舆情一般都是爆发式的增长,因此对社会产生的影响力是巨大的。我国当前在分析和监测微博舆情方面一直都处于较为贫乏的情况,因此需要加强这方面的分析和研究。关键词:微博 舆情检测 舆情分析 中图分类号:TP311 文献标识码:A 文章编号:1674-098X(2018)02(c)-0165-02 随着网络技术的发展,网络舆情的有效传播途径和主要源头是微博,因为微博具有很低的进入门槛,同时可以方便地操作,具有较强的互动性,因此在近年来在我国得到了广泛的推广和使用。随着微博的应用,随之出现了很多的安全隐患,微博中出现了各种违法信息和谣传等,给社会带来了很大的影响。因此,需要加强对微博的舆情监测和分析,这是加强网络安全的有效途径和重要方法。 1 微博舆情监测和分析现状 当前已经有专门对微博进行舆情监测和分析的软件,比如较为典型的有:方正智思舆情预警辅助决策支持系统、TRS互联网舆情信息监控系统、Goon ie互联网舆情监测系统等等。在分析和监测微博舆情方面,这些软件能够起到非常重要的预警作用,因此可以为社会的和谐、安定奠定坚实的基础。但是,在分析和检测微博舆情方面,大多数的系统都没有对微博用户覆盖面广泛、用户基数庞大这一问题进行充分的考虑,在这样的背景下,如果使用的是普通的关系数据库,是很难达到使用需求的,引入No S QL技术存储数 据就是一个很好的发展方向[1] 。 2 微博舆情的传播 对于微博来说,它的舆情传播具有如下明显的特点。 2.1 简单的信息生成和传播 对于微博信息来说,只需要经过简单的操作就可以对微博新闻中的人物进行重点关注,对于论坛和新闻中的内容还可以随时转发。此外,微博还受到移动终端的支持,可以完全不受时间和地域的限制,因此微博具有很强的简便 性和易于操作性[2] 。2.2 信息传播快捷 一旦有重大事件发生,微博网友可以迅速发出信息,相较于传统的媒体要更加及时、迅速、便捷。比如2011年7月23日的动车事件,由微博网友第一时间发出,相较于传统媒体要提前两个多小时。 2.3 信息传播模式是病毒爆发式的增长 一旦微博发出消息,所有的关注用户都可以在第一时间收到,然后收到的用户再继续向外传播,微博信息因此出现病毒爆发式的传播速度。 3 基于NoSQL的数据库设计 2009年Oskar s son组织了在美国旧金山的一次非正式会议,NoSQL第一次出现在这次会议上。NoSQL属于当前 数据库家族的外来人员,虽然通用特征较为类似,但是其特征并没有一个明确定义。将NoSQL引入到系统数据库中时要根据舆情监控的具体情况来进行,在数据的写入过程中,可以将数据的不同字段分别写入到No SQL和My SQL中,在数据的读取过程中,读取可以通过No S QL和My S QL的组合字段来完成。 为了让N o S Q L 和M y S Q L 将自身的的优势充分发挥出来,设计了本文中的架构模式,也就是说关系存储由MySQL来实现,数据存储由MySQL来实现。采用这样的设计具有很多的优点,可以将MySQL的IO开销节省出来,将My SQL的缓存命中率提高,因此My SQL的恢复速度和数据备份被提升,扩展性更好。这种采用架构模式,相较于传统的单体架构,能有效提高系统的可扩展性和多样性能。 4 设计和实现基于微博的舆情监测和分析系统 4.1 软件体系结构 对于系统来说,它分成前台数据展示模块和后台数据分析模块两部分。前台模块是整个系统的核心,主要用来分析和抓取数据。前台模块主要是完成基本的操作维护和展示WEB数据等。 4.1.1 前台 对于前台结构来说,它的展示程序主要分成用户登录和管理、设置关键词及用户监控网址、舆情搜索、舆情信息展示等四大板块。这其中可以分五类来表现和进行舆情整体展示,也就是:舆情统计、展示监控网址、展示网站类型、展 示最新舆情。对于前台展示程序来说,它主要是基于JAVA 图1 系统后台

网络舆情分析系统的研究与设计

网络舆情分析系统的研究与设计 摘要:网络舆情是指在一定的社会空间内,通过网络围绕中介性社会事件的发生、发展和变化,民众对公共问题和社会管理者产生和持有的社会政治态度、信念和价值观。随着科技的发展,政府迫切需要更好地监控与引导网络,本文通过研究现今网络舆情分析系统的技术特征,并根据需要,介绍了网络舆情分析系统的一种可行模型,能够提高网络舆情分析的准确性和灵活性,有效促进我国网络舆情分析工作的迅速发展。 关键词:网络舆情;网页文本结构化;文本分类;文本聚类 互联网的高速发展使网络信息越来越难以处理,所以,传统的以人工分类为基础的处理方式已完全不能够适应如此规模的网络信息量得处理工作。作为一个新的研究课题,对网络舆情的监控和分析,必须建立在高科技的现代信息技术当中,从而能够及时面对网络舆情并第一时间对其进行主动控制和疏导。 一、网络舆情分析系统的总体模型概括 网络舆情分析系统根据用户的不同需求,对特定种类的以网络为载体的新闻和消息在收集后通过网页净化、词频统计等手段对信息进行有效的预处理活动,并将预处理的所得结果入库,并通过数据挖掘算法对信息进行分析,最后会得到一定时期内网络所出现出现的热点信息,并对其进行追踪,得到事件的详细信息。 1.1 输入输出层面 输入层指互联网搜索、数据源等。随着网络在获取信息方面的便捷性和灵活性的提高,许多信息平台,如博客、新闻和政府网站都成为网络舆情的监控源。输出层一般来说指的是前端展示输出,对于网络舆情分析系统来说,其输出程序主要根据用户需要提供信息,其信息的种类呈现出多样化的特点。 1.2 业务处理层面 1.2.1网络舆情系统信息采集以及预处理方式 网络舆情监控系统需要在了解用户需求的前提下,设定所需主题或目标,并利用人工和自动相结合的信息采集手段完成信息收集的任务。对于已经定位的网络资源,需要知道网络资源是否已进入数据库中,若己保存到数据库,系统需继续进行其他资源的收集。网络舆情信息预处理是网络舆情信息分析系统的准备阶段,能够对网页当中的信息进行数据清洗和分类处理后,形成格式化的数据然后上传到数据库,并进行信息过滤,滤除无关信息,保存重要信息。 1.2.2 网络舆情数据存储

从微博热点事件分析微博舆论的形成

从微博热点事件分析微博舆论的形成河南大学新闻与传播学院2011级研究生井忠勇 摘要:通过热点的微博事件分析了微博舆论概念的使用现状,通过考察舆论概念的流变,结合对微博自身特性的分析,界定了微博舆论的概念,并剖析了其构成要素和特征。分析了微博舆论形成过程中的影响因素,并以具体事例中微博舆论的形成和演变过程为切入点考察微博舆论形成过程中不同的形态分布和生成模式。 关键词:微博舆论,引导与控制,生成模式 一、舆论概念及微博舆论概念的延伸 关于舆论概念,中外学者从不同角度和学科视野进行了阐释:政治学者和历史学家主要从舆论对于决策的影响方面来界定舆论;心理学则主要关注公众意见表达时的心理过程;社会学把舆论放到社会这个大环境下,考察舆论形成的社会化过程;而社会心理学则侧重舆论行为中人的知觉、感触,并以此来理解和界定舆论。我国学者对舆论概念的界定也有很多,其中具有代表性的大概有以下三种:一是舆论是显示社会整体知觉和集合意识、具有权威性的多数人的共同意见,二是舆论是社会或社会群体中对近期发生的、为人们普遍关心的某一争议的社会问题的共同意见,三是舆论是公众对其关心的人物、事件、现象、问题和观念的信念、态度和意见的总和,具有一定的一致性、强烈程度和持续性,并对有关事态的发展产生影响。 陈力丹老师后又在其著作《舆论学-舆论导向研究》一书中,综合以上三种定义,重新界定了舆论:舆论是公众关于现实社会以及社会中的各种现象、问题所表达的信念、态度、意见和情绪表现的总和,具有相对的一致性、强烈程度和持续性,对社会发展及有关事态的进程产生影响。其中混杂着理智和非理智的成份。 如果把微博舆论看作舆论的基本形态之一,它应该同时具有舆论的基本特征,这为我们界定微博舆论概念提供了参考。我们尝试对微博舆论作出如下界定:“微博舆论是舆论在信息时代的一种独特存在形式,是公众以微博为介质和表达方式的对其关心的人物、事件、现象、问题和观念的信念、态度和意见的总和,具有一定的一致性、强烈程度和持续性,并对有关事态的发展产生影响。” 这里,微博舆论包含几个要素:微博舆论的主体——公众;微博舆论的客体——经由微博传播放大的社会现象和问题;微博舆论本体——以微博为表达方式的各种信念、态度、意见。以下我们对微博舆论这几个方面要素进行分析,来更好的把握微博舆论这一概念的内涵和外延。 二、微博舆论特征 微博舆论是舆论的一种存在形态,因此具有舆论的基本特征,但由于微博独特的传播特性,微博舆论又呈现出自身的特点。 (1)舆论形成速度快,信息源头多样 微博几何级裂变的特征,使信息传播速度空前加快,其转发、评论、加关注和搜索等基本功能形成了独特的链状、环状、树状的对话结构。微博具有即拍即发功能,这使其天然的成为事件的第一目击者和发布者,对突发事件报道达到“秒互动”的地步。它可在事件发生后的几秒钟内对外界报道事件的发生和进度,并在一秒的时间内得到其他用户的回馈,汇聚意见流,形成舆论。这个特点使微博舆论的形成速度大大加快。 (2)舆论主体多元化,舆论更具规模效应

网络舆情监测系统评价标准

网络舆情监测系统评价标准 随着互联网的快速增长,网络舆情监测软件及其服务市场也迅速地发展起来,保守地估计,在中国大陆地区这个市场的总量已经逼近10亿元人民币规模。 市场参与者主要包括四种类型的公司:第一类是拥有网络信息搜索或(中文)文字信息处理等相关技术的软件公司;第二类是公关、广告公司,这类公司是在传统媒体监测业务基础上发展出网络新媒体监测业务;第三类是网络营销服务公司,近几年这类公司增长迅猛,网络社会化媒体的飞速发展是其发展的催化剂;第四类是依托传统媒体延伸出的增值服务。随着网络的发展,不少传统媒体也开始“触网”,并逐步发展出针对网络媒体的新业务,而网络舆情监测是其中的一个方面。例如,人民网舆情监测室。除了以上四类公司之外,还有一类进行网络舆情监测业务的参与者,他们是主管部门或行业机构所属的网络舆情监测机构,但严格意义上讲,此类机构和参与完全市场竞争的公司是不同的,因此,单独另归为一类。 社会化网络媒体的兴起,正在改变传统的信息传播机制。网络传播具有匿名性、速度快、范围大、持续力强、传播渠道多元化、传播效果可测量等特点。一条负面信息从出现到形成舆论热点的周期,从原来的24小时(传统新闻媒体比较典型的更新周期)缩短到现在的4小时(微博热点话题达到第一个传播峰值比较典型的时间周期)。

如果不能在这4小时内做出解释、反馈、制定应对策略,就可能出现舆论一边倒的局面,甚至可能发生极具品牌杀伤力的公共危机。由此,也就有了网络舆情监测响应“黄金4小时”的说法。 做出及时、准确应对的前提是,要能够在第一时间了解网络舆情的内容、发生源、关键传播途径等相关信息数据。由此,对于网络舆情监测软件的性能提出相应要求。 如何来评价网络舆情监测软件(系统)的性能呢?个人认为主要着眼于以下三个方面。 评价标准之一:对网络内容监测的准确性。 对于内容的判断是一个关键技术,目前的监测系统还不能做到对内容信息的完全自动判断和处理,在不能保证内容识别百分之百准确率的情况下,往往需要对监测分析的中间产物或不能识别的信息进行一定程度的人工校验和清洗。 中文信息在处理上具有一定特殊性和技术难点。英文每个单词之间用空格或标点符号进行分隔,与英文不同,中文字之间没有空格,由字组成词存在多种可能情况,中文分词是识别的一个难点。 分词难点:一是分词的歧义识别,歧义是指同样的一句话,可能有两种或者更多的切分方法。主要有“交叉歧义”、“组合歧义”、“真歧义”(相关定义参见附录)三类情形。“真歧义”必须要联系上下文才能够确定在文中的具体涵义;二是新词识别,随着时代的发展,中文新词不断涌现,如果没有被收录而要进行自动识别是非常困难的。与之相似的还有专业术语、名称(包括,人名、商标、简称、

旅游景区网络舆情大数据分析方案

旅游景区网络舆情大数据分析方案

旅游景区网络舆情大数据分析方案 目录 旅游景区网络舆情分析方案 (2) 1. 项目目的 (2) 1.1 实现旅游行业市场精准定位 (2) 1.2 实现旅游行业市场精准营销 (3) 1.3 支撑旅游行业精准管理 (3) 1.4 改善旅游行业服务水平 (3) 2.监测内容 (3) 2.1 监测关键词 (3) 2.2 数据方法 (3) 3. 游客认知的景区印象 (4) 3.1 游客认知的景区特色 (4) 3.2 游客认知的景区各特色排行 (6) 3.3 景点热度(网评个数) (8) 3.4 景区门票价格以及游客评论 (8) 3.5 景点交通指南及游客评价 (9) 3.6 景区餐饮食品消费状况 (11) 4 景区游客画像 (12) 4.1 年龄分布 (12) 4.2 性别分布 (13) 4.3 出游同伴 (14) 4.4 出游目的地 (15) 4.5 出游方式 (15) 4.6 停留时间[数据完善中] (16) 4.7 旅游消费【数据完善中】 (17) 4.8 住宿方式【数据完善中】 (17) 4.9 出游时间(网评时间) (17) 4.10 出游目的[数据完善中] (18) 4.11 关注媒体(网评来源) (19) 1.项目目的 1.1 实现旅游行业市场精准定位 大数据将打破传统数据的样本量小、时间滞后、准确度低等瓶

颈,基于大数据数学模型对市场进行精准预测; 1.2 实现旅游行业市场精准营销 经过大数据,了解掌握市场竞争者商情动态,同时建立旅游消费者大数据库,有针对性的制定营销方案; 1.3 支撑旅游行业精准管理 经过大数据,能够实现对资源、市场、客户等各个要素的定量把控,实现旅游行业的精准管理; 1.4 改进旅游行业服务水平 经过大数据挖掘,获取游客的真实反馈意见,对游客的评论进行收集,建立旅游反馈大数据库,来改进旅游行业服务水平; 2.监测内容 2.1 监测关键词 【北京市】:香山公园、慕田峪长城、十渡、八大处、爨底下村、潭柘寺、红螺寺、凤凰岭、龙庆峡、灵山; 2.2 数据方法 【数据源】:新浪微博、新浪论坛、新浪博客、百度新闻、百度旅游、蚂蜂窝、乐途旅游、在路上、蝉游记、面包旅行、携程、

相关主题