网络新媒体的发展,改变了传统世界既定的舆论场。围绕中介性社会事件的发生、发展和变化,民众通过网络对公共问题、现实矛盾和社会管理产生和持有的社会政见、处世态度和价值观念,无不蕴藏在网民的个体认知和个人情绪之中。因此,基于舆情潜在情绪分析,以及对复杂网络舆论场的引导,对于深度挖掘内幕、深入了解动机和及时有效应对,是国家治理能力和治理体系现代化题中应有之义,成为社会治理研究的一项重大课题。
在许多工作中,往往片面着重于对在线舆情信息进行归纳总结和整理编报,忽视了对多维数据的分析和潜在情绪的研究,存在过分重视收集和处置,却轻视研判和防范的问题。互联网的开放性使广大用户都有机会成为信息的发布者和传播者,其匿名性又使得网民更有意愿表达真实观点、反映真实情绪。由于受各种主客观因素的影响,一些网络言论缺乏理性,尤其当涉及公共安全事件时,出于恐慌等原因的情绪化言论很可能迅速发酵,成为有害信息的源头,触发网络风暴,引发群体性危机事件,对社会稳定造成影响。
如何运用网络舆论场这把双刃剑,是网络新媒体背景下前所未有的挑战,需要我们充分认识、运用好网络传播规律。事实上,大数据时代如何实现对当下网络舆情进行智能分析显然是一个难点。为解决这一难题,科研人员尝试从多种角度进行舆情分析,对于公共安全事件而言,潜在情绪分析便是十分合适的切入点之一。
以新冠肺炎疫情为例。每当公共安全事件突发,民众不可避免地产生各种各样的情绪。从新冠的首次引起注意开始,网络上就出现了不同形式的舆情,无论是骨肉分离的生死场、兴风作浪的名利场,还是多方势力角逐的风云场,所对应情绪大致可分为正面与负面两类,值得一提的是,这些舆情都有可能带来积极或消极的影响。本次疫情中,正面情绪所对应的舆情大多是对国家、社会、医务工作者的赞扬,包含“加油、鼓励、信心”等字眼,此外还包含常识科普等方方面面,增强了人民对于国家战胜疫情的信心、引导社会各界形成良好的社会氛围、对于国家各项防疫措施的落实有着重要的推进作用;但诸如涉及“疫苗研制”“疫情控制”等类谣言、诈骗信息也会营造另一种情绪氛围,导致群众轻视疫情的严重性,甚至购买“特效药”受骗。而负面情绪所对应的舆情包括对重大损失的渲染、对物资情况的担忧、对组织执行能力的质疑,这些舆情一定程度上散播了恐慌情绪,但也使人们出于恐惧心理提高了警惕、呼吁透明可靠的线索来提高自己的安全感,从而倒逼各组织更加负责的盘查问题、实事求是,避免了疏忽;尤其要关注那些造成恶劣消极影响的负面情绪,如部分境外媒体的负面谣言通过自媒体进行传播,为博眼球而歪曲事实,甚至存在强烈的种族歧视色彩和排华情绪,拥有这样负面情绪的言论、舆情更是我们在舆论场上应当警惕的。
实际上,在仅对于舆情潜在情绪进行两个类别的判定时,即能根据经验推定出许多舆情表达的形成原因和价值取向。随着对情绪分类的细化,得到的结论还将更具可操作性。由此可见,网络舆情的潜在情绪分析是复杂的系统,涉及社会学、心理学、传播学和信息科学等多个领域,须交叉融合、边缘研究,重点是通过分析公共安全事件舆情中的潜在情绪,能够促使我们对舆论场进行快速精准的认知和预判,进而开展针对性的引导和防范。
内容上文本舆情仍是构建舆情系统的基础
用户舆情信息以多种方式存在,包括文本、音频、图片、视频等,其中文本舆情分析最为基础。文字作为人类表达观点的有利武器之一,不管是在论坛、微博等社交平台,淘宝、京东等购物平台,都占据相当大的信息比重。准确细致地分析文本舆情,对于舆情系统的构建起到至关重要的作用。
自然语言处理中一个重要的研究方向为情绪分析(SentimentAnalysis),其目标是自动挖掘和分析文本中涉及的观点、情绪、立场等信息。一般的研究框架包括情感对象和观点的抽取(Entity/Aspect/Opin⁃ionExtraction),情绪分类(Senti⁃mentClassification)和情感检索与归纳(Sentiment Retrieval andSummarization)等任务。其中抽取任务(Extraction)是指对于一段原始文本,可以自动地标记出涉及到的观点对象和其对应的观点。分类任务(Classification)是指判断文本的情绪极性,是否为积极的、消极的或中立的。检索与归纳任务(RetrievalandSummarization)指从文本中自动找出与关键词相关的信息并进行总结。故通过情绪分析技术可进行舆情态势感知,准确发现社交平台的意见倾向和预警信息,客观反映舆情状态,同时也有助于对极端情绪的检测与控制。
工作上细化文本舆情分析粒度以提升精度
早期的情绪分析依据语法分析器和情感词典进行,如今深度学习取得重大突破,可借助神经网络自动地捕捉文本中包含的语义信息,进行情感分析。随着研究的深入,精度不断提升,粒度不断细化。
情绪分析按照粒度可分为文档级(Documentlevel),句子级(Sen⁃tencelevel),属性级(Aspectlevel),这里的粒度主要指待分析的对象级别。文档级情绪分析(Documentlevelsentimentanalysis)指对整篇文档的全局情绪进行分析判断。句子级情绪分析(Sentencelevelsenti⁃mentanalysis)的分析对象为一个整句。而属性级情绪分析(Aspectlev⁃elsentimentanalysis)属于较为细粒度的子任务,是指对所描述事物的属性情感极性进行判断。
从舆情分析的角度而言,细化的情绪分析可以更加准确地把握舆情态势。因为社交媒体的发展,网民在发表言论的时候,可能涉及多个对象和观点,而在这种情况下,文档级情绪分析和句子级情绪分析都无法准确地将情感对象与对应观点进行对齐。此外,社交媒体中存在着大量的反讽表达和幽默表达,可以结合使用讽刺检测(SarcasmDe⁃tection)或幽默检测(HumorDetec⁃tion)等领域中的前沿技术,准确把握隐藏在文本表述下的真实情感,增强文本舆情检测的准确度。
方法上利用多模态媒体信息实现全方位、多视角的舆情分析
互联网媒体信息的多元性和多模态性使得公共舆论和情绪的表现形式具有多样化的特征,通过结合文本、图像、语音等多种形式的情绪分析技术,可以实现多媒体信息的相互补充,提高舆情分析的精确性,特别是在通过单一的文本或图片无法判断出舆情动向的情况下,多模态媒体分析技术从更加全面的角度,全方位地挖掘出网民和公众的情绪,有利于更好的理解公共舆论的观点、立场和倾向,实现网民情绪的正确引导,促进网络空间的舆论治理。
一是利用自然语言处理技术(Natural Language Processing,NLP)对文本蕴含的主题和情感词汇进行抽取和分析,从而挖掘出公众对某一事件的态度和情绪。具体来说,文本情感分析技术(TextSen⁃timentAnalysis,TSA)根据文本内容,识别其中的情绪关键词,并结合上下文语境,判断情感为积极、中性或者消极,从而分析出文本中蕴含的情绪倾向。
二是采用数字图像处理技术(DigitalImageProcessing,DIP),对互联网媒体信息中的图像内容进行分析,比如图像中人物的面部表情、肢体手势、人物动作等视觉信息,进而分析出人物的情绪状态和行为反应。与此同时,结合光学字符识别(Optical Character Recognition,OCR)技术,可以提取出图像中的文本内容,从而补充图像信息。
目前,目标检测技术和光学字符识别技术已经比较成熟。具体来说,通过目标检测技术,可以检测出图像中出现的人物、背景等目标信息,更进一步,结合人脸表情识别(FacialExpressionRecognition)、人体姿态识别(HumanGestureRec⁃ognition)等技术,可以快速地分析出人物的情绪和行为,从而捕捉到人物的情感动向,当检测到过激行为,可以及时报告至警报系统,防止舆情恶化和社会秩序混乱。当图像中存在情绪化、煽动性的文字内容,可以采用光学字符识别技术来提取文本,并采用文本情绪分析工具来提取情绪关键词,从而精确地识别图像内容表达的人物诉求。
三是借助语音识别技术(Speech Recognition Technolo⁃gy),分析视频中的语音信息,包括语音内容、音调强度等,从中提取说话人的情感特征。具体来说,采用语音转文本技术(Text ToSpeech),将语义转化为文本内容,并结合文本情绪分析工具分析语音中蕴含的情绪特征。另外,可以通过对语音的频谱分析和音调强度分析,识别出说话人的情绪激烈程度。
总之,重点关注公共安全事件背景下的网络舆情,挖掘网言网语中的网民情绪动向,分析其言行表达的深层次原因和价值取向,对于支撑网络舆情研究和引导工作至关重要,对于网络空间科学治理工程意义重大,对于治理能力和治理体系现代化建设具有积极作用,应切实予以加强。