1、eRS情感分析運作原理,網絡非結構化數據,全渠道網絡爬蟲,結構化中文語料,Data Mining,Sentiment Analysis,中文分詞,分詞算法,文本清洗,由於由於中文不像英文一樣有天然的分詞,所以必須對文本進行額外分詞。,正則表達式,形成句向量,採用由Google提供的詞向量轉化模型,該模型利用深度學習方法將文本數據轉化為句向量。,Doc2vec,分類器,將大量訓練集,使用機器學習,進行情感分類。,情感值輸出,依照分析需求,提取有用文字符號。,Modeling,情感分析-針對單一文本與總體事件分析情感,根據分析,民眾對該餐廳評價偏向正面。,針對不同來源文本,分別經過模型求出情感值,
2、並根據總體事件的所有文本,計算並描述網民對該事件(議題、品牌,政策等)的總態度。,情感分析-針對單一事件 洞悉網民態度分佈,65%,35%,針對單一事件,在全部的網絡渠道中,綜合所有來源,計算網民意見分佈,例如澳門民眾針對某品牌手機,在2015年間,共有10000條評論,3500條傾向正面,6500條傾向負面,則澳門民眾對該手機總體評價偏向負面。,情感分析-監測單一事件的正負面討論量及輿論方向變化,針對單一的事件(例如政策討論),監測隨時間的正負面評論消長趨勢,並分析出輿論偏向,例如針對某公共政策的討論,追蹤每個時間點的正負面評論數(bar chart),再計算整體輿論對該政策討論,偏向正面或
3、負面(line chart),深度掌握議題趨勢及輿論的方向與數量。,Positive,Negative,情感分析-針對兩個以上事件的情感變化趨勢對比,針對兩個以上的事件,對比隨時間的正負面評論變化,例如針對澳門網民,對ios及android兩大手機系統的評論趨勢變化,進行分析,對比其消漲關係。,Positive,Negative,ios,ios,情感分析-分析網民討論什麼? 怎麼討論?,利用分詞、情感分析,搭配詞性判斷,可以定位出,網民的討論情緒為正(或為負)的時候,討論的對象是什麼? 以及如何討論?例如分析某品牌手機,網民對該品牌哪些主題(功能)有好的討論,哪些有不好的討論,以及如何討論?,網民討論什麼?,網民怎麼討論?,Positive,Negative,服務,維修,價格,快速,便宜,良好,滿意,實惠,顏色,螢幕,RAM,效能,品質,WiFi,不穩定,更新,更新,過熱,當機,