輿情分析系統
大數據時代來臨,如何從眾多資料中抽取出有意義的訊息,分析市場、探勘輿情,對許多政府單位、企業而言是相當重要的應用。本系統利用本實驗室的中文剖析系統,解析了近千萬句的新聞語料,從每句的結構樹中找出字詞之間的關係,建立關鍵字與相關詞搭配的資料庫;並且利用 E-HowNet 情緒字眼分析描述該關鍵字相關句字的情感分佈。使用者可以針對某關鍵字,快速了解與其相關的事物。
系統實作
本系統的實作可分成以下階段:
- 爬取新聞語料
- 利用爬蟲程式蒐集最近的新聞,本系統目前採用的是蘋果日報和中國時報的新聞。
- 中文剖析系統
- 將蒐集到的新聞前處理後,使用中文剖析系統建立每個新聞語句的結構樹。
- 建立關鍵字資料庫
- 從結構樹中抽取字詞之間的關係,依照字的詞性以及搭配詞的詞性建立關鍵字資料庫。
- 建立情感分析資料庫
- 利用 E-HowNet 中的情緒相關字眼,分析每個語句中的情感分佈,建立情感資料庫。
- 介面撰寫
- 串接上述資料庫,用 Node.js 作為後端,React.js 作為前端,開發友善的操作介面,讓使用者輸入關鍵字之後,能夠呈現視覺化的查詢結果。
線上系統展示
輿情分析系統
本系統利用本實驗室的中文剖析系統,解析了近千萬句的新聞語料,從每句的結構樹中找出字詞之間的關係,建立關鍵字與相關詞搭配的資料庫;並且利用 Ehownet 情緒字眼分析描述該關鍵字相關句字的情感分佈。使用者可以針對某關鍵字,快速了解與其相關的事物。
Demo參與開發人員
馬偉雲、吳岳涵、謝佑明、邱詩涵、吳緒暄