微博情感信息挖掘系統
2018-01-13 10:33:28 來源:本站原創 瀏覽:205次內容提要:編號jsp369:微博在我國發展已經有很多年了,在微博用戶的不斷增加過程中,也出現了很多的情感微博,很多用戶通過微博抒發個人的情感,針對這種情況,我們可以開發一款關于情感信息挖掘的軟件,一方面了解微博用戶的大數據,另一方面通過微博用戶的建立,分析相關的大數據。
經過不完全統計,我國的微博用戶已經達到了三億多,通過微博很多人能夠表達自己的情感以及一些其他的信息,如何能夠針對這種信息,敏感問題進行分析,是本課題所要解決的問題。通過對微博的敏感話題,相關的熱點情感態度等分析,能夠了解一個人的情感動向,防止不正當的信息進行傳播,也對不穩定因素的分析有一定的主導作用。
本系統可以實現如下幾個功能:
1、針對微博的信息進行格式化處理,主要是對微博的標題,內容,轉發數等信息進行數據庫的存儲。等待后期的分析。
2、數據信息清洗:利用分詞系統針對當前熱門的微博進行分析,去除特殊符號和停用詞等不常用詞語。
3、建立情感詞數據庫,建立消極情感詞庫和積極情感詞庫,為針對微博數據挖掘做準備。
4、利用蟻群算法針對微博的動態情感信息進行分析,主要是要實現如下幾個的關聯:
a)事件與情感的關聯,可以通過事件與情感的關聯,發現引起積極情感和消極情感的事件。
b)通過用戶和情感的關聯來發現用戶在某個時間段與積極和消極情感的關聯,并能給用戶一個情感變化的曲線。
5、以曲線的方式,能夠針對直觀的情感波動進行分析。