

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著國際互聯(lián)網(wǎng)絡(luò)的進一步普及以及網(wǎng)絡(luò)之上所承載的信息量的進一步豐富,互聯(lián)網(wǎng)成為新的媒體已經(jīng)是不爭的事實,眾多社交網(wǎng)站的訪問量已不亞于傳統(tǒng)媒體,以臉譜網(wǎng)和推特網(wǎng)為代表的社交網(wǎng)站已經(jīng)成為了互聯(lián)網(wǎng)信息傳播的新勢力,它們散發(fā)出的巨大能量使得傳播領(lǐng)域出現(xiàn)了一個新的名詞——社交媒體。同時,由社交媒體產(chǎn)生的社交媒體數(shù)據(jù)也蘊含著巨大的信息。本文構(gòu)建了一個以Twitter網(wǎng)站數(shù)據(jù)為基礎(chǔ),對用戶的社交媒體數(shù)據(jù)進行統(tǒng)計分析的實時社交媒體分析系統(tǒng)。該分析系統(tǒng)以
2、Twitter Storm流計算系統(tǒng)為平臺,利用Twitter API和Python NLTK等技術(shù),實現(xiàn)對社交媒體數(shù)據(jù)的關(guān)鍵字提取和情感分析等任務(wù),為用戶提供數(shù)據(jù)推薦。
首先,根據(jù)系統(tǒng)的應(yīng)用場景和需求定義確定技術(shù)方案,選擇Twitter Storm流計算系統(tǒng)實現(xiàn)對社交媒體數(shù)據(jù)的快速處理,保證系統(tǒng)持續(xù)計算和實時性;并選擇Python NLTK解決關(guān)鍵字抽取和情感分析任務(wù)。
然后根據(jù)需求定義將系統(tǒng)劃分為Twitter
3、Streaming API適配模塊、流計算和短文本分析模塊、數(shù)據(jù)維護模塊、網(wǎng)絡(luò)結(jié)構(gòu)分析模塊、內(nèi)容推送模塊以及配置和日志模塊,前五個模塊主要用于實現(xiàn)系統(tǒng)功能目標(biāo),而配置和日志模塊提高了系統(tǒng)的可用性。流計算和短文本分析模塊包括Twitter Storm系統(tǒng)執(zhí)行邏輯和Python NLTK文本分析邏輯,利用Twitter Storm系統(tǒng)對流數(shù)據(jù)的處理優(yōu)勢實現(xiàn)對社交媒體流數(shù)據(jù)的快速處理,利用Python NLTK抽取Twitter數(shù)據(jù)的關(guān)鍵字,
4、使用樸素貝葉斯分離器實現(xiàn)對社交媒體數(shù)據(jù)的情感分析,樸素貝葉斯分類器以其簡單高效的計算模式和相對合理的計算結(jié)果,能夠提高系統(tǒng)的計算質(zhì)量和響應(yīng)時間;網(wǎng)絡(luò)結(jié)構(gòu)分析模塊利用節(jié)點相似度和Q值算法實現(xiàn)對用戶群的社群劃分工作,節(jié)點相似度計算利用矩陣運算得到所有節(jié)點的相似度拓撲序列,而Q值算法利用相似度計算結(jié)果分析得到相對合理的社群劃分方案;系統(tǒng)配置利用Zookeeper提供的鎖機制保證配置完整性。
最后,進行模塊和系統(tǒng)測試,對系統(tǒng)各個模塊和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 社交媒體數(shù)據(jù)分析平臺設(shè)計與實現(xiàn).pdf
- 基于流媒體實時播放系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 多媒體流網(wǎng)絡(luò)實時傳輸系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 實時流媒體視頻監(jiān)控系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于Android的移動流媒體實時傳輸系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于RTP的流媒體實時傳輸系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 博客媒體分析系統(tǒng)設(shè)計與實現(xiàn).pdf
- 多媒體課件實時生成系統(tǒng)的研究與實現(xiàn).pdf
- 嵌入式媒體實時點播系統(tǒng)的設(shè)計與RTSP的實現(xiàn).pdf
- 多媒體實時視頻答疑系統(tǒng)的研究與實現(xiàn).pdf
- Internet多媒體實時交互系統(tǒng)的研究與實現(xiàn).pdf
- 實時音視頻錄制與流媒體發(fā)布系統(tǒng)設(shè)計與實現(xiàn).pdf
- 社交網(wǎng)絡(luò)數(shù)據(jù)獲取與結(jié)構(gòu)分析系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 實時流媒體系統(tǒng)中音視頻同步的設(shè)計與實現(xiàn).pdf
- 基于RSSBus的社交媒體信息收集分析系統(tǒng).pdf
- 手機終端媒體信息實時傳輸和存儲系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 呼叫中心多媒體工作臺與實時統(tǒng)計系統(tǒng)設(shè)計與實現(xiàn).pdf
- 移動閱讀社交系統(tǒng)設(shè)計與實現(xiàn).pdf
- 安全實時流媒體系統(tǒng)的研究與設(shè)計.pdf
- 基于Java平臺的多媒體網(wǎng)絡(luò)教學(xué)實時錄播系統(tǒng)的設(shè)計與實現(xiàn).pdf
評論
0/150
提交評論