NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类
生活随笔
收集整理的這篇文章主要介紹了
NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
NLP之TM之LDA:利用LDA算法瞬時掌握文檔的主題內容—利用希拉里郵件數據集訓練LDA模型并對新文本進行主題分類
?
?
?
目錄
輸出結果
設計思路
核心代碼
訓練數據集
LDA模型應用
?
?
?
輸出結果
?
設計思路
?
核心代碼
lda = gensim.models.ldamodel.LdaModel(corpus=corpus, id2word=dictionary, num_topics=20) print('輸出第10號分類:',lda.print_topic(10, topn=5)) print('輸出所有的主題分類:',lda.print_topics(num_topics=20, num_words=5))?
訓練數據集
下載鏈接:希拉里郵件數據集
?
?
?
LDA模型應用
使用訓練好的LDA模型,輸入以下幾句話,判定各自屬于哪個topic
Already voted? That's great! Now help Hillary win by signing up to make calls now
It's Election Day! Millions of Americans have cast their votes for Hillary—join them and confirm where you vote
We don’t want to shrink the vision of this country. We want to keep expanding it
We have a chance to elect a 45th president who will build on our progress, who will finish the job
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HighNewTech之5G网络:带你了
- 下一篇: ML之NB:(NLP)基于sklearn