不用python编程,制作词云图
主要用這三個網站。
在線分詞工具|在線切詞:中文切詞工具|中文分詞工具|中文在線分詞
http://www.78901.net/Participle/?ac=done
微詞云_在線詞頻統計分析工具_詞云圖生成器
https://www.weiciyun.com/fenci/
Edit word art - WordArt.comhttps://wordart.com/create第三個網站是國外的,登陸可能慢一點。
繪制詞云,首先得有文本材料。
爬取數據,采用webscraper.
舉例說明。制作一個《復仇者聯盟4》的影評詞云。
從豆瓣爬取。
打開豆瓣,找到復聯4
?
用webscraper 建立一個sitemap。爬取地址中,參數寫成start=[0-100:20],如果想爬的多,就把100改大,但不能超過復聯4影評總頁數*20,我這里只爬取5頁。20是步長。
設置selector
?
第一個selector是頁面鏈接。多選、類型是link
save后,點進去,設置二級頁面爬取規則。
?
?
?save就ok了
然后scrape
爬完之后,下載csv文件。
?
?只需要一列,把comment_of_one復制出來,放到TXT里。
把這個整個的文本,復制到上面這個網站,進行分詞。
在線分詞工具|在線切詞:中文切詞工具|中文分詞工具|中文在線分詞
http://www.78901.net/Participle/?ac=done
?
這個過程我測試了一下,太多文本的話會報錯,需要一部分一部分的復制,這時候就是耐心了。如果文本量很大,就慢慢來吧,畢竟不用python編程。
分詞的結果在下面。把這個結果復制出來。
?
?
?復制到這個網站,進行詞頻統計。
微詞云_在線詞頻統計分析工具_詞云圖生成器
https://www.weiciyun.com/fenci/
?
?
可以點擊下一步。
需要微信登錄,那就登錄一下唄。
?邊上有過濾條件,默認只顯示名詞的詞頻,我這里把動詞也選上。
?可以生成報告。
這個網站也是可以直接生成詞云的。下面有。
?
可以點擊美化詞云,這樣就可以自己設置詞云的一些現實方式。
?
?形狀,字體,等。
?
這樣看來,第三個網站也不需要了。
直接生成了。
但是這個網站也是有文本量的限制,如果文本量大,就需要一部分一部分做,
?
用這個網站生成報告。下載報告。
?
這個報告當然也是一部分的報告。
分批做分詞,詞頻統計,最后把所有的詞頻合并起來,excel里用vlookup應該就可以。
統計好之后,是一個全部的文件,這樣就可以用第三個網站。上傳到這個詞頻結果,做出詞云圖。
?
?這里可以上傳詞頻。只不過這個是國外網站,所以要先上傳一個font,找一個中文字體,傳上去。后面就可以生成詞云了,其他的操作都類似。
?
第一個網站和第二個都可以直接實現分詞。第二個更好,直接得出詞頻。但是這兩個也都不是純免費的。多了就花錢了。可以不斷使用第一個網站,分詞,然后第二個統計。第三個作圖。這樣可以避免花錢。
總結
以上是生活随笔為你收集整理的不用python编程,制作词云图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为何战场上遗留的坦克和装甲车锈蚀严重
- 下一篇: MBT LAW反坦克导弹