Ansj中文分词Java开发小记
生活随笔
收集整理的這篇文章主要介紹了
Ansj中文分词Java开发小记
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、ansj中文分詞器:https://github.com/NLPchina/ansj_seg
? ?分詞速度達到每秒鐘大約200萬字左右(mac air下測試),準確率能達到96%以上;
? ?目前實現了中文分詞、中文姓名識別、用戶自定義詞典、關鍵字提取、自動摘要、關鍵字標記等功能;
? ?可以應用到自然語言處理等方面,適用于對分詞效果要求高的各種項目。
? ?下載ansj_seg-5.0.2-all-in-one.jar,引入eclipse工程;
3、代碼:
package cn.ansj;import org.ansj.splitWord.analysis.ToAnalysis;public class SplitWordsByAnsj {public static void main(String args[]) {String str = "歡迎使用ansj_seg,(ansj中文分詞)在這里如果你遇到什么問題都可以聯系我.我一定盡我所能.幫助大家.ansj_seg更快,更準,更自由!" ;System.out.println(ToAnalysis.parse(str));}}《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀
總結
以上是生活随笔為你收集整理的Ansj中文分词Java开发小记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在线实时大数据平台Storm集成redi
- 下一篇: Netty通信框架Java实现小记