Ansj在线分词器

这是一个基于n-Gram+CRF+HMM的中文分词的java实现.分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能;可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.
elasticsearch-analysis-ansj 主页 https://github.com/4onni/elasticsearch-analysis-ansj
ansj 分词器 https://github.com/NLPchina/elasticsearch-analysis-ansj

单文本分析

切分分词

  • 索引分词
  • 精准分词
  • 词典优先分词
  • 细颗粒度分词
语言 广义 而言 , 采用 一套 具有 共同 处理 处理 规则 进行 进行 表达 表达 沟通 沟通 指令 指令 . . ansj ansj 分词 分词
语言 广义 而言 , 采用 一套 具有 共同 处理 处理 规则 进行 进行 表达 表达 沟通 沟通 指令 指令 . . ansj ansj 分词 分词
语言 广义 而言 , 采用 一套 具有 共同 处理 处理 规则 进行 进行 表达 表达 沟通 沟通 指令 指令 . . ansj ansj 分词 分词
语言 广义 而言 , 采用 具有 共同 共同 处理 规则 规则 进行 进行 表达 表达 沟通 沟通 指令 指令 . . ansj ansj 分词 分词
Copyright © 2017-2018 JSON在线解析  beejson.com  京ICP备17029931号-2