
汉LP:中文分词、词性标注、命名实体识别、依存句法及语义依存分析、新词发现、基于自动摘要的文本分类与聚类、拼音转换和简繁体互换等功能的自然语言处理工具
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
汉LP是一款功能全面的自然语言处理工具,支持中文分词、词性标注、命名实体识别等核心任务,并提供依存句法分析、语义依存分析、新词发现及自动摘要驱动的文本分类与聚类服务。此外,它还具备拼音转换和简繁体互换能力,为用户提供了强大的语言处理解决方案。
HanLP:汉语言处理
面向生产环境的多语种自然语言处理工具包,基于PyTorch和TensorFlow 2.x双引擎,目标是普及落地最前沿的NLP技术。HanLP实现功能完善、性能高效、架构清晰、语料时新以及可自定义的特点。
穿越世界上最大的多语言种语料库,HanLP2.1支持包括简繁中英日俄法德在内的104种语言上的10种联合任务:分词(粗分,细分两个标准,强制,合并,校正三种)、词性标注(PKU、863、CTB、UD四套词性规范)、命名实体识别(PKU、MSRA、OntoNotes三套规范)、依存句法分析(SD、UD规范)、成分语法分析、语义依存分析(SemEval16,DM,PAS,PSD四套规范)、语义角色标注、词干提取和词法语法特征提取以及抽象意义(AMR)。
HanLP提供RESTful和本机两种API接口,分别面向轻量级和海量级场景。无论使用哪种语言的API,HanLP在语义上保持一致,并坚持代码开源。
对于轻量级RESTful API服务器,在算力有限的情况下可以为匿名用户提供服务。通过Python pip命令安装hanlp_restful库以创建客户端:
```python
pip install hanlp_restful
```
以上便是关于HanLP的简要介绍,它在自然语言处理领域提供了全面而强大的支持和服务。
全部评论 (0)
还没有任何评论哟~


