
HanLP:中文分词、词性标注、命名实体识别、依存句法分析、语义依存分析、新词发现、关键词短语提取、自动摘要、文本分类与聚类、拼音等
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
HanLP是一款功能全面的自然语言处理工具,支持中文分词、词性标注、命名实体识别等多种任务,并提供依存句法分析和语义依存分析等功能。
HanLP:汉语言处理工具包基于PyTorch和TensorFlow 2.x双引擎开发,旨在普及最前沿的自然语言处理技术,并适用于生产环境。该工具包功能全面、性能高效且架构清晰,同时提供最新的语料库支持自定义需求。
在最新版本中(HanLP 2.1),借助世界上最大的多语种语料库,汉语言处理工具包能够覆盖包括简体中文、繁体中文、英文、日文、俄文、法文和德文在内的共计104种语言,并能支持以下十类任务:分词(粗分与细分标准以及强制合并校正三种方式)、词性标注(PKU、863规范等四套体系)、命名实体识别(依据PKU、MSRA及OntoNotes三套规范进行)、依存句法分析(SD和UD规则);成分句法分析;语义依存分析(SemEval16、DM格式以及PAS/PSD标准);语义角色标注;词干提取;语法特征抽取和抽象意义表示(AMR)。用户可以根据自身需求选择不同的配置,同时HanLP还支持RESTful接口及本地部署。
全部评论 (0)
还没有任何评论哟~


