
重写后的标题:char_featurizer:汉字字符特征提取器,支持提取字音(声母、韵母、声调)、字形(偏旁、部首)及四角编码等功能...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Char_Featurizer是一款先进的汉字处理工具,能够高效地提取汉字的语音特性(包括声母、韵母和声调),字形特征(如偏旁部首)以及四角号码等信息。
char_featurizer 是一个汉字字符特征提取工具,它可以提取汉字的字音(包括声母、韵母、声调)、字形(偏旁、部首)以及四角符号等信息,并将这些特征转换为tensor格式作为模型输入。当前 char_featurizer 支持的功能如下:
1. 字形特征提取
2. 字音特征提取
3. 四角编码提取
4. tensor转换
使用方法:
安装:`pip install char_featurizer`
使用示例代码:
```python
from char_featurizer import Featurizer
featurizer = Featurizer()
data = 明天去你家玩
result = featurizer.featurize(data)
print(result)
```
返回结果:
全部评论 (0)
还没有任何评论哟~


