
BFSU平行语料库
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
BFSU平行语料库是由北京外国语大学建设的一个多语言对照的大型在线语料库平台,为学术研究和语言学习提供丰富的文本资源。
该软件仅支持ANSI编码文本的处理,并不能兼容Unicode编码文本。
对于汉语文本无需进行分词操作即可使用。
在创建文件时,请根据语言类型分别采用*.ZH.txt(中文)及*.EN.txt(英文)的方式命名中英文文档,以确保识别准确无误。
数据文件需严格行对齐,包括空行在内的所有内容都必须保持一致。软件不具备自动调整平行文本对应关系的功能。
此外,该程序具备正则表达式检索功能,为用户提供了强大的搜索工具支持。
默认情况下,系统会执行词形还原的英文查询(lemmatized search),即输入go时可以找到含有go, goes, went, going, 和gone等变体的所有平行语句。若取消选中“Lemmatized”选项,则仅搜索实际键入的内容,例如搜寻goes将只会显示包含goes的句子。
此软件还支持在对应语言文本内查找含有或排除特定词项的结果,如查询 education 并且希望结果集包括(或者不包括)“教育”的句对。
最后,检索得到的数据可以导出为以制表符分隔的文本段落件形式,方便进一步分析处理。
全部评论 (0)
还没有任何评论哟~


