
使用中英文语料训练CBOW模型,以获得词向量(采用pytorch实现)。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本次自然语言处理课程的第二次作业涉及数据处理环节。首先,作业数据集存储在名为“data”的文件夹中,其中包含了中文语料和英文语料,分别由教师提供;此外,还包括一份中文停用词语料。输出结果则存储在“output”文件夹内,该文件夹存放着生成的词向量文件。同时,作业脚本位于“script”文件夹中,该脚本主要针对CBOW模型进行设计与实现,并能够同时处理中文语料和英文语料。运行流程为:在脚本中明确指定训练哪种语言(中文或英语),随后直接执行即可完成任务。
全部评论 (0)
还没有任何评论哟~


