
这是一个我参与的Kaggle比赛项目代码仓库。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该仓库收录了我参与的Kaggle比赛期间的代码,请您进一步了解其内容。 文件夹中包含了与我参与的比赛项目对应的代码实现。 请注意,部分代码完全是我独立完成的,而其他代码则受到了来自其他Kaggle内核的启发。 我会在代码中明确指出这些来源。 为了方便查阅,我已将其他人的代码片段也纳入其中。 仓库结构如下: “01-TextNormalization” 目录包含用于文本规范化的相关代码 - 竞赛-https://链接(此处已移除),其中“xgboost_class_predictions.ipynb” 文件利用XGBoost算法对单词进行类型预测,例如识别基数、序数和度量等。 “Create_function_classes.ipynb” 文件则是我编写的一系列函数,这些函数借助正则表达式,根据单词的类型对单词进行处理,涵盖了罗马数字到整数、日期/时间以及电话号码等多种情况的处理方式。 在此文件中,我们将测试集中的单词及其对应的类型传递给这些函数,从而生成最终的预测结果。 您还可以查阅该目录中关于展示此类“类”处理方式的说明文档。
全部评论 (0)
还没有任何评论哟~


