
百度地图毕业设计源码-贝壳找房问答匹配:2020 CCF 大数据与计算智能大赛房地产业应用挑战
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目为2020年CCF大数据与计算智能大赛中关于房地产应用挑战的设计,旨在利用百度地图API和贝壳找房的数据源代码,实现用户提问与房源信息的精准匹配。
百度地图毕业设计源码比赛贝壳找房-房行业聊天问答匹配
这是我第一次正式参加一个大型的NLP比赛,全程独自完成。经过一个多月的努力,最终结果是A榜70+,B榜60+。虽然成绩不够理想,但在整个过程中学习到了很多知识,并且遇到了不少挑战,在赛后也认识到了自己的不足之处。因此决定在这里总结回顾一下自己的一些思路和方法,并分享相应的代码。
本项目都是基于pytorch实现的。数据首先来说说数据,此次赛题是以房产中介为背景,客户与中介之间的问答文本作为基础数据集,每个问题对应多个候选回答(0到n个),其中包含这些候选中的正确答案。在处理这部分数据时,由于BERT模型使用的是字符级别的token化方法,因此我没有进行分词、停用词和标点符号的预处理工作。我认为,在某些场景下部分停用词及标点可以提供特定的信息价值。最终我将问题(question)与回答(reply)组合成了pair对。
在模型选择方面,本项目主要使用了BERT,并且后期融合时还采用了RoBERTa。
全部评论 (0)
还没有任何评论哟~


