
big-data-ocr-ner:大数据集上的OCR、NER、物体检测与字幕生成
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Big-data-OCR-NER项目聚焦于利用大规模数据集进行光学字符识别(OCR)、命名实体识别(NER)、物体检测及自动字幕生成,推动智能图像处理技术的边界。
项目目标:在大数据集上应用光学字符识别(OCR)、命名实体检测(NER)以及对象检测技术。
该项目分为三个部分:
1. 使用OCR技术从扫描的PDF文件中提取数据。
2. 爬取并抓取ufostalker.com网站以获取图像和相关数据。
3. 将对象检测与字幕生成技术应用于这些图像,并将命名实体识别(NER)技术应用到数据/观察描述中,以便从中抽取不同的命名实体。
注意:本项目构建了两个阶段的数据集。第一个项目的输出称为v1 UFO 数据集;而从该项目衍生出的第二个版本则被称为v2 UFO 数据集。
使用的工具包括:
- ImageMagick 和 Ghostscript(用于将扫描的PDF文件转换为TIFF格式)
- Poppler(用于分离多页PDF文档成单页PDF)
- Tesseract OCR
- Selenium(网页抓取和自动化测试框架)
- OpenNLP 和 NLTK
全部评论 (0)
还没有任何评论哟~


