
解读文本识别网络CRNN
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
CRNN是一种用于文本识别的深度学习模型,结合了卷积神经网络(CNN)进行特征提取和循环神经网络(RNN)处理序列信息的优点,特别适用于场景文字识别等任务。
CRNN(Convolutional Recurrent Neural Network)主要用于端到端地对不定长的文本序列进行识别,无需先对单个文字进行切割,而是将文本识别问题转化为基于图像的序列学习问题。
整个CRNN网络结构包含三部分:
1. CNN(卷积层),使用深度CNN从输入图像中提取特征,并生成特征图;
2. RNN(循环层),采用双向RNN(BLSTM)对上述提取到的特征序列进行预测,通过对每个特征向量的学习输出预测标签分布;
3. CTC loss(转录层),利用CTC损失函数将从循环层获取的一系列标签分布转换成最终的标签序列。
全部评论 (0)
还没有任何评论哟~


