
使用POI进行大数据Excel操作避免内存溢出
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本篇文章介绍如何利用Apache POI库在处理大规模数据时编写高效的Excel操作代码,并提供解决方案以防止程序运行中出现内存溢出问题。
我从别人那里用25分下载了三个源码,并整合后以1分的价格分享给大家!这是我在项目中为解决大数据Excel导入时内存溢出问题而编写的行级解析器,同时支持Excel-2003和Excel-2007。对于Excel-2003的解析采用POI的EventUserModel模式实现,而对于Excel-2007则使用XMLReader进行处理。经过项目验证,在面对包含20万条数据的Excel文件时也没有任何问题,仅读取的话在两到三分钟内即可完成解析。
网络上有关于如何利用EventUserModel方式来解析的内容很少,因此我花费了较多的时间研究和编写代码,所以分数相对较高,但绝对物有所值。源码中包含了一个示范性的测试类,易于理解和使用。对于20万条数据的Excel文件来说不成问题,因为我的行级处理器可以有效避免一次性生成大量对象的情况发生,从而解决了内存溢出的问题。
只要Excel文件能够容纳下这么多记录,在解析时就不会遇到任何限制或性能瓶颈。
全部评论 (0)
还没有任何评论哟~


