项目背景:基于word模板,通过poi将数据填入到word后,将客户的word文档转成pdf输出,存在几十万个客户的pdf情况,最终效果为所有客户的PDF合成一个文件。
目前问题:
1、PDF合并(客户有几十万),使用的pdfbox技术,客户PDF个数过多,内存占用过大,导致内存溢出情况。
2、单个客户的PDF比如300KB,1k个客户就是300*1000=300000KB,PDF的体积是倍数增加的,能不能压缩/优化PDF体积?
3、word模板样式问题,每个客户存在RMB、USA两种币种情况,每个币种分为主卡、副卡情况,详情表格后续会存在提示话术,现在做的是将数据填按行填充word模板,通过计算来展示后续的提示话术,现在存在问题是提示话术展示的位置发生偏移,以及当前页提示话术没有写完,没有续写到下一页展示,有没有好点的方案,可以优化该情况,最好不用通过计算就可以达到结果。效果图如下所示。
需求描述:
1、使用java技术栈
2、将多个PDF合并为一个PDF时,优化内存占用过大情况
3、优化合并后的PDF体积,比如压缩、优化等
4、当前页提示话术没有写完,没有续写到下一页展示
5、或者提供使用java直接将数据写入pdf模版,输出pdf文件解决方案
6、优化过程中使用的第三方工具,必须为开源框架
预算:详谈
效果图如下:
表格内容当前页过多,提示话术不全:
预期需要正确写入下一页提示内容效果:
或者当前页表格内容过少时,才能显示完整的提示话术:
java我不是很熟,但从百度结果看可以用
Apache POI
库以流的方式读取文件然后用OpenPDF和itext库逐页写pdf解决问题之前使用过该技术实现过合同签署,可以沟通吗
你联系方式没填,怎么联系?留个联系方式
评论区留不了,我已经更新我的个人信息了
用java生成TeX文件直接编译出pdf应该更好一些?
你这边有联系方式吗?沟通一下
我更新上联系方式了 你自己查看一下
这种场景Java没有python便捷 解析pdf和非固定位置需要元素查找和节点处理 我用python有成功经验 如果不强限制技术栈可以电一下 发我三个文件我写一个mvp看看
客户这边,需要使用java实现。
我公司的pdf大文件生成是我弄的,不过用的node写 的
客户这边,需要使用java实现。
可以用nodejs。pdfmark生成
可联系
可以试试
我可以提供一个word转pdf的程序,大文件处理也很流畅,需要联系我试用
我觉得,葡萄城的插件更适合点
搞定了吗楼主? 资深java表示可以试试
java开发,可联系。着急搞定吗?
C#可以搞
联系