上次分享了基础版本,这次继续更进一步。
我们在持续打磨——让翻译后的 PDF 不仅能看懂,还能“看得顺眼”。
之前的版本已经能较好地还原 字体样式与颜色、图片布局、表格结构、段落识别 等内容。 这一次重点优化了:
这次的重点升级是:
📄 段落、字体样式、颜色、表格、公式、图片等都能完整还原
也就是说,无论原文多复杂,翻译后的排版几乎能保持一致,
阅读体验更接近“原版+译文”同步的感觉。
🧩 段落识别:复杂结构也能准确分段;字体大小样色样式完整保留:


📑 分栏布局处理:左右栏内容可正确识别与翻译。

🔢 公式识别:支持公式区域的智能提取与还原;


📊 表格翻译后仍保持原有行列结构


📄 也就是说,无论原文多复杂—— 从论文到报告、从表格到公式—— 现在都能实现更完整的格式还原, 让阅读体验真正接近「原版 + 译文同步」。
做这个功能的初衷其实很简单: 很多科研论文、技术文档、报告在翻译后排版乱掉、公式丢失、图片错位, 看起来比原文还累。 我们希望它成为一个真正可用的「双语阅读体验工具」。其中也遇到了很多的技术挑战:
- 如何更好地识别段落,PDF中只有坐标和文字,无法获取任何的语义信息,只能单纯从几何坐标信息,结合一些特殊的样式以及AI模型来进行段落的识别,且准确率还有待进一步提高
- 公式的识别,怎么样将公式更好的识别出来,并且按照原格式展示,且要更加谨慎的处理翻译流程,有些单位或者有些符号,很容易被翻译导致公式失去了原本的意义
- 图片的识别和还原,有些图片有一些变形的处理,遮罩等,要从底层数据中提取相关的信息,并进行图片的还原, 比如裁剪,遮罩等效果的还原
- 遮挡内容,文本和文本有上下层关系,以及图片和文本有上下层关系,需要处理他们的遮罩以不显示后面的内容。
- 特殊字符.....
📎 想体验的朋友可以直接点这里 👉 [体验地址:https://tranzify.cn]
目前我们还在持续优化中,欢迎大家试用、提建议, 技术交流,或者直接吐槽 🙌


8


工具做的挺好的。如果能做好SE,感觉迎来增长。可以参考看看社区这位朋友的独立产品:
《SEO|谷歌搜索关键词排名第一,复盘我做对了什么》
谢谢,我学习下
我常用的是这个产品,楼主可以对比下差异性:https://immersivetranslate.com/
嗯,有关注到这个, 感谢