三款值得关注的开源工具:百度 Unlimited OCR、TikZ Editor、FUTO Swipe | 2026-06-24
百度 Unlimited OCR一次搞定长文档 OCR做 OCR 的工具有很多但遇到几十页的扫描件或拍照文档大部分工具需要先切割成单页再逐页识别。百度刚开源的 Unlimited OCR 换了个思路用一种叫「one-shot long-horizon parsing」的方法一次性处理整篇长文档不用手动分页。这个项目在 HN 上拿到了 440 多个赞评论区有人解释说研究团队找到了一种架构上的技巧避免了 AI 模型在读长文档时疯狂吃内存的问题。模型权重已经发布在 Hugging Face 上同时支持 Transformers 和 PaddlePaddle 两种推理方式。百度在 README 里特意感谢了 DeepSeek-OCR 和 PaddleOCR 的工作。从代码来看它是在 DeepSeek-OCR 基础上做的改进目标是把长文档 OCR 再往前推一步。如果你经常需要处理合同、报告、论文这类多页文档这个工具值得试试。项目地址在 GitHub配合 Hugging Face 上的模型权重可以直接跑起来。TikZ Editor画 LaTeX 图终于不用盲猜坐标了写过学术论文的人大概都经历过这个痛苦用 TikZ 画图时反复调整坐标、编译、看效果、再调整。一个简单的流程图可能要编译十几次才能对齐。TikZ Editor 把这个过程变成了所见即所得。左边写 TikZ 代码右边实时预览效果。不用再靠想象猜 (0,0) 到 (1,2) 画出来的线在哪。这个工具在 HN 上收获了 330 多个赞评论区一片叫好。有人说「所有 STEM 学生和研究者都会感谢你」还有人说「一直想要这样的东西」。这些反应很真实因为 TikZ 绘图的痛点确实存在很久了。tikz.dev 这个网站本身也有完整的 TikZ 文档和教程Editor 是其中的新功能。如果你是 LaTeX 用户或者正在写论文需要画图可以去试试。FUTO Swipe开源的滑行输入法手机上的滑行输入swipe typing基本被 Gboard 和 SwiftKey 垄断了。FUTO 组织做了一个开源替代方案FUTO Swipe。它的核心是一个开源的滑行输入模型所有处理在本地完成不把你的输入数据送到云端。对于在意隐私的用户来说这是个实实在在的优势。HN 上有人在网页版的滑行演示里用鼠标试了一下说体验出乎意料地流畅。也有人提到目前还缺少自定义词的记忆功能但作为一个刚发布的开源项目后续迭代应该会补上。FUTO 是一个关注隐私和技术自由的组织之前做过 FUTO Keyboard基于 AOSP 键盘改进。Swipe 是他们的新方向专门解决滑行输入这个细分场景。如果你受够了大厂键盘的数据收集可以关注一下这个项目。原文链接https://linkwordx.site/articles/daily-picks-20260624