MuleRun如何压缩PDF文件 MuleRun文档处理Agent使用方法实战案例|Duuu笔记
使用MuleRun压缩PDF无效时,应依次启用内置PDF压缩模式、手动配置高级参数、OCR后压缩流程或智能分片策略。
如果您使用MuleRun文档处理Agent对PDF文件执行压缩操作,但未能获得预期的体积减小效果,则可能是由于压缩参数设置不当、源文件已高度优化或未启用正确的处理模式。以下是实现PDF有效压缩的具体方法:
一、启用内置PDF压缩模式
MuleRun Agent提供预设的PDF压缩配置,通过调整图像采样率与字体嵌入策略,在保留可读性的前提下降低文件体积。该模式适用于常规扫描件与图文混合PDF。
1、启动MuleRun文档处理Agent客户端,进入“任务创建”界面。
2、点击“添加文件”,选择待压缩的PDF文档。
3、在“处理类型”下拉菜单中选择
PDF压缩(标准质量)
。
4、勾选“自动检测图像分辨率并降采样至150dpi”选项。
5、点击“提交任务”,等待状态栏显示“已完成”后下载输出文件。
二、手动配置高级压缩参数
当标准模式无法满足体积要求时,可通过自定义参数进一步控制压缩强度,包括移除冗余对象、禁用嵌入字体子集及压缩流对象。此方式适用于技术文档或内部流转文件。
1、在任务创建界面点击“高级设置”展开面板。
2、将“图像质量等级”拖动至
低(60%)
档位。
3、在“字体处理”选项中选择
仅保留必要字体,不嵌入未使用字形
。
4、启用“清除PDF元数据与注释层”复选框。
5、确认参数后点击“保存并运行任务”。
像素蛋糕PixCake
像素级AI图像精修软件
下载
三、使用OCR后压缩流程处理扫描PDF
针对纯图像型PDF(如拍照或扫描生成),直接压缩效果有限;需先执行OCR识别生成文本图层,再进行结构化压缩,可显著减少体积并提升可检索性。
1、在“处理类型”中选择
OCR识别+PDF优化
。
2、语言模型选择与文档内容匹配的语言(如中文简体)。
3、在OCR后置操作中勾选“合并重复图像对象”和“重编码JPEG2000为FlateDecode”。
4、设置输出PDF兼容性为
PDF/A-1b
以禁用非必要特性。
5、提交任务并导出结果文件。
四、批量压缩时启用智能分片策略
当单个PDF超过200MB或含大量高分辨率图像时,Agent默认启用分片处理机制,将文档按逻辑页组切分并行压缩,避免内存溢出导致失败。
1、上传多个PDF文件或单个超大PDF至任务队列。
2、在“批量设置”区域开启
自动分片(每50页一组)
开关。
3、设定单组最大内存占用为
1.2GB
,防止系统资源耗尽。
4、选择“分片结果合并为单一PDF”选项。
5、启动批量任务,各分片完成后自动触发合并与最终压缩。
