跳转到内容
GitHub

pdf - PDF 工具包

pdf

PDF 工具包

高质量 热门 精选 Anthropic 文档
GitHub

描述

完整的 PDF 读写、文本和表格提取、合并/拆分、表单填写和内容编辑工具包

使用场景

  • 从 PDF 报告中提取数据和表格
  • 批量填写 PDF 表单
  • 合并多个 PDF 文件
  • 拆分大型 PDF 文档
  • 处理法律文档和合同

核心能力

  • 文本提取:从 PDF 中提取可搜索文本
  • 表格提取:识别并提取表格数据为结构化格式
  • 表单处理:填写和读取 PDF 表单字段
  • 文档合并:将多个 PDF 合并为一个文件
  • 页面操作:提取、删除或重新排序页面

示例

请从这份财务报告 PDF 中提取:
1. 所有数据表格,转换为 CSV 格式
2. 关键财务指标摘要
3. 图表中的数据点(如果可识别)

注意事项

  • 扫描版 PDF 可能需要 OCR 处理
  • 加密的 PDF 需要先解密
  • 表格提取准确度取决于 PDF 结构

适用角色

开发者 数据分析师 财务 人力资源 法务 高管

标签

pdfextractionformsmerge