资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

PaddleOCR_MCP

PaddleOCR 官网 MCP 服务器说明文档

PaddleOCR 提供轻量级的 MCP 服务器,可用于将 PaddleOCR 的文本识别、文档解析等能力快速集成到各种大模型应用中。PaddleOCR MCP 服务器当前支持的工具如下:

  • 当前支持的工具

    • OCR:对图像和 PDF 文件进行文本检测与识别。
    • PP-StructureV3:从图像或 PDF 文件中识别和提取文本块、标题、段落、图片、表格以及其他版面元素,将输入转换为 Markdown 文档。

PaddleOCR MCP 服务器可被多种应用集成,支持其文本识别与文档解析能力。这里以 Claude for Desktop 为例,以下为快速接入 PaddleOCR MCP 服务器的步骤:

  1. 安装 uv
  2. 在以下位置之一找到 Claude for Desktop 配置文件:

    • macOS~/Library/Application Support/Claude/claude_desktop_config.json
    • Windows%APPDATA%\Claude\claude_desktop_config.json
    • Linux~/.config/Claude/claude_desktop_config.json

    打开 claude_desktop_config.json 文件,参考如下示例调整配置,填充到 claude_desktop_config.json 中。

    对于 OCR 服务:

    {
      "mcpServers": {
        "paddleocr-ocr": {
          "command": "uvx",
          "args": [
            "--from",
            "paddleocr-mcp@https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/mcp/paddleocr_mcp/releases/v0.2.0/paddleocr_mcp-0.2.0-py3-none-any.whl",
            "paddleocr_mcp"
          ],
          "env": {
            "PADDLEOCR_MCP_PIPELINE": "OCR",
            "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio",
            "PADDLEOCR_MCP_SERVER_URL": "http://j8r5t1c993t4tfy2.sandbox-aistudio-hub.baidu.com/ocr",
            "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>"
          }
        }
      }
    }

    对于 PP-StructureV3 服务:

    {
      "mcpServers": {
        "paddleocr-ocr": {
          "command": "uvx",
          "args": [
            "--from",
            "paddleocr-mcp@https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/mcp/paddleocr_mcp/releases/v0.2.0/paddleocr_mcp-0.2.0-py3-none-any.whl",
            "paddleocr_mcp"
          ],
          "env": {
            "PADDLEOCR_MCP_PIPELINE": "PP-StructureV3",
            "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio",
            "PADDLEOCR_MCP_SERVER_URL": "http://oceaxdm1h3v1v1pb.sandbox-aistudio-hub.baidu.com/layout-parsing",
            "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>"
          }
        }
      }
    }

    此页面 获取您的 访问令牌

  3. 重启 Claude for Desktop。新的 paddleocr-ocr 工具现在应该可以在应用中使用了。

除了上述使用方式外,PaddleOCR MCP 服务器还支持更多用法,例如接入本地 Python 库、使用 Streamable HTTP 传输等。关于 PaddleOCR MCP 服务器的更多能力,请参考 PaddleOCR 官方文档。

上一篇
学习中心
下一篇
PaddleOCR_MCP_en