PaddleOCR_MCP
更新时间:2025-12-19
PaddleOCR 官网 MCP 服务器说明文档
PaddleOCR 提供轻量级的 MCP 服务器,可用于将 PaddleOCR 的文本识别、文档解析等能力快速集成到各种大模型应用中。PaddleOCR MCP 服务器当前支持的工具如下:
-
当前支持的工具
- OCR:对图像和 PDF 文件进行文本检测与识别。
- PP-StructureV3:从图像或 PDF 文件中识别和提取文本块、标题、段落、图片、表格以及其他版面元素,将输入转换为 Markdown 文档。
- PaddleOCR-VL:多模态高精度文档解析模型,对图像或 PDF 文件中的文本、表格、公式、图标等进行解析,将输入转换为 Markdown 文档。
PaddleOCR MCP 服务器可被多种应用集成,支持其文本识别与文档解析能力。这里以 Claude for Desktop 为例,以下为快速接入 PaddleOCR MCP 服务器的步骤:
- 安装 uv。
-
在以下位置之一找到 Claude for Desktop 配置文件:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json - Linux:
~/.config/Claude/claude_desktop_config.json
打开
claude_desktop_config.json文件,参考如下示例调整配置,填充到claude_desktop_config.json中。对于 PP-OCRv5 服务:
{ "mcpServers": { "PP-OCRv5": { "command": "uvx", "args": [ "--from", "paddleocr-mcp", "paddleocr_mcp" "env": { "PADDLEOCR_MCP_PIPELINE": "OCR", "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio", "PADDLEOCR_MCP_SERVER_URL": "<your url>", "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>" } } } }对于 PP-StructureV3 服务:
{ "mcpServers": { "PP-StructureV3": { "command": "uvx", "args": [ "--from", "paddleocr-mcp", "paddleocr_mcp" ], "env": { "PADDLEOCR_MCP_PIPELINE": "PP-StructureV3", "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio", "PADDLEOCR_MCP_SERVER_URL": "<your url>", "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>" } } } }对于 PaddleOCR-VL 服务:
{ "mcpServers": { "PaddleOCR-VL": { "command": "uvx", "args": [ "--from", "paddleocr-mcp", "paddleocr_mcp" ], "env": { "PADDLEOCR_MCP_PIPELINE": "PaddleOCR-VL", "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio", "PADDLEOCR_MCP_SERVER_URL": "<your url>", "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>" } } } }PADDLEOCR_MCP_SERVER_URL值模型对应服务的基础URL(如https:/xxxxxx.aistudio-app.com),同时在 此页面 获取您的 访问令牌。 - macOS:
- 重启 Claude for Desktop。新的
paddleocr-ocr工具现在应该可以在应用中使用了。
除了上述使用方式外,PaddleOCR MCP 服务器还支持更多用法,例如接入本地 Python 库、使用 Streamable HTTP 传输等。关于 PaddleOCR MCP 服务器的更多能力,请参考 PaddleOCR 官方文档。
