PaddleOCR_MCP
更新时间:2025-10-24
PaddleOCR 官网 MCP 服务器说明文档
PaddleOCR 提供轻量级的 MCP 服务器,可用于将 PaddleOCR 的文本识别、文档解析等能力快速集成到各种大模型应用中。PaddleOCR MCP 服务器当前支持的工具如下:
-
当前支持的工具
- OCR:对图像和 PDF 文件进行文本检测与识别。
- PP-StructureV3:从图像或 PDF 文件中识别和提取文本块、标题、段落、图片、表格以及其他版面元素,将输入转换为 Markdown 文档。
PaddleOCR MCP 服务器可被多种应用集成,支持其文本识别与文档解析能力。这里以 Claude for Desktop 为例,以下为快速接入 PaddleOCR MCP 服务器的步骤:
- 安装 uv。
-
在以下位置之一找到 Claude for Desktop 配置文件:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json - Linux:
~/.config/Claude/claude_desktop_config.json
打开
claude_desktop_config.json文件,参考如下示例调整配置,填充到claude_desktop_config.json中。对于 OCR 服务:
{ "mcpServers": { "paddleocr-ocr": { "command": "uvx", "args": [ "--from", "paddleocr-mcp@https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/mcp/paddleocr_mcp/releases/v0.2.0/paddleocr_mcp-0.2.0-py3-none-any.whl", "paddleocr_mcp" ], "env": { "PADDLEOCR_MCP_PIPELINE": "OCR", "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio", "PADDLEOCR_MCP_SERVER_URL": "http://j8r5t1c993t4tfy2.sandbox-aistudio-hub.baidu.com/ocr", "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>" } } } }对于 PP-StructureV3 服务:
{ "mcpServers": { "paddleocr-ocr": { "command": "uvx", "args": [ "--from", "paddleocr-mcp@https://paddle-model-ecology.bj.bcebos.com/paddlex/PaddleX3.0/mcp/paddleocr_mcp/releases/v0.2.0/paddleocr_mcp-0.2.0-py3-none-any.whl", "paddleocr_mcp" ], "env": { "PADDLEOCR_MCP_PIPELINE": "PP-StructureV3", "PADDLEOCR_MCP_PPOCR_SOURCE": "aistudio", "PADDLEOCR_MCP_SERVER_URL": "http://oceaxdm1h3v1v1pb.sandbox-aistudio-hub.baidu.com/layout-parsing", "PADDLEOCR_MCP_AISTUDIO_ACCESS_TOKEN": "<your-access-token>" } } } }在 此页面 获取您的 访问令牌。
- macOS:
- 重启 Claude for Desktop。新的
paddleocr-ocr工具现在应该可以在应用中使用了。
除了上述使用方式外,PaddleOCR MCP 服务器还支持更多用法,例如接入本地 Python 库、使用 Streamable HTTP 传输等。关于 PaddleOCR MCP 服务器的更多能力,请参考 PaddleOCR 官方文档。
