万物皆可 Markdown开源 MCP 服务器 Markdownify10 种格式一键转换一个 MCP 服务器搞定 PDF、图片、音频、网页、Office 文档到 Markdown 的全部转换目录1. 项目简介——它是什么2. 它能做什么——11 个工具全覆盖3. 快速上手——3 步跑起来4. 核心原理——源码解析5. Docker 部署与安全配置6. 适用场景与优缺点7. 总结1. 项目简介——它是什么Markdownify MCP是一个基于MCPModel Context Protocol协议构建的开源服务器核心使命非常简单把几乎所有东西转成 Markdown。想想你日常工作中遇到的这些场景 收到一份 PDF想提取文本做笔记 → 转 Markdown️ 看到一张图想得到描述和元数据 → 转 Markdown 录了一段音频想要文字转录 → 转 Markdown 看到一个好网页想保存内容 → 转 Markdown 拿到 Excel 表格想快速浏览 → 转 Markdown这些需求Markdownify一个服务器全搞定。它背后依托微软开源的markitdown工具作为转换引擎再通过 MCP 协议让 AI 模型比如 Claude、GPT直接调用这些能力实现「AI 读万物」的终极愿景。 项目地址https://github.com/zcaceres/markdownify-mcp LicenseMIT2. 它能做什么——11 个工具全覆盖Markdownify 提供了11 个 MCP 工具覆盖了你能想到的几乎所有常见格式工具名输入类型核心能力youtube-to-markdownYouTube URL提取视频字幕/转录文本pdf-to-markdownPDF 文件路径提取 PDF 全文为 Markdownbing-search-to-markdownBing 搜索 URL将搜索结果转为结构化 Markdownwebpage-to-markdown网页 URL爬取网页内容转为 Markdownimage-to-markdown图片文件路径提取图片描述 元数据audio-to-markdown音频文件路径语音转文字转录docx-to-markdownDOCX 文件路径Word 文档转 Markdownxlsx-to-markdownXLSX 文件路径Excel 表格转 Markdownpptx-to-markdownPPTX 文件路径PPT 演示文稿转 Markdowngit-repo-to-markdownGit 仓库 URL整个代码仓库打包成单份 Markdownget-markdown-fileMarkdown 文件路径直接读取已有的 .md 文件其中git-repo-to-markdown特别有意思——它底层用了repomix工具能把一个完整 GitHub 仓库文件树 源码打包成一份 Markdown 文档还能用Tree-sitter 压缩把输出体积缩减约 70%3. 快速上手——3 步跑起来Step 1克隆项目 安装依赖gitclone https://github.com/zcaceres/markdownify-mcp.gitcdmarkdownify-mcp buninstall⚠️bun install的preinstall步骤会自动创建 Python 虚拟环境.venv并安装markitdown[all]含 PDF、音频、OCR 等全部功能。所以你不需要手动装 Python 依赖Step 2构建项目bun run buildStep 3启动服务器bun start服务器就跑起来了接下来把它接入你的 AI 桌面客户端。接入桌面应用如 Claude Desktop在你的 MCP 客户端配置中添加{mcpServers:{markdownify:{command:node,args:[/你的绝对路径/markdownify-mcp/dist/index.js]}}}保存后重启客户端AI 就能直接调用以上 11 个工具了4. 核心原理——源码解析Markdownify 的架构非常清晰核心就三个模块️ 架构概览MCP 客户端Claude / 其他 AI ↕ MCP 协议 server.ts路由层 ↕ tools.ts工具定义层 ↕ Markdownify.ts转换引擎层 ↕ markitdown repomix底层工具 server.ts —— 请求路由服务器注册了两个 MCP 请求处理器ListToolsRequestSchema返回所有可用工具列表CallToolRequestSchema根据工具名分发调用分发逻辑非常简洁用switch语句按工具名路由switch(name){// URL 类工具YouTube、Bing、网页→ 传 url 参数caseyoutube-to-markdown:casebing-search-to-markdown:casewebpage-to-markdown:resultawaitMarkdownify.toMarkdown({url:validatedArgs.url});break;// 文件类工具PDF、图片、音频、Office→ 传 filePath 参数casepdf-to-markdown:caseimage-to-markdown:// ... ...resultawaitMarkdownify.toMarkdown({filePath:validatedArgs.filepath});break;// Git 仓库 → 调用专门的 fromRepo 方法casegit-repo-to-markdown:resultawaitMarkdownify.fromRepo({repoUrl:validatedArgs.url,branch:validatedArgs.branch,compress:validatedArgs.compress,});break;} tools.ts —— 工具定义每个工具用 MCP SDK 的ToolSchema定义包含name工具名如pdf-to-markdowndescription功能描述inputSchema输入参数filepath或urlannotations标注readOnlyHint: true只读工具不修改文件设计上遵循只读原则——所有工具都是读取内容并转换输出不会修改原始文件。 转换引擎底层转换实际由两个工具完成markitdown微软开源处理 PDF、图片、音频、Office 文档等本地文件转换repomix处理 Git 仓库打包为 Markdown支持 Tree-sitter 压缩5. Docker 部署与安全配置Docker 一键部署dockerbuild-tmarkdownify-mcp.dockerrun--rm-i\-v$HOME/Documents:/data:ro\-eMD_ALLOWED_PATHS/data\markdownify-mcp 注意Docker 镜像默认只安装了markitdown[pdf]音频转录和图片 OCR 功能需要[all]extras需本地安装才能使用完整功能。安全配置——MD_ALLOWED_PATHS这个服务器提供了路径安全机制防止 AI 模型随意读取系统文件环境变量默认值作用MD_ALLOWED_PATHS未设置不限制限制文件类工具只能读取指定目录POSIX 用:分隔Windows 用;MARKITDOWN_PATH项目内.venv/bin/markitdownmarkitdown 可执行文件路径REPOMIX_PATH项目内node_modules/.bin/repomixrepomix 可执行文件路径示例只允许读取/data/in和/data/outMD_ALLOWED_PATHS/data/in:/data/out bun start6. 适用场景与优缺点✅ 适合谁用场景说明AI 应用开发者给 AI 加上「读懂万物」的能力知识管理爱好者把各种格式内容统一为 Markdown 入库自动化工作流批量转换文档、提取信息代码分析git-repo-to-markdown把整个仓库喂给 AI 分析⚖️ 优缺点对比优点缺点 格式覆盖广10 种文件 网页 音频转录依赖 markitdown[all]extrasDocker 精简版不支持 MCP 协议标准任何兼容客户端都能用 依赖 Python Bun 双运行时安装稍复杂 只读设计安全可靠 转换质量依赖 markitdown 底层复杂 PDF 可能丢失排版 支持 Docker 部署 路径安全机制 Bing 搜索仅支持 Bing不支持 Google Git 仓库转 Markdown 支持 Tree-sitter 压缩 项目相对年轻v1.1.0文档和生态还在成长7. 总结Markdownify MCP 用一个清晰优雅的设计解决了 AI 与人类沟通的格式鸿沟问题——PDF、Word、Excel、PPT、图片、音频、网页、甚至整个代码仓库统统变成 Markdown让 AI 模型可以直接「阅读」。它基于 MCP 协议意味着任何兼容的 AI 客户端都能无缝接入底层依托微软 markitdown 和 repomix 两个成熟工具转换能力扎实。加上 Docker 部署和路径安全机制生产环境也能放心用。如果你正在构建 AI 应用或者想让你的 AI 助手「读懂」更多东西Markdownify MCP 是目前最全面的格式转换 MCP 服务器之一。推荐指数⭐⭐⭐⭐ (4/5)格式覆盖全面、架构清晰、协议标准但双运行时依赖和部分功能的精简镜像限制是小小遗憾。原文链接https://github.com/zcaceres/markdownify-mcpLicenseMIT标签#GitHub #开源项目 #Markdownify #MCP #Markdown #AI工具 #格式转换分类原创文章