万物皆可 Markdown!开源 MCP 服务器 Markdownify,10 种格式一键转换
万物皆可 Markdown开源 MCP 服务器 Markdownify10 种格式一键转换一个 MCP 服务器搞定 PDF、图片、音频、网页、Office 文档到 Markdown 的全部转换目录1. 项目简介——它是什么2. 它能做什么——11 个工具全覆盖3. 快速上手——3 步跑起来4. 核心原理——源码解析5. Docker 部署与安全配置6. 适用场景与优缺点7. 总结1. 项目简介——它是什么Markdownify MCP是一个基于MCPModel Context Protocol协议构建的开源服务器核心使命非常简单把几乎所有东西转成 Markdown。想想你日常工作中遇到的这些场景 收到一份 PDF想提取文本做笔记 → 转 Markdown️ 看到一张图想得到描述和元数据 → 转 Markdown 录了一段音频想要文字转录 → 转 Markdown 看到一个好网页想保存内容 → 转 Markdown 拿到 Excel 表格想快速浏览 → 转 Markdown这些需求Markdownify一个服务器全搞定。它背后依托微软开源的markitdown工具作为转换引擎再通过 MCP 协议让 AI 模型比如 Claude、GPT直接调用这些能力实现「AI 读万物」的终极愿景。 项目地址https://github.com/zcaceres/markdownify-mcp LicenseMIT2. 它能做什么——11 个工具全覆盖Markdownify 提供了11 个 MCP 工具覆盖了你能想到的几乎所有常见格式工具名输入类型核心能力youtube-to-markdownYouTube URL提取视频字幕/转录文本pdf-to-markdownPDF 文件路径提取 PDF 全文为 Markdownbing-search-to-markdownBing 搜索 URL将搜索结果转为结构化 Markdownwebpage-to-markdown网页 URL爬取网页内容转为 Markdownimage-to-markdown图片文件路径提取图片描述 元数据audio-to-markdown音频文件路径语音转文字转录docx-to-markdownDOCX 文件路径Word 文档转 Markdownxlsx-to-markdownXLSX 文件路径Excel 表格转 Markdownpptx-to-markdownPPTX 文件路径PPT 演示文稿转 Markdowngit-repo-to-markdownGit 仓库 URL整个代码仓库打包成单份 Markdownget-markdown-fileMarkdown 文件路径直接读取已有的 .md 文件其中git-repo-to-markdown特别有意思——它底层用了repomix工具能把一个完整 GitHub 仓库文件树 源码打包成一份 Markdown 文档还能用Tree-sitter 压缩把输出体积缩减约 70%3. 快速上手——3 步跑起来Step 1克隆项目 安装依赖gitclone https://github.com/zcaceres/markdownify-mcp.gitcdmarkdownify-mcp buninstall⚠️bun install的preinstall步骤会自动创建 Python 虚拟环境.venv并安装markitdown[all]含 PDF、音频、OCR 等全部功能。所以你不需要手动装 Python 依赖Step 2构建项目bun run buildStep 3启动服务器bun start服务器就跑起来了接下来把它接入你的 AI 桌面客户端。接入桌面应用如 Claude Desktop在你的 MCP 客户端配置中添加{mcpServers:{markdownify:{command:node,args:[/你的绝对路径/markdownify-mcp/dist/index.js]}}}保存后重启客户端AI 就能直接调用以上 11 个工具了4. 核心原理——源码解析Markdownify 的架构非常清晰核心就三个模块️ 架构概览MCP 客户端Claude / 其他 AI ↕ MCP 协议 server.ts路由层 ↕ tools.ts工具定义层 ↕ Markdownify.ts转换引擎层 ↕ markitdown repomix底层工具 server.ts —— 请求路由服务器注册了两个 MCP 请求处理器ListToolsRequestSchema返回所有可用工具列表CallToolRequestSchema根据工具名分发调用分发逻辑非常简洁用switch语句按工具名路由switch(name){// URL 类工具YouTube、Bing、网页→ 传 url 参数caseyoutube-to-markdown:casebing-search-to-markdown:casewebpage-to-markdown:resultawaitMarkdownify.toMarkdown({url:validatedArgs.url});break;// 文件类工具PDF、图片、音频、Office→ 传 filePath 参数casepdf-to-markdown:caseimage-to-markdown:// ... ...resultawaitMarkdownify.toMarkdown({filePath:validatedArgs.filepath});break;// Git 仓库 → 调用专门的 fromRepo 方法casegit-repo-to-markdown:resultawaitMarkdownify.fromRepo({repoUrl:validatedArgs.url,branch:validatedArgs.branch,compress:validatedArgs.compress,});break;} tools.ts —— 工具定义每个工具用 MCP SDK 的ToolSchema定义包含name工具名如pdf-to-markdowndescription功能描述inputSchema输入参数filepath或urlannotations标注readOnlyHint: true只读工具不修改文件设计上遵循只读原则——所有工具都是读取内容并转换输出不会修改原始文件。 转换引擎底层转换实际由两个工具完成markitdown微软开源处理 PDF、图片、音频、Office 文档等本地文件转换repomix处理 Git 仓库打包为 Markdown支持 Tree-sitter 压缩5. Docker 部署与安全配置Docker 一键部署dockerbuild-tmarkdownify-mcp.dockerrun--rm-i\-v$HOME/Documents:/data:ro\-eMD_ALLOWED_PATHS/data\markdownify-mcp 注意Docker 镜像默认只安装了markitdown[pdf]音频转录和图片 OCR 功能需要[all]extras需本地安装才能使用完整功能。安全配置——MD_ALLOWED_PATHS这个服务器提供了路径安全机制防止 AI 模型随意读取系统文件环境变量默认值作用MD_ALLOWED_PATHS未设置不限制限制文件类工具只能读取指定目录POSIX 用:分隔Windows 用;MARKITDOWN_PATH项目内.venv/bin/markitdownmarkitdown 可执行文件路径REPOMIX_PATH项目内node_modules/.bin/repomixrepomix 可执行文件路径示例只允许读取/data/in和/data/outMD_ALLOWED_PATHS/data/in:/data/out bun start6. 适用场景与优缺点✅ 适合谁用场景说明AI 应用开发者给 AI 加上「读懂万物」的能力知识管理爱好者把各种格式内容统一为 Markdown 入库自动化工作流批量转换文档、提取信息代码分析git-repo-to-markdown把整个仓库喂给 AI 分析⚖️ 优缺点对比优点缺点 格式覆盖广10 种文件 网页 音频转录依赖 markitdown[all]extrasDocker 精简版不支持 MCP 协议标准任何兼容客户端都能用 依赖 Python Bun 双运行时安装稍复杂 只读设计安全可靠 转换质量依赖 markitdown 底层复杂 PDF 可能丢失排版 支持 Docker 部署 路径安全机制 Bing 搜索仅支持 Bing不支持 Google Git 仓库转 Markdown 支持 Tree-sitter 压缩 项目相对年轻v1.1.0文档和生态还在成长7. 总结Markdownify MCP 用一个清晰优雅的设计解决了 AI 与人类沟通的格式鸿沟问题——PDF、Word、Excel、PPT、图片、音频、网页、甚至整个代码仓库统统变成 Markdown让 AI 模型可以直接「阅读」。它基于 MCP 协议意味着任何兼容的 AI 客户端都能无缝接入底层依托微软 markitdown 和 repomix 两个成熟工具转换能力扎实。加上 Docker 部署和路径安全机制生产环境也能放心用。如果你正在构建 AI 应用或者想让你的 AI 助手「读懂」更多东西Markdownify MCP 是目前最全面的格式转换 MCP 服务器之一。推荐指数⭐⭐⭐⭐ (4/5)格式覆盖全面、架构清晰、协议标准但双运行时依赖和部分功能的精简镜像限制是小小遗憾。原文链接https://github.com/zcaceres/markdownify-mcpLicenseMIT标签#GitHub #开源项目 #Markdownify #MCP #Markdown #AI工具 #格式转换分类原创文章