Resume Parser MCP
resume-parser-mcp 是一个基于 FastMCP 框架构建的微服务,旨在解析简历文件(目前支持 PDF 和 DOCX 格式),并将其内容提取为结构化的 JSON 对象。它利用了 mammoth 和 pdf-parse 等库进行文件内容提取,并提供了一个工具接口供其他服务调用。
Ask AI about Resume Parser MCP
Powered by Claude · Grounded in docs
I know everything about Resume Parser MCP. Ask me about installation, configuration, usage, or troubleshooting.
0/500
Reviews
Documentation
resume-parser-mcp
简介
resume-parser-mcp 是一个基于 FastMCP 框架构建的微服务,旨在解析简历文件(目前支持 PDF 和 DOCX 格式),并将其内容提取为结构化的 JSON 对象。它利用了 mammoth 和 pdf-parse 等库进行文件内容提取,并提供了一个工具接口供其他服务调用。
功能
- 简历解析: 支持解析 PDF (.pdf) 和 DOCX (.docx) 格式的简历文件。
- 文本提取: 从简历文件中准确提取文本内容。
- JSON 输出: 将提取的文本内容转换为标准化的 JSON 格式,便于后续处理和分析。
- URL 支持: 可以通过提供简历文件的 URL 来进行解析,服务会自动下载并处理文件。
MCP 配置
以下是 resume-parser-mcp 的 MCP 配置示例:
{
"mcpServers": {
"resume-parser-mcp": {
"command": "npx",
"args": [
"-y",
"resume-parser-mcp@1.0.4"
]
}
}
}
安装
-
克隆仓库:
git clone https://github.com/your-username/resume-parser-mcp.git cd resume-parser-mcp -
安装依赖:
使用 npm 或 bun 安装项目依赖:
npm install # 或者 pnpm install
使用
开发模式运行
npm run dev
# 或者
pnpm dev
构建项目
npm run build
# 或者
pnpm build
启动服务
构建完成后,可以通过 Node.js 启动服务:
npm start
# 或者
pnpm start
作为 FastMCP 工具使用
resume-parser-mcp 作为一个 FastMCP 工具,可以通过其提供的 resume_parser 工具进行调用。该工具接收一个 resume_url 参数,即简历文件的可访问 URL。
工具名称: resume_parser
描述: 解析简历并返回一个 JSON 对象。
参数:
resume_url: (string) 简历文件的 URL。
示例 (在 FastMCP 客户端中调用):
const result = await client.callTool('resume_parser', {
resume_url: 'http://example.com/path/to/your/resume.pdf'
});
console.log(result);
项目结构
.gitignore
README.md
package.json
pnpm-lock.yaml
src/
├── parser/ # 简历解析相关逻辑
│ ├── downloadFileFromUrl.ts # 文件下载工具
│ ├── extractFileText/ # 文本提取工具 (PDF, DOCX)
│ │ ├── extractTextFromDocx.ts
│ │ └── extractTextFromPdf.ts
│ ├── extractResumeField/ # 简历字段提取逻辑 (待实现或扩展)
│ └── parseTextToResume.ts # 文本到JSON简历的解析逻辑
├── server.ts # FastMCP 服务器入口文件
├── tool/ # FastMCP 工具定义
│ └── resume-parser.ts # 简历解析工具的实现
├── types.ts # 类型定义
└── utils/ # 通用工具函数
└── logger.ts # 日志工具
tsconfig.json
技术栈
- FastMCP: 微服务框架。
- TypeScript: 编程语言。
- Axios: 用于文件下载的 HTTP 客户端。
- Mammoth.js: 用于从 DOCX 文件中提取文本。
- PDF-Parse: 用于从 PDF 文件中提取文本。
- Zod: 用于数据验证。
- uuid: 用于生成唯一文件名。
贡献
欢迎贡献!如果您有任何建议或发现 Bug,请随时提交 Issue 或 Pull Request。
许可证
本项目采用 MIT 许可证。请参阅 LICENSE 文件了解更多详情。
