📦

Xhs Content Agent

这是我开发的一个基于大模型的小红书内容运营智能 Agent 系统。该系统可以实现从数据采集到内容生成，再到自动发布的完整流程，主要功能包括：使用 Playwright 爬取小红书热门内容分析爆款规律（关键词、标签、标题结构）基于分析结果自动生成选题使用大模型生成完整文案（标题、正文、标签、互动语）调用图像模型生成配图支持通过 API 或 MCP 一键发布内容技术栈包括： FastAPI、LangChain、OpenAI（GPT + 图像模型）、Playwright、Pydantic 等。该项目的核心思路是将数据分析与大模型生成结合，实现内容生产的自动化与智能化。适用于：内容运营、自媒体自动化、AI Agent 应用开发等场景。

0 installs

Trust: 39 — Low

Agents

Ask AI about Xhs Content Agent

I know everything about Xhs Content Agent. Ask me about installation, configuration, usage, or troubleshooting.

0/500

Loading tools...

Reviews

Documentation

XHS Content Agent — 小红书 AI 内容助手

基于 FastAPI + LangChain + OpenAI 构建的小红书内容挖掘与自动生成系统。支持从爬取竞品数据、分析爆款规律、AI 生成文案与配图，到一键发布至小红书的完整闭环。

功能概览

模块	说明
数据采集	通过 Playwright 爬取小红书搜索结果，支持按关键词、评论数、点赞数、收藏数过滤，自动跳过视频与广告
数据分析	提取高频关键词、热门标签、标题规律与用户洞察，输出结构化分析报告
话题生成	基于分析结果，调用 LLM 生成若干高质量选题建议（含标题与理由）
内容生成	针对每个选题生成多条完整文案：正文、标题、话题标签、互动引导语、图片建议、内容类型
图片生成	调用 OpenAI `gpt-image-1` 生成符合小红书风格的配图，保存至本地
内容发布	支持 MCP 协议（推荐）或 REST API 两种模式发布至小红书
飞书同步	将爬取数据与 AI 生成内容分别同步至飞书多维表格，便于团队协作与审核
MCP Server	将完整流水线封装为 MCP 工具，可在 Claude Desktop / Cursor 等 AI 工具中直接调用
Web UI	内置静态前端，提供爬取、生成、发布的图形化操作界面

快速开始

1. 安装依赖

python -m venv .venv
.venv\Scripts\activate        # Windows
pip install -r requirements.txt
playwright install chromium

2. 配置环境变量

复制 .env 文件并填写必要字段：

# OpenAI
OPENAI_API_KEY=sk-...
OPENAI_MODEL=gpt-4o-mini
OPENAI_BASE_URL=                  # 可选，代理地址

# 图片生成
IMAGE_MODEL=gpt-image-1

# 飞书多维表格（可选）
FEISHU_APP_ID=
FEISHU_APP_SECRET=
FEISHU_APP_TOKEN=
FEISHU_TABLE_ID=                  # 爬虫数据表
FEISHU_PUBLISH_TABLE_ID=          # AI 生成笔记表

# 小红书 MCP 服务（本地）
XHS_MCP_URL=http://localhost:18060
XHS_MCP_ENDPOINT=http://localhost:18060/mcp

3. 启动服务

uvicorn app.main:app --reload --host 127.0.0.1 --port 8000

浏览器访问 http://127.0.0.1:8000 进入 Web UI。

FastAPI 交互文档：http://127.0.0.1:8000/docs

主要 API

路由	说明
`POST /analysis/analyze`	分析笔记列表，返回关键词、标签、标题规律、洞察点
`POST /topics/generate`	根据分析结果生成话题建议
`POST /content/generate`	根据选题生成图文文案
`POST /agent/run`	一键运行完整内容生成流水线（分析 → 话题 → 文案）
`POST /crawl/search`	按关键词爬取小红书图文笔记
`POST /publish/prepare`	组装发布 Payload（REST / MCP 格式）
`POST /publish/send`	发布至小红书
`POST /feishu/sync`	将生成内容同步至飞书
`POST /feishu/sync-crawled`	将爬取数据同步至飞书
`GET /health`	健康检查

MCP Server 使用

将本项目封装为 MCP Server，可在支持 MCP 协议的 AI 工具（Claude Desktop、Cursor 等）中注册使用。

python mcp_server.py

提供以下 MCP 工具：

工具	说明
`run_content_pipeline`	完整运行内容生成流水线
`generate_xhs_images`	根据文案生成配图
`publish_to_xhs`	生成配图并一键发布至小红书
`check_xhs_login`	检查小红书登录状态

项目结构

xhs_content_agent/
├── app/
│   ├── api/               # FastAPI 路由层
│   ├── core/              # 配置（Settings）
│   ├── models/            # Pydantic 数据模型
│   ├── prompts/           # LLM Prompt 模板
│   └── services/          # 业务逻辑层
│       ├── agent_service.py          # 主流水线编排
│       ├── analysis_service.py       # 笔记数据分析
│       ├── topic_service.py          # 话题生成
│       ├── content_service.py        # 文案生成
│       ├── image_service.py          # 图片生成
│       ├── publish_service.py        # 小红书发布
│       ├── feishu_service.py         # 飞书同步
│       ├── local_site_crawler_service.py  # 小红书爬虫
│       └── mcp_client_service.py     # MCP 客户端
├── static/                # Web 前端页面
├── data/
│   ├── raw/               # 爬取数据 / 样本数据
│   └── output/images/     # 生成的图片
├── mcp_server.py          # MCP Server 入口
├── requirements.txt
└── .env                   # 环境变量配置

技术栈

后端框架：FastAPI + Uvicorn
LLM 调用：LangChain + LangChain-OpenAI（GPT-4o-mini）
图片生成：OpenAI gpt-image-1
爬虫：Playwright（Chromium）
MCP 协议：mcp SDK（FastMCP）
飞书 API：飞书多维表格 Open API
中文处理：jieba 分词
数据验证：Pydantic v2

注意事项

爬取功能需要提前完成小红书登录并将 Cookies 保存至 data/raw/xhs_cookies.json。
发布功能依赖本地运行的小红书 MCP 服务（默认端口 18060），需完成扫码登录。
图片生成需要 OpenAI API Key 且该 Key 有 gpt-image-1 的访问权限。
飞书同步为可选功能，未配置时相关接口会返回提示信息而不会报错。