零基础也能搭 AI 语音客服:MCP + GPT-5 实战指南
不会 Python?没学过 NLP?跟着本文 30 分钟让你拥有一套能听懂、会查询、可回答的保险语音客服系统,本地运行、零部署费用!
一、MCP 是什么?(一句话记住)
Model Context Protocol(MCP)= AI 大模型与外部工具的“翻译官”。
它让 GPT-5 可以安全地调用数据库、搜索网页、播放语音,而无需写一堆接口。
二、最终效果预览
场景 | 语音输入 | AI 回答(语音) | 背后工具 |
---|---|---|---|
保险条款咨询 | “糖尿病报销比例?” | 实时播报条款 | 本地文件 RAG |
价格筛选 | “月保费 <300 的计划?” | 逐条朗读 | SQLite 查询 |
健康常识 | “糖尿病怎么吃?” | 语音总结 | 实时网页搜索 |
三、30 分钟 5 步搭建
① 安装环境(3 分钟)
工具 | 一键命令 | 备注 |
---|---|---|
Python 3.10+ | Python 3.13.3 64位 安装包 for Windows 下载地址 | 勾选“Add to PATH” |
ffmpeg(音频) | Mac: brew install ffmpeg Win: 下载 exe |
让电脑能录音放音 |
项目依赖 | pip install -U openai-agents[voice] mcp uv |
国内源加 -i https://pypi.tuna.tsinghua.edu.cn/simple |
② 准备资料(2 分钟)
- 把保险条款 PDF / Word 放到
sample_files/
- 新建
database.db
(SQLite)存价格表:CREATE TABLE plans(name TEXT, premium INTEGER); INSERT INTO plans VALUES ('基础保',200),('全面保',350);
③ 启动 MCP 工具服务(1 分钟)
在终端执行:
# 克隆示例仓库(已含中文注释)
git clone https://gitee.com/w3cschool/mcp-voice-demo.git
cd mcp-voice-demo
uv run python search_server.py
看到 ✅ SSE server started
即可。
④ 配置语音客服(1 分钟)
新建 env.txt
填:
OPENAI_API_KEY=你的key
再执行:
uv run python voice_bot.py
屏幕显示 🎙️ Insurance Voice Assistant Ready! 就可以说话了。
⑤ 开麦对话(无限时长)
直接问:
- “哪些计划月保费低于 300?”
- “条款里糖尿病怎么报销?”
- “糖尿病饮食注意啥?”
系统会自动:
录音 → GPT-5 理解 → 调用工具 → 语音回答。
四、小白也能改的 3 个地方
目标 | 改哪里 | 中文示例 |
---|---|---|
换行业 | voice_bot.py |
把提示词“保险”换成“教育” |
换声音 | voice_bot.py 第 30 行 |
"Personality: 温柔耐心的客服小姐姐" |
加文件 | 放新 PDF 到 sample_files/ |
自动重新索引,无需重启 |
五、核心代码拆解(中文注释版)
# 1️⃣ 定义工具:RAG + 搜索 + 数据库
tools = [
{"type": "rag", "source": "sample_files/"},
{"type": "sqlite", "db": "database.db"},
{"type": "web_search"}
]
# 2️⃣ 创建语音客服代理
agent = Agent(
name="智能客服",
instructions="用中文口语回答,简短清晰",
tools=tools,
model="gpt-4.1-mini"
)
# 3️⃣ 启动语音对话
voice_pipeline.start(agent)
全部代码不到 100 行
六、常见问题速查
报错 | 原因 | 中文解决 |
---|---|---|
ffmpeg not found |
没装音频驱动 | 重装 ffmpeg 并重启电脑 |
OPENAI_API_KEY not set |
密钥没填 | 复制 .env.example 为 .env |
语音识别乱码 | 麦克风权限 | Win10 设置→隐私→麦克风→允许桌面应用 |
七、一句话总结
“会用中文说话,就能让 GPT-5 帮你做语音客服。”