1、MCP 能干什么
1.1 案例1,开发部署
技术人员可以直接通过自然语言和大模型交互,例如我下一个指令:
代码块 “帮我把代码的新版本部署到测试环境”
我们这是一个明确的动作指令,如果没有 MCP ,大语言模型最多可以给你解释怎么部署?有哪些步骤?什么是测试环境?
关键点在于,他是没办法真正帮你执行具体动作的,还是需要我们自己按照大模型给出的步骤一步一步的把新版本部署完成。
但是如果有 MCP ,这一切都不一样了。
你用自然语言和大模型交互,下达动作指令之后,大模型就会触发链式调用
比如它会调用 GitLab 的 MCP 服务完成代码合并,然后调用 Jenkins 的 MCP 服务完成构建镜像,再调用 Slack 的 MCP 服务通知团队新版本部署好了。
你会发现有了 MCP 之后,大模型就好像有了手脚,把本身需要你做的任务,他自己就能完成了。
1.2 案例2,SQL 查询
SQL 是一种数据库查询语言,开发人员会把用户信息以及系统信息存储在数据库里面,想要把数据查询出来就得使用 SQL 才能把数据库里面的数据以可视化的方式查询出来
比如,生财的会员信息都存储在生财后台的数据库,生财用户发的帖子也都存储在生财的数据库,我们之所以能看到这些帖子,是生财做了专门的开发,把数据库里面的信息以用户友好的方式展示给了用户。
现在假如要统计:
代码块 上个月一共产生了多少篇精华帖,一个产生了多少中标贴
这肯定得技术人员去数据库里面拉数据才能知道,非技术人员是没有办法完成这件事的。
但是现在有了 MCP ,我们就可以针对主题帖开发一个 MCP 服务,针对风向标开发一个 MCP 服务,这样就算是非技术人员,他跟大模型交互,给出上面的指令后,大语言模型就会自动去调用 MCP 服务,帮他把数据全部都统计出来,最后甚至可以加一个发送邮件的 MCP 服务,数据统计好了之后直接邮件发送给老板,一句话就把三个任务都完成了。
2、MCP 是什么
MCP 全称是 Model Context Protocol ,翻译过来就是模型上下文协议。是2024年11月底,由 Anthropic(Claude 母公司) 推出的一种开放标准,旨在为大语言模型(LLM)提供统一的、标准化方式与外部数据源和工具之间进行通信。
官方文档:
https://modelcontextprotocol.io/introduction
搞出这个协议的目的是什么呢?
我自己浅显的理解,在没有 MCP 之前,大模型都只是对话机器人,可以给你提供知识,但是没办法帮你完成具体事情,也就是没有手脚。
现在我们设想,让大模型长出手脚,让开发人员可以提供一个一个的服务,比如发邮件的服务,让大模型可以把信息整理后发到我们邮箱,比如旅游规划的服务,让大模型可以帮我规划行程路线。
但是这就存在一个问题,不同的开发人员开发的服务,如果没有按照一个统一的协议、规范,大模型是不知道怎么去调用的。
就好像手机的充电口,如果没有一个统一的规范,苹果生产的是 lighting 充电口,华为生产的是 typeC充电口,小米生产的是 typeH 充电口,vivo 生产的可能是 typeZ 充电口,当然现在安卓苹果都统一用 typeC 接口了,如果没有统一作为用户,家里就会有 N 个充电线,使用起来也非常复杂。
大模型也一样,如果没有一个统一的协议的话,即使有非常多的工具服务给你调用,大模型想调用一个服务也是非常困难的,因为每个服务的调用方式都不一样,非常混乱,因此也不利于行业的长期发展。
所以 MCP 应运而生,把协议提前声明好,只要你的服务想让大模型调用,那你就遵循 MCP 这个协议,大家都遵循这个协议,行业发展也会越来越繁荣。
对比来看,现在不仅手机的接口是 typeC ,很多平板、笔记本电脑、键盘、鼠标都是 typec 接口,这就是统一协议的好处。
下面这张经典图片, MCP 就是一个标准,通过这个标准,电脑(大模型)就可以访问各种外界设备(MCP Server)。

为了更好的阅读体验,来飞书看吧:
https://pk0zg2jkji.feishu.cn/docx/HbVGdBN8CouL5gxwYofcoXyinWg
Comments on "MCP 使用指南" :