江南观察|MCP协议赋能人机协同研究新机遇
2025-04-22 21:27:00  来源:江南时报  作者:程诚 李玉  
1
听新闻

  进入2025年,人工智能(AI)的狂飙突进令人瞩目。高效、便捷的人工智能,不仅是新质生产力发展的重要力量,也极大冲击了各学科的研究范式。探讨与应用人工智能的新研究范式成为各学科的关注热点。然而,尽管学术界抱有了巨大期望,尚处于大语言模型(LLM)的人工智能还未能达到通用人工智能(AGI)的高度,AI起伏不定的幻觉特征与驳杂表现,也让一些研究者心存疑虑。模型上下文协议(Model Context Protocol,MCP)作为AI领域的新技术,提供了一种沟通大语言模型与外部数据及工具之间的联通机制,可以有效解决当前AI的“数据孤岛”,降低AI的幻觉几率,提升AI的智能化与自动化程度。MCP协议推动AI更加接近AGI的发展目标,更对人机协同研究具有重要价值。

  一、MCP协议的基本功能

  大语言模型依赖静态的预训练数据,主要基于Transformer深度学习架构。该架构引入自注意力机制,用于分析指令中不同序列的相互关系,并通过并行处理显著提升运算效率。简而言之,这种架构类似于翻译过程,确保信息从源语言到目标语言的准确传递,使AI能够像人类一样“思考”,快速抓住关键信息,并组织出最符合的语言表达。然而,其生成内容本质上是基于词频概率统计的随机结果,存在固有的“随机性”。AI只能遵从逻辑、语言的连贯性,无法自行验证事实的准确性。倘若训练数据质量不佳与算法存在缺陷,AI会在不自觉的情况下将虚假信息当做真实信息进行学习与引用。因此,大语言模型无法根治AI幻觉,常常出现答非所问或胡言乱语的情况。

  为了提升AI的准确性,科技界进行了不懈探索。OpenAI公司于2023年推出了Function Calling技术,允许用户在调度大模型的时候,可以通过调整外部函数与参数,进行更加准确、灵活的交互任务。如豆包、文小言推出了智能体开发平台,用户可以通过调整规则与参数改变输出效果,这就参考了类似机制。然而,这种技术难以真正打通计算机语言与人类语言的沟通障碍,一旦处理复杂需求与对话,多半表现不佳。而且,Function Calling的平台依赖性较强,通用性不足。

  2024年11月,Anthropic公司提出了MCP协议。该协议类似于电子设备的USB接口,可以连接任何适配的数据或应用,使得大模型可以在不同的API与数据之间交互切换。作为AI领域的“类通用语言”,MCP协议将大模型与资源之间的通信划分为三个部分,MCP主机,客户端与服务端,通过JSON规范实现跨领域通讯。用户通过MCP主机(AI聊天界面)输入需求到客户端,客户端分析需求并发送给服务端,服务端收到需求后,进行内容解析,执行具体操作。最后,服务端将处理结果处置成响应内容,最终反馈到用户的聊天页面。挂载了MCP协议的AI,可以根据MCP提供的功能来理解更多的上下文,并自动执行一些复杂任务。比如,以用户的出行规划为例,此前大模型尽管可以通过联网搜索,但由于无法读取实时交通信息,只能基于已有数据回答,可能还会生成子虚乌有的结果。添加了谷歌地图的MCP协议后,AI就可以自行调用实时地图,提供符合现实场景的答案。

  今年3月,Manus问世,坊间称之为全球首款通用人工智能体,能执行人类梦寐以求的全流程任务自动化操作。Manus的主要技术之一便是MCP协议,紧随其后,又诞生了genspark等类似平台,直接带动了MCP协议迅速走红。短短的数月间,各种平台与社区便于提供了各种丰富的MCP协议,涵盖模拟推理、实时搜索、视频读取、图像生成、数据读取、代码编程与社交平台等方面。对于开发者而言,MCP的架构更为清晰,使得AI应用的开发更为便捷。对于非专业的普通用户而言,即便不掌握开发技术,也可以通过丰富的现有资源完成个人的智能化、自动化操作。

  二、MCP协议的技术优势

  作为人工智能领域的最新技术成果,MCP协议引领着AI发展进入“可连接、可扩展、可协作”的新阶段。具体来说,有以下几个技术优势。

  第一,统一接口,开发者友好。MCP协议平台适配性强,可以实现“一次开发,多端适配”,开发者与用户无需重复编程,便可以利用现有的开源MCP服务来搭建智能体,极大地降低了技术开发难度,可以节省精力,更加专注于核心任务创新。

  第二,实时感知,多模态协作。区别于传统API的“请求——响应”的交互方式,MCP协议允许服务器主动推送实时数据,这就可以让AI在未经过微调的情况下,更加准确的感知实时信息,降低大模型的幻觉,提升AI在现实场景的反馈能力。此外,MCP还支持多个AI模型与应用的互相协作,不同特点与专长的模型可以灵活切换。在用户处置复杂任务时,大模型甚至可以进行全流程的自主操作。从收到用户指令开始,便能自主思考,自主分解,自主执行,直至最终交付完整结果。

  第三,开源模式,技术共享化。MCP协议有着广泛的兼容性,可以连接不同的技术,能够有效推动AI从闭源走向开源。相对不高的技术门槛,更能吸引更多企业与用户加入AI开发应用,推动AI技术的普惠发展。伴随着具身智能等技术的研发,未来大模型或许不再需要MCP协议作为中介,便能直接感知外在环境。然而,在当前的技术条件下,短期内MCP依然是理想选择。

  第四,注重安全,数据本地化。借助MCP协议,本地数据无需上传到云端,或者预先植入到大模型之中,便可以搜索与引用本地数据,提升了数据安全性。此外,MCP协议还可以增加人工审校的许可,在进行自动化操作时,会提示用户是否允许,进一步保障数据安全。

  三、MCP协议对人机协同研究的价值

  在MCP协议的加持下,AI不再是单一的信息提供者或执行者,而是能够主动获取信息、调用工具、分析数据的智能助手。更重要的是,MCP协议让AI能够更好地理解和适应人类的工作流程和习惯,而不是强制人类适应AI的局限。随着MCP协议的不断完善,可以预见人机协作模式将更加高效和深入。就学术研究而言,MCP带来了新的机遇。

  首先是效率革命成为可能。学术研究离不开大量机械的、事务性的重复劳动,如文献检索、数据加工、格式调整等。MCP协议支持用户调用跨平台的模型与应用,尽可能地“去繁就简”,极大地降低人工操作量。以笔者的实践经验来看,内置了MCP协议的智能体支持从图像识别到文字录入,再到词频提取,乃至生成可视化图表的全过程。在此之前,即便使用人工智能,研究者也往往需要手动切换不同的模型和工具才能完成。

  其次是“全数据融合”的潜在图景。目前绝大多数AI程序都无法进行较为复杂的任务,研究者在使用过程中,必须要把任务拆解为AI能够执行的具体子项目。利用AI进行专业信息检索,哪怕采用检索增强生成技术(RAG),也存在难以根除的误差与幻觉。如果想要增强AI检索的针对性与准确性,则需要花费大量成本,对大模型重新训练与微调。通过MCP技术,大模型可以更加灵活的调用本地数据,实现近似大模型微调的升级效果。研究者还可以通过MCP将AI模型与多个外部系统连接,实现跨平台的数据分析。这种“全数据融合”的潜在图景,将推动研究方式真正从“假设议题”走向“数据驱动”。

  最后是助力学术共同体实现开放共享。通过标准化接口,研究者可以共享数据、已有算力与研究技术,乃至形成跨地域的协作网络。在目前的技术条件下,只要搭建合理的MCP开源协议,再由相关部门提供开源数据与服务器,即便没有先进装备,研究者也可以平等获取顶级的技术工具与研究数据。这对于资源相对匮乏的研究机构和个人研究者尤为重要。使研究者能够跨越地域、语言、学科的壁垒,共同推动协作研究与学科发展。

  当然,MCP协议虽然充满潜力,也存在一些有待解决的问题。一是跨模态协作需要消耗较大算力,需要一定的硬件基础;二是尚无普遍认可的统一标准,距离“全数据融合”还有差距。三是安全机制有待完善,社会各界需要在安全性与通用性上取得共识。只有建立匹配的AI伦理约束,才能让MCP协议真正走向大规模应用,成为连接虚拟世界与现实世界,赋能千行百业、联动百城千家的桥梁。

  展望未来,我们可以期待MCP协议在更多场景中的普遍应用,为人类带来更加智能和高效的服务。当AI通过标准化接口与现实世界深度链接,我们距离数字文明时代的新研究范式就会更加接近。MCP协议的价值,远不止于技术创新,更在于其勾勒出了人工智能发展的新图景,即一个打破壁垒、开放协作、以人为本、智能高效的智能生态。这才是人工智能发展的真正责任与奋斗目标。

标签:协议;MCP协议;人工智能
责编:江南