EarlMind

阿里云百炼 MCP+高德体验的三个问题

LLM  ·  

MCP无疑是近期大模型应用的热门话题。作为Claude推出的新协议,还处于初创阶段,各家如何接入仍处于探索之中。

之前尝试使用本地客户端Cherry Studio接入MCP时,遇到了诸多问题。光光是为了搞定UVX等本地运行环境,就折腾不少。直到Cherry Studio被迫内置运行环境和几个本地MCP后,可用性才大幅提升。

因此,当看到阿里云百炼平台提供了内置的MCP市场后,无需做这些烦琐的配置了,自然也想尝试一下。

因为近期业务开发的需求,需要用到高德地图的MCP,所以做了测试。

整个接入过程确实非常简单。在已有的智能体中,直接在MCP服务中添加高德地图(即AMap)的MCP即可。目前该应用尚处于免费试用阶段,因此无需填写高德开发者平台的 API。

longshot20250416111933

当然,这也带来了一些问题,比如服务稳定性不足,访问量大时经常报错。目前仅适合测试,无法进入商用阶段。根据官方说明,若需商业化应用,则需联系阿里云相关业务。

在尝试使用过程中,我不得不感叹MCP开发的速度之快。

在接入高德的MCP后,我直接在原有智能体上询问“上海复旦大学附近一公里内的三星级以上宾馆及价格”。结果发现高德的MCP连续进行了四次调用:第一次获取上海复旦大学的经纬度,第二次利用该经纬度查询附近一公里的宾馆并得到两个结果,第三和第四次则分别查询这两个宾馆的详细信息。虽然可能由于高德接口的原因未能获取酒店价格,但仅凭一句话就能获得如此详细的信息,我觉得这已经是一个非常理想的状态。

longshot20250416113440

对于非专业开发者来说,你无需查询API,也无需拼接各种代码,大模型会为你代劳一切。当然,在这一体验中,有三个问题不得不提。

token 消耗海量

首先是token的消耗问题。

我仅进行了一次简单查询,返回结果不过一两百字,但由于进行了四次MCP查询,大模型总共输入了四万多个token。

这意味着如果按付费计算,成本并不低。

针对这个问题,我也考虑过可能需要考虑类似通义千问的Qwen Turbo这样的低价高速模型,而非更昂贵的Plus甚至Max模型。

但这就引发了第二个问题:成功率。

成功率是玄学

虽然我展示的图片是一个非常完美的案例,但在实际使用中,是否能触发高德的MCP存在一定的偶然性。尤其是使用低阶的 Turbo 模型时。

没有足够的数据统计,我无法确定是否一定是模型的原因。

但至少从我的体验来看,Turbo模型触发成功的概率确实感觉较低。而使用Plus模型获取的数据有时也不够准确。

例如,在针对复旦大学的查询中,第一次调用时并未获取经纬度,而是直接填入一个经纬度开始查询附近地址,结果返回了一堆宾馆,但很多并不符合三星级标准。这可能与模型能力有较大关系。

longshot20250416112521

当然,即便是调用通义千问的Max模型,也并非绝对成功,只是成功概率略高一些。因此,未来可能需要期待通义千问的下一代模型在对接MCP时有更好的表现。

知识库+MCP 可并行

知识库我比较欣赏阿里云百炼平台的一个特点,在开发定向检索智能体上超级快。

这次,知识库检索与MCP可以并存。这意味着我既可以优先检索本地知识库内容,也可以通过类似高德云的接口进行额外检索。

但从试用体验来看,当开启知识库检索后,高德MCP的成功率有所下降。

比如使用路径会有些不同。我就遇到过它并非像之前那样先获取经纬度再查询,而是将整个问题当作地址输入,若获取经纬度失败,则直接用文字查询,结果准确率会显著降低。但这个问题很难判断究竟出在哪一环节,感觉上还是模型在调用MCP时存在一些问题。

期待更多文档

由于阿里云百炼目前似乎未提供太多相关教程,我也不清楚是否需要在提示词中对类似Function Call的功能做特定修改,才能更好地调用高德的接口。

这也是当前整个大模型开发中遇到的一个普遍问题,即文档跟不上应用发展的速度。类似阿里云百炼推出MCP调用,仅有少数KOL写过相关内容,而官方文档中,阿里云百炼也未提供更多介绍或参考,一切只能靠开发者自行摸索。

这对开发者而言,确实不太友好。

# # #

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注