高德发布全球首个由大模型驱动的视觉认知步行导引系统,高德地图步行导航视角跟随

3月6日消息，高德地图近日推出了一款名为"地标AI领航"的视觉认知步行导引系统。该系统融合了千问大模型、亿级POI与千万级街景图像，使导航系统具备了视觉认知与人类语言理解的空间智能感知能力。

据悉，该系统旨在解决步行导航中的三个主要痛点：起步时方向感模糊、对距离与步行进度缺乏直观感知、到达目的地附近仍无法确认准确终点。通过多模态人机交互、地理语义理解与生成式AI应用，提供更符合人类指路习惯的导航体验。

据了解，该系统基于超亿级POI数据库、高精度步行路网拓扑以及覆盖全国大部分城市及景区的千万级高精街景图像构建。结合千问的多模态能力，系统可识别交通设施、商铺、地标建筑等实体，并评估其视觉显著性，从而生成更符合人类习惯的自然语言描述。为提升指引有效性，该系统采用"双重筛选"机制：一是时空关键节点筛选，仅在起点、转弯、偏航及临近终点等决策点播报；二是显著感知筛选，优先选择更醒目、更易识别的参照物，如地铁标识、银行大牌、餐饮招牌等。

据介绍，高德地图播报文案采用更口语化、具象化的表达，突出颜色、形态与相对位置。实测显示，用户在听到视觉地标提示后，平均比传统导航快2秒确认正确路径，减少看手机频次，进一步降低老人、亲子家庭、游客及注意力易分散人群的步行出行门槛。（朴灿灿）