AI聊天机器人越聊越“笨”？可能真不是错觉_焦点观察-亚洲资本网

亚洲资本网 > 资讯 > 民生 > 正文

AI聊天机器人越聊越“笨”？可能真不是错觉_焦点观察

2026-02-22 12:09:11来源： 科技美学

不知道大家有没有这种感觉：和AI机器人短时间聊天的话还行，时间一长，就感觉对话开始变的前言不搭后语、逻辑不通。

其实这种感觉并不是错觉。

(资料图片仅供参考)

最近，微软发表的一项研究证实，即使是目前最先进的大语言模型，在多轮对话中的可靠性也会急剧下降。

研究人员对包括 GPT-4.1、Gemini 2.5 Pro、Claude 3.7 Sonnet、o3、DeepSeek R1 和 Llama 4 在内的 15 款顶尖模型进行了超过 20 万次模拟对话分析，揭示出一个被称为“迷失会话”的系统性缺陷。

数据显示，这些模型在单次提示任务中的成功率可达 90%，但当同样的任务被拆解成多轮自然对话后，成功率骤降至约 65%。

研究指出，模型的核心能力仅降低约 15%，但“不可靠性”却飙升 112%。

也就是说，AI 大模型仍然具备解决问题的能力，但在多轮对话中变得高度不稳定，难以持续跟踪上下文。

研究人员进一步分析了造成性能下降的行为机制。

首先是“过早生成”。模型在用户尚未完整说明需求前就尝试给出最终答案。一旦在早期回合中形成错误假设，模型后续便会在该错误的基础上继续推理，而不是随着新信息的加入进行修正，从而导致错误逐步放大。

其次是“答案膨胀”。在多轮对话中，模型的回复长度比单轮对话增加了 20% 至 300%。更长的回答往往包含更多假设与“幻觉”，这些内容随后被纳入对话的持续上下文，从而进一步影响后续推理的准确性。

令人意外的是，即使是配备了额外“思考词元”（thinking tokens）的新一代推理模型，如 OpenAI o3 和 DeepSeek R1，也未能显著改善在多轮对话中的表现。

研究人员指出，现有的基准测试主要基于理想的单轮场景，忽略了模型在真实世界中的行为。

因此，对于那些依赖 AI 构建复杂对话流程或智能体的开发者而言，这一结论意味着未来将要接受严峻挑战。

再来看看其他消息。

微软日前测试 Windows 11新版“画图”（Paint）应用，重点引入“自由旋转”功能。

根据微软官方描述，用户现在可以全方位角度调整形状、文本框以及任何活动的图像选区。用户选中对象后，其上方会出现一个“旋转手柄”，用户只需拖动该手柄即可向任意方向自由旋转对象，从而实现更自然的构图和布局。

除了直观的手动拖拽，微软还为需要高精度编辑的用户提供了解决方案。在“旋转”菜单下新增了“自定义旋转”选项，用户可以在此输入具体的角度数值，实现精确到 1 度的微调。

关键词：用户机器人错觉单轮 DeepSeek 错误

相关新闻

热文：喝牛奶时做一个小改变，血脂降了、血糖稳了、肠道好了→

热文：喝牛奶时做一个小改变，血脂降了、血糖稳了、肠道好了→

关于草铵膦板块龙头，相关上市公司名单快收藏（2026/2/20）

关于草铵膦板块龙头，相关上市公司名单快收藏（2026/2/20）

专题资讯

热点资讯

2026春节档票房破46亿元-当前焦点

2026春节档票房破46亿元-当前焦点

焦点热议:科创板水利概念股股票一览,代码查询

焦点热议:科创板水利概念股股票一览,代码查询

前沿热点:春节返程高峰来临全国铁路今天预计发送旅客1680万人次长三角预计295万人次

前沿热点:春节返程高峰来临全国铁路今天预计发送旅客1680万人次长三角预计295万人次

贵阳铁路进入节后客流高峰期

贵阳铁路进入节后客流高峰期

2026年跨境电商上市公司龙头一览（附名单）（2月20日）_每日短讯

2026年跨境电商上市公司龙头一览（附名单）（2月20日）_每日短讯

美股太空概念股盘前走强，火箭实验室涨近1%

美股太空概念股盘前走强，火箭实验室涨近1%

微资讯！港股异动｜港股机器人概念普涨越疆、禾赛-W等个股表现活跃

微资讯！港股异动｜港股机器人概念普涨越疆、禾赛-W等个股表现活跃

2026年春节档票房已突破25亿元

2026年春节档票房已突破25亿元

观察：记者：王燊超肋骨骨折，目前还在静养康复阶段

观察：记者：王燊超肋骨骨折，目前还在静养康复阶段

十大数据中心排行榜-2026年2月18日相关股票成交额前十名

十大数据中心排行榜-2026年2月18日相关股票成交额前十名

大家都在看

最近更新

AI聊天机器人越聊越“笨”？可能真不是错觉_焦点观察

阿里云Coding Plan支持千问3.5、GLM-4.7、Kimi-K2.5等模型

截至2025年底我国80%以上粗钢产能实现超低排放

70余万人到北京市属公园“寻味”新春

新春走基层丨来“成语之都”邯郸过个文化中国年每日速递

2026年度电影总票房破70亿最资讯

热点评！台胞在大陆怎么过年？跟着记者在福州沉浸式体验

台胞在大陆怎么过年？跟着记者在福州沉浸式体验_观速讯

速讯：2026年度电影总票房破70亿

2026年丁辛醇2只概念龙头股，看看有你关注的吗？（2/20）

实时：一分钟了解衣柜行业龙头：有2家！（2026/2/20）

游客青海自驾被野牦牛拦路6小时，当地民警深夜驰援精选

华工科技：公司联接业务订单已经排到2026年第四季度，AI高速光模块产线24小时满负荷运转

2026春节档票房破46亿元-当前焦点

假期第七天湖南客流2274.5万人次多家景区发布限流提醒

安顺古城五天迎客上百万观热点

每日热点:降门槛、扩范围新一轮设备更新已陆续启动

每日讯息!今天全国高速公路车流量超7100万辆次

春节返京高峰探访火车站，你的行李箱里都装着什么？

铁路春运迎来返程客流高峰 21日约74万人乘火车抵京

友情链接

新闻发布平台 |科极网 |环球周刊网 |中国创投网 |教体产业网 |中国商界网 |万能百科 |薄荷网 |资讯_时尚网 |连州财经网 |剧情啦 |5元服装包邮 |中华网河南 |网购省钱平台 |海淘返利 |太平洋装修网 |励普网校 |九十三度白茶网 |商标注册 |专利申请 |启哈号 |速挖投诉平台 |深度财经网 |深圳热线 |财报网 |财报网 |财报网 |咕噜财经 |太原热线 |电路维修 |防水补漏 |水管维修 |墙面翻修 |旧房维修 |参考经济网 |中原网视台 |财经产业网 |全球经济网 |消费导报网 |外贸网 |重播网 |国际财经网 |星岛中文网 |手机测评 |品牌推广 |名律网 |项目大全 |整形资讯 |整形新闻 |美丽网 |佳人网 |税法网 |法务网 |法律服务 |法律咨询 |成报网 |媒体采购网 |聚焦网 |参考网 |热点网

亚洲资本网版权所有

京ICP备2021034106号-51

Copyright © 2011-2020 亚洲资本网 All Rights Reserved. 联系网站：55 16 53 8 @qq.com