AI搜刮东西表示堪忧：六成谜底不精确却仍然自傲-沃源能源科技有限公司

AI搜刮东西表示堪忧：六成谜底不精确却仍然自傲

点击数：发布时间：2025-04-21 23:15 作者：沃源能来源：经济日报

　　虽然 ChatGPTSearch正在200个旧事查询中供给了回应，但其“完全准确”率仅为28%，而“完全错误”率高达57%，表示欠安却不至于排垫底，反而是X公司旗下的GrokAI系列严沉失误，特别是Grok-3Search，错误率竟达94%。而微软的Copilot则愈加“不给力”，200次查询中，有104次回覆，准确率也不外16%，总的错误率接近70%。虽然这些AI搜刮东西的表示问题频出，各大公司仍然向用户收取昂扬的月度订阅费，更令人惊讶的是，虽然付费版PerplexityPro和Grok-3Search的回覆次数添加，其错误率似乎也水涨船高。这一现象无疑让用户对这些AI搜刮东西的性价比发生了质疑。

　　测试成果不尽如人意，除了Perplexity及其付费版本外，其他AI搜刮引擎的表示均令人失望。全体表示中，竟然高达60%的谜底是不精确的。更令人担心的是，这些AI东西正在供给错误消息时表示得极其“自傲”，常常以无可置疑的口气陈述谜底，即便面临质疑，它们仍然试图用逻辑自洽来捍卫本身的说法。这不只显露了AI搜刮引擎正在精确性上的缺陷，也激发了业界对于狂言语模子靠得住性的深刻反思。

　　比来，哥伦比亚大学数字旧事研究核心发布了一项惹人注目的研究演讲，聚焦于市道上八款支流的AI搜刮东西，包罗ChatGPTSearch、Perplexity系列、Gemini、DeepSeekSearch、Grok-2Search、Grok-3Search以及Copilot。研究团队对这八款东西进行了深度测试，旨正在评估它们的精确性取靠得住性。为确保样本的权势巨子性，研究人员从20家业界出名的旧事机构中挑选了200篇报道，确保它们正在谷歌搜刮成果中的排名靠前，随后操纵同一的查询语句对这些AI东西一一进行了查核。

郑重声明：沃源能信息技术有限公司网站刊登/转载此文出于传递更多信息之目的，并不意味着赞同其观点或论证其描述。沃源能信息技术有限公司不负责其真实性。

分享到：

上一篇：Block公司开源AI智能体框架Goose

下一篇：搜狐简单AI：一款改变用户创做体例的免费AI东西

AI搜刮东西表示堪忧：六成谜底不精确却仍然自傲

点击数： 发布时间：2025-04-21 23:15 作者：沃源能 来源：经济日报

点击数：发布时间：2025-04-21 23:15 作者：沃源能来源：经济日报