我们专注于智慧政务、智能安全综合管理、商业智能、云服务、大数据
当前位置 :沃源能 > ai动态 >

AI搜刮东西表示堪忧:六成谜底不精确却仍然自傲

点击数: 发布时间:2025-04-21 23:15 作者:沃源能 来源:经济日报

  

  虽然 ChatGPTSearch正在200个旧事查询中供给了回应,但其“完全准确”率仅为28%,而“完全错误”率高达57%,表示欠安却不至于排垫底,反而是X公司旗下的GrokAI系列严沉失误,特别是Grok-3Search,错误率竟达94%。而微软的Copilot则愈加“不给力”,200次查询中,有104次回覆,准确率也不外16%,总的错误率接近70%。虽然这些AI搜刮东西的表示问题频出,各大公司仍然向用户收取昂扬的月度订阅费,更令人惊讶的是,虽然付费版PerplexityPro和Grok-3Search的回覆次数添加,其错误率似乎也水涨船高。这一现象无疑让用户对这些AI搜刮东西的性价比发生了质疑。

  测试成果不尽如人意,除了Perplexity及其付费版本外,其他AI搜刮引擎的表示均令人失望。全体表示中,竟然高达60%的谜底是不精确的。更令人担心的是,这些AI东西正在供给错误消息时表示得极其“自傲”,常常以无可置疑的口气陈述谜底,即便面临质疑,它们仍然试图用逻辑自洽来捍卫本身的说法。这不只显露了AI搜刮引擎正在精确性上的缺陷,也激发了业界对于狂言语模子靠得住性的深刻反思。

  比来,哥伦比亚大学数字旧事研究核心发布了一项惹人注目的研究演讲,聚焦于市道上八款支流的AI搜刮东西,包罗ChatGPTSearch、Perplexity系列、Gemini、DeepSeekSearch、Grok-2Search、Grok-3Search以及Copilot。研究团队对这八款东西进行了深度测试,旨正在评估它们的精确性取靠得住性。为确保样本的权势巨子性,研究人员从20家业界出名的旧事机构中挑选了200篇报道,确保它们正在谷歌搜刮成果中的排名靠前,随后操纵同一的查询语句对这些AI东西一一进行了查核。

郑重声明:沃源能信息技术有限公司网站刊登/转载此文出于传递更多信息之目的 ,并不意味着赞同其观点或论证其描述。沃源能信息技术有限公司不负责其真实性 。

分享到: