DeepSeek的B面:幻觉、隐私与“幽灵特征”
作者|林飞雪编辑|胡展嘉运营|陈佳慧头图|DeepSeek官微出品|零态LT(ID:LingTai_LT)在中国AI领域的激烈角逐中,DeepSeek凭借其令人震惊的性价比和卓越性能,迅速占领了市场,成为一颗新星。
作者|林飞雪编辑|胡展嘉运营|陈佳慧头图|DeepSeek官微出品|零态LT(ID:LingTai_LT)在中国AI领域的激烈角逐中,DeepSeek凭借其令人震惊的性价比和卓越性能,迅速占领了市场,成为一颗新星。
划重点:- Galileo Lab 的新指标可以帮助改进生成 AI 的准确性,检测 AI 幻觉问题。- OpenAI GPT-4在基本问答任务中有大约23% 的幻觉倾向,其他模型则更差,达到60%。- Galileo Labs 开发的新指标包括正确性和上下文一致性,可以帮助企业在其 AI 实现中测试
“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用
如何准确评估和解决大语言模型中的幻觉问题已成为一个至关重要的挑战。近日,复旦大学与上海人工智能实验室构建了针对中文大模型的幻觉评测数据集HalluQA,对业界主流的大模型进行了评估。 HalluQA采用无幻觉率来评估大模型的优劣。无幻觉率越高代表模型幻觉越低,事实准确性越高。
人工智能经常受到批评,因为它会编造看似事实的信息,即幻觉。这些似是而非的虚假信息不仅扰乱了聊天机器人会话,还曾引发诉讼和医疗事故。2023 年,谷歌推出的 AI 聊天机器人所发布的虚假声明一度导致该公司市值下跌约 1000 亿美元。然而,在科学领域,科学家发现人工智能幻觉非常有价值。
阿里巴巴达摩院(湖畔实验室)、新加坡南洋理工大学等联合提出了大模型知识链(CoK)框架。该框架可实时检索异构知识源并逐步纠正推理错误,进一步提高大模型问答知识型问题的准确率,降低幻觉现象。在通用知识、
今晨4点,GPT-4.5突然上线。2月27日消息,钛媒体AGI获悉,美国OpenAI公司今天推出GPT-4.5模型(代号Orion),这是该公司有史以来算力和数据规模最大、最佳的 AI 基座模型,本周将面向每月200美元的ChatGPT Pro用户开放,下周向ChatGPT Plus开放。GPT-4
11月21日消息,在2024世界互联网大会乌镇峰会期间,360集团创始人周鸿祎就百度创始人李彦宏在百度世界大会上关于“大模型已基本解决幻觉问题”的言论,表达了自己的不同看法。周鸿祎首先对李彦宏表示了尊重,但随后指出,幻觉是大模型的一种固有特性,而非缺点。他认为,幻觉对于大模型的智能性至关重要,正如《
还在用指令微调解决多模态大模型的“幻觉”问题吗?比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。现在,中科大的一项研究想到了一个全新办法:一个免重训、即插即用的通用架构,直接从模型给出的错误文本下手,“倒推”出可能出现“幻觉”之处,然后与图片确定事实,最终直接完成修正。他们将这个方法命名
作者|路世明编辑|大 风Manus的出现,激起了科技与资本市场的双重震荡,一时间AI Agent相关概念股集体大涨,阿里、谷歌、微软等科技巨头密集发布智能体研发计划......而在这场热潮的背后,是AI技术从“被动应答”向“主动执行”的范式跃迁。