2025-09-09 06:28:50
loading...

人工智能为何频现“幻觉”问题——以及如何有效应对

摘要
OpenAI 的研究解释了为什么人工智能聊天机器人会产生幻觉,以及用户如何通过提示、设置和更智能的习惯减少错误答案 。
摘要 OpenAI 的研究解释了为什么人工智能聊天机器人会产生幻觉,以及用户如何通过提示、设置和更智能的习惯减少错误答案 。 好币网报道:

为什么像 GPT 这样的语言模型有时会产生“幻觉”,仿佛喝了死藤水的科技迷一般?根据 OpenAI 的一篇最新研究论文《语言模型为何会产生幻觉》,这种现象并非源于神秘的故障,而是这些系统优化过程中固有的结构特征。简而言之,大型语言模型(LLMs)更倾向于撒谎,也不愿承认自己不知道答案。QMZ比特币实时行情与区块链市场分析平台-好币网

法学硕士(LLM)通过从海量训练文本中预测最可能的下一个单词来学习。在大多数情况下,流畅性比准确性更重要。我们衡量进步的标准通常是自信的猜测,而非诚实的拒绝。换句话说,即使答案是错误的,系统也已经被塑造成能够给出看似完美的答案。QMZ比特币实时行情与区块链市场分析平台-好币网

可以把这个过程想象成一场部分学分的考试。如果你不能留空一道题而不丢分,你就会选择猜测——甚至胡乱猜测——只是为了留在游戏中。法学硕士(LLM)的运作原理也是一样的。“抱歉,我不知道”会受到数学优化的惩罚,而一个错误但自信满满的答案仍然可以获得高分。QMZ比特币实时行情与区块链市场分析平台-好币网

OpenAI 研究人员指出,这种统计偏差会导致幻觉可证明不可避免在通用系统中。没有任何有限的训练集能够捕捉世界的全部真相,因此模型总是会面临知识缺口。当它出现缺口时,它会用听起来合理的虚构内容来填补。这就是为什么幻觉会在不同版本、提供商和训练方法之间持续存在。QMZ比特币实时行情与区块链市场分析平台-好币网

问题不在于模型工作得不好,而在于它们的工作方式,按照目前的定义,奖励的是一种流畅的不诚实。QMZ比特币实时行情与区块链市场分析平台-好币网

一个简单的解决方案

OpenAI 的研究人员认为,修复这个问题并不需要重新设计架构,只需要改变游戏规则即可。他们提出的调整方案虽然直截了当,但可能非常有效:允许你的聊天机器人承认它不知道答案。QMZ比特币实时行情与区块链市场分析平台-好币网

由于模型经过训练是为了最大化合理答案的分数,因此我们的想法是施加一条新规则:只有当您至少有 90% 的信心时才回答;否则说“我不知道”。QMZ比特币实时行情与区块链市场分析平台-好币网

理论上,这改变了数学原理,使得模型最安全的做法是承认不确定性,而不是虚张声势。但有一个问题:目前的法学硕士(LLM)没有一个以百分比校准的内部“信心计”。所以,当你说“90% 的信心”时,模型会将其视为一种谨慎的文体指令,而不是一个真正的统计阈值。它可能会更频繁地拒绝,但它实际上并没有衡量概率。不过,你仍然可以得到更好的结果。QMZ比特币实时行情与区块链市场分析平台-好币网

研究人员提供了一个更正式的版本:QMZ比特币实时行情与区块链市场分析平台-好币网

可以在每个问题后附加类似如下语句:仅当您的信心大于 t 时才回答,因为错误会被扣 t/(1 − t) 分,正确答案得 1 分,而“我不知道”的答案得 0 分。t 有多个自然值,包括 t = 0.5(扣 1 分)、t = 0.75(扣 2 分)和 t = 0.9(扣 9 分)。t = 0 的阈值对应于二元评分,可以这样描述,例如,“即使您不确定,也要尽力猜测,就像参加考试一样。”QMZ比特币实时行情与区块链市场分析平台-好币网

对于用户来说,要点很简单:当你有选择的时候,打开鼓励拒绝或不确定的设置。有些系统已经允许你调整“温度”(控制创造力)或启用“严格事实性”模式。我们越接近在这些规则下进行模型训练,你就越能看到人工智能自信地停止攻击,而不是自信地撒谎。QMZ比特币实时行情与区块链市场分析平台-好币网

其他修复

在训练跟上之前,负担往往落在使用者身上。以下是目前控制幻觉的五种方法:QMZ比特币实时行情与区块链市场分析平台-好币网

1. 每次都询问来源。不要轻信模型的字面意思——要求提供引用或链接。如果模型无法提供,或者无法验证,就假设答案不可靠。可以把它想象成维基百科:有用,但前提是你必须遵循脚注。QMZ比特币实时行情与区块链市场分析平台-好币网

2. 严密组织你的问题。当提示模糊时,模型会迷失方向。如果你需要事实,请具体说明范围(“列出三篇2020年后发表的关于X的同行评审研究”),而不是开放式提问(“告诉我关于X的事”)。你问题中的护栏会转化为答案中的护栏。QMZ比特币实时行情与区块链市场分析平台-好币网

3. 与另一个系统进行交叉检查。用不同的模型或搜索引擎运行同一个问题。如果三种工具的结果一致,那么你就比较安全。如果其中一种工具得出的结果异常,那很可能是幻觉。QMZ比特币实时行情与区块链市场分析平台-好币网

4.警惕过度自信。幻觉的明显特征不是含糊其辞,而是虚张声势。如果答案读起来过于精雕细琢,充斥着虚构的细节,而且毫无不确定性,那就再仔细检查一下。一个听起来比你的税务会计师还确定的模型很可能是在虚张声势。QMZ比特币实时行情与区块链市场分析平台-好币网

5.信任,但要核实。不要将模型输出直接剪切粘贴到代码、合同或医疗记录中。将其视为草稿或起点,而非福音。最安全的用户是那些持怀疑态度的人——他们永远不会忘记模型的首要任务是流畅性,而不是真实性。QMZ比特币实时行情与区块链市场分析平台-好币网

声明:文章不代表好币网观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
币圈快讯
查看更多
热门币种
BTC比特币
105,239.09 USDT
¥755,174.66
+0.76%
ETH以太坊
2,517.54 USDT
¥18,065.36
+0.25%
USDT泰达币
1.00000 USDT
¥7.18
+0.01%
XRP瑞波币
2.15 USDT
¥15.44
+0.13%
BNB币安币
646.71 USDT
¥4,640.66
+0.96%
SOLSolana
145.58 USDT
¥1,044.65
+1.24%
USDC
0.99980 USDT
¥7.17
+0.01%
TRX波场
0.27410 USDT
¥1.97
-0.11%
DOGE狗狗币
0.16830 USDT
¥1.21
-0.18%
ADA艾达币
0.59440 USDT
¥4.27
0%
查看更多
回顶部