AI幻觉由来已久。而对严谨性要求很高的科研人来说,AI的胡编乱造是个很大的问题。
为什么AI会生成不存在的「假文献」「假链接」?
(对这部分不感兴趣的同学,可直接跳过,进入实操环节)
本质上,无论是推理模型(如,GPT-o系列,DeepSeek R1),还是指令模型(非推理。如,GPT-4、DeepSeek V3),它们在做的都是基于预测概率的next token prediction(「预测下一个词元」)。
简单理解,模型会根据前文预测每个词(更准确地说,是token)的概率,然后基于概率分布采样生成下一个词。哪个词的预测概率高,自然就更容易被采到而成为下一个词。当然,实际情况比这复杂得多。
既然是基于概率的采样,那么胡编乱造就很难避免了。
怎么办?
常用方法一般有两种:
通过提示词提醒模型不要有任何幻觉(如,模型在输出前,严格要求其给出的链接必须真实存在等)。但这种方法只能轻微减轻模型幻觉(并无太大用)。
结合RAG(Retrieval Augmented Generation,检索增强生成),让模型只基于给定文档和提示词进行回答。这种方法可以大大减轻AI幻觉问题。 从具体实践来说,可以用「文献管理工具」+「大模型」来完成。 这里,我们通过在文献管理工具Zotero中接入DeepSeek来完成。 下面开始实操。
实操开始
下载Zotero


下载并安装AI插件
下载插件
为了更好的阅读体验,来飞书看吧:
https://u0e0v3xrqer.feishu.cn/wiki/EUhxw0k6hiBRiak9w38cZK70nDe
Comments on "DeepSeek + Zotero,3步大大减轻AI幻觉问题" :