Meta新模型Dualformer：融合快慢思维，推理能力媲美人脑

发表于 2024-10-17 更新于 2024-12-10 阅读次数：

Meta的FAIR团队推出Dualformer模型，模仿人类双重认知系统，实现快慢推理模式切换，提升推理效率和计算性能。在迷宫导航等任务中表现卓越，成功率高，推理步骤减少，为高效AI系统设计提供新思路。

【重要】推荐使用 Wildcard虚拟信用卡订阅GPT、Sora等服务，价格更便宜、卡片有效期更长、支持的服务更多，具体教程请查看：Wildcard教程

其他精选文章

类别	教程
Claude	如何解决Claude账号被封，及Claude3使用方法、【重要】如何注册Claude3？
Sora	【保姆级】体验Sora模型的官方途径、【精华】4000字搞懂sora！
ChatGPT	【包教包会】国内ChatGPT账号注册教程、【绝对管用】教你一键注册官方GPT账号！
Midjourney	【推荐】midjourney注册方式
Poe	【保姆级】Poe订阅问题看这一篇就够了
Suno	【推荐】Suno用法和订阅一文详解！
其他	【一看就会】Overleaf升级保姆级教程、【保姆级】如何订阅Youtube Premium？、更多精彩

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型，该模型模仿人类的双重认知系统，能够无缝整合快速和慢速推理模式，在推理能力和计算效率上取得了显著突破。

人类的思维过程通常被认为是由两种系统控制的:系统1快速直观，系统2则更慢但更具逻辑性。

传统的 Transformer 模型通常只模拟了系统1或系统2中的一种，导致模型要么速度快但推理能力差，要么推理能力强但速度慢且计算成本高。

Dualformer 的创新之处在于其训练方式。研究人员利用随机推理轨迹对模型进行训练，在训练过程中随机丢弃轨迹的不同部分，类似于分析人类思维过程并创建捷径。这种训练策略使 Dualformer 能够在推理时灵活切换不同的模式:

快速模式: Dualformer 只输出最终解决方案，速度极快。

慢速模式: Dualformer 会输出完整的推理链和最终解决方案，推理能力更强。

自动模式: Dualformer 可以根据任务的复杂程度自动选择合适的模式。

实验结果表明，Dualformer 在迷宫导航和数学问题求解等任务上表现出色。在慢速模式下，Dualformer 能够以97.6% 的成功率解决30x30的迷宫导航任务，超越了只使用完整推理轨迹训练的 Searchformer 模型，同时推理步骤减少了45.5%。

在快速模式下，Dualformer 的成功率也高达80%，远高于只使用最终解决方案训练的 Solution-Only 模型。在自动模式下，Dualformer 则能够在保持高成功率的同时，显著减少推理步骤。

Dualformer 的成功表明，将人类认知理论应用于人工智能模型设计能够有效提升模型的性能。这种融合快慢思维的模式为构建更强大、更高效的 AI 系统提供了新的思路。

参考文章：Meta新模型Dualformer：融合快慢思维，推理能力媲美人脑 | 进击的胖虎

亲爱的读者你好！我是进击的胖虎。欢迎扫描二维码关注我们的公众号（最新文章都在公众号里），我将带你从零基础出发，逐步掌握各种AI工具的操作技巧，并为你解读最新的热点新闻！