Anthropic开源神经网络追踪工具,可生成归因图
IT之家 6 月 2 日消息,Anthropic 公司现已正式开源了其新一代的神经网络追踪(Circuit Tracing)工具,旨在帮助研究人员深入解析大模型的内部推理机制。
据悉,该工具可生成一系列“归因图(Attribution Graphs)”以展示 AI 模型处理提示词的具体过程,便于开发者进一步观察、微调模型。
此外,Anthropic 还与 Decode Research 团队合作推出了 Neuronpedia 前端平台,用户可以在网页上直接与相应归因图进行互动。平台还提供了“示例笔记本”,展示如 Gemma-2-2b 和 Llama-3.2-1b 等模型的内部运作方式,鼓励用户尝试各种提示词,比较不同模型的具体行为。
Anthropic 公司首席执行官 Dario Amodei 指出,大模型的“可解释性”已成为业界共同关注的课题,这套神经网络追踪工具将促进社区参与度,有助于开发者加快对大模型行为逻辑的理解。
相关阅读:
- 2025-08-26 11:36:00 快手成了百度最大的对手
- 2025-08-23 08:06:00 大学生开发者同台竞技!vivo将在东莞举办AIGC创新赛决赛
- 2025-08-16 09:54:00 炮轰微软裹挟用户后,LibreOffice发布ODF迁移指南
- 2025-07-26 21:31:00 智元发布“灵渠OS”开源计划
- 2025-07-14 09:25:00 浙大发布高精准基因组设计AI模型
- 2025-07-01 17:57:00 巨头混战Agent,押注背后是真未来还是新泡沫?