S2E8 LLM 可解釋性大突破：首次公開 AI 的思考路徑。Llama 4 翻車現場直擊，官方說的和你拿到的不一樣？矽谷輕鬆談 Just Kidding Tech podcast

S2E8 LLM 可解釋性大突破：首次公開 AI 的思考路徑。Llama 4 翻車現場直擊，官方說的和你拿到的不一樣？

8M ago 28:41

内容由柯柯與肯吉在矽谷提供。所有播客内容（包括剧集、图形和播客描述）均由柯柯與肯吉在矽谷或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品，您可以按照此处概述的流程进行操作https://zh.player.fm/legal。

📣 本集感謝《天下雜誌》贊助

想快速掌握每天的財經、科技、管理重點？我最近體驗了《天下每日報》App，覺得超適合像我們這種想吸收高品質內容、但沒時間每天刷一堆新聞的人。

每天 8 則精選新聞＋深度解析，幾分鐘就能更新知識。還有仿真人語音可以邊走邊聽，資訊密度很高但吸收很輕鬆。

🎁 4/30 前使用《矽谷輕鬆談》專屬連結免費體驗 60 天（價值 NT$360），還有機會抽 AirPods 4！

👉 https://bit.ly/42cE2Ph

大型語言模型到底會不會「思考」🧠？這次我們終於有機會一探究竟。Anthropic 發表兩篇突破性的研究，透過名為「電路追蹤（Circuit Tracing）」的方法，第一次打開了語言模型的腦袋，讓我們看到 Claude 是如何推理、做決策、甚至提前規劃答案。

這集我們聊聊：

📌 為什麼 LLM 這麼難解釋？

📌 MLP 到底在模型裡做了什麼？

📌 CLT 是怎麼繞過黑盒、還原語意電路？

📌 Claude 真的有「中間想法」還是只是唬人？

📌 未來會不會出現一個完全可控、可理解的 AI？

此外，當然也要來看一下Llama 4 的災難現場——表面 benchmark 飆高，實際上卻連 strawberry 都拼不對？Meta 說的和大家實際拿到的版本真的一樣嗎？ChatBot Arena 上測試的是誰？這場開源大戰背後，又藏了哪些沒說清楚的眉角🧐？

00:00 開頭

02:41 Llama 4 發表

05:42 實測翻車

09:42 測試版不等於開源版？

10:50 Meta 為何這麼趕？

12:27 LLM 可解釋性的困難

14:05 Claude 的思維過程

15:20 LLM 有計畫能力

17:57 技術細節

20:48 為何 LLM 是黑盒？

21:25 怎麼打開黑盒？

23:34 未來會有可解釋的 LLM？

26:13 結論：今天學到什麼？

🎧 聽完也歡迎留言告訴我：你覺得語言模型真的「有在思考」嗎？Llama 4 的表現，有讓你失望嗎？

🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech

212集单集