Artwork

内容由柯柯與肯吉在矽谷提供。所有播客内容(包括剧集、图形和播客描述)均由 柯柯與肯吉在矽谷 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
Player FM -播客应用
使用Player FM应用程序离线!

S2E8 LLM 可解釋性大突破:首次公開 AI 的思考路徑。Llama 4 翻車現場直擊,官方說的和你拿到的不一樣?

28:41
 
分享
 

Manage episode 476859046 series 2630714
内容由柯柯與肯吉在矽谷提供。所有播客内容(包括剧集、图形和播客描述)均由 柯柯與肯吉在矽谷 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

📣 本集感謝《天下雜誌》贊助

想快速掌握每天的財經、科技、管理重點?我最近體驗了《天下每日報》App,覺得超適合像我們這種想吸收高品質內容、但沒時間每天刷一堆新聞的人。

每天 8 則精選新聞+深度解析,幾分鐘就能更新知識。還有仿真人語音可以邊走邊聽,資訊密度很高但吸收很輕鬆。

🎁 4/30 前使用《矽谷輕鬆談》專屬連結免費體驗 60 天(價值 NT$360),還有機會抽 AirPods 4!

👉 https://bit.ly/42cE2Ph

大型語言模型到底會不會「思考」🧠?這次我們終於有機會一探究竟。Anthropic 發表兩篇突破性的研究,透過名為「電路追蹤(Circuit Tracing)」的方法,第一次打開了語言模型的腦袋,讓我們看到 Claude 是如何推理、做決策、甚至提前規劃答案。

這集我們聊聊:

  • 📌 為什麼 LLM 這麼難解釋?

  • 📌 MLP 到底在模型裡做了什麼?

  • 📌 CLT 是怎麼繞過黑盒、還原語意電路?

  • 📌 Claude 真的有「中間想法」還是只是唬人?

  • 📌 未來會不會出現一個完全可控、可理解的 AI?

  • 此外,當然也要來看一下Llama 4 的災難現場——表面 benchmark 飆高,實際上卻連 strawberry 都拼不對?Meta 說的和大家實際拿到的版本真的一樣嗎?ChatBot Arena 上測試的是誰?這場開源大戰背後,又藏了哪些沒說清楚的眉角🧐?

    00:00 開頭

    02:41 Llama 4 發表

    05:42 實測翻車

    09:42 測試版不等於開源版?

    10:50 Meta 為何這麼趕?

    12:27 LLM 可解釋性的困難

    14:05 Claude 的思維過程

    15:20 LLM 有計畫能力

    17:57 技術細節

    20:48 為何 LLM 是黑盒?

    21:25 怎麼打開黑盒?

    23:34 未來會有可解釋的 LLM?

    26:13 結論:今天學到什麼?

    🎧 聽完也歡迎留言告訴我:你覺得語言模型真的「有在思考」嗎?Llama 4 的表現,有讓你失望嗎?

    🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech

      continue reading

    212集单集

    Artwork
    icon分享
     
    Manage episode 476859046 series 2630714
    内容由柯柯與肯吉在矽谷提供。所有播客内容(包括剧集、图形和播客描述)均由 柯柯與肯吉在矽谷 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

    📣 本集感謝《天下雜誌》贊助

    想快速掌握每天的財經、科技、管理重點?我最近體驗了《天下每日報》App,覺得超適合像我們這種想吸收高品質內容、但沒時間每天刷一堆新聞的人。

    每天 8 則精選新聞+深度解析,幾分鐘就能更新知識。還有仿真人語音可以邊走邊聽,資訊密度很高但吸收很輕鬆。

    🎁 4/30 前使用《矽谷輕鬆談》專屬連結免費體驗 60 天(價值 NT$360),還有機會抽 AirPods 4!

    👉 https://bit.ly/42cE2Ph

    大型語言模型到底會不會「思考」🧠?這次我們終於有機會一探究竟。Anthropic 發表兩篇突破性的研究,透過名為「電路追蹤(Circuit Tracing)」的方法,第一次打開了語言模型的腦袋,讓我們看到 Claude 是如何推理、做決策、甚至提前規劃答案。

    這集我們聊聊:

  • 📌 為什麼 LLM 這麼難解釋?

  • 📌 MLP 到底在模型裡做了什麼?

  • 📌 CLT 是怎麼繞過黑盒、還原語意電路?

  • 📌 Claude 真的有「中間想法」還是只是唬人?

  • 📌 未來會不會出現一個完全可控、可理解的 AI?

  • 此外,當然也要來看一下Llama 4 的災難現場——表面 benchmark 飆高,實際上卻連 strawberry 都拼不對?Meta 說的和大家實際拿到的版本真的一樣嗎?ChatBot Arena 上測試的是誰?這場開源大戰背後,又藏了哪些沒說清楚的眉角🧐?

    00:00 開頭

    02:41 Llama 4 發表

    05:42 實測翻車

    09:42 測試版不等於開源版?

    10:50 Meta 為何這麼趕?

    12:27 LLM 可解釋性的困難

    14:05 Claude 的思維過程

    15:20 LLM 有計畫能力

    17:57 技術細節

    20:48 為何 LLM 是黑盒?

    21:25 怎麼打開黑盒?

    23:34 未來會有可解釋的 LLM?

    26:13 結論:今天學到什麼?

    🎧 聽完也歡迎留言告訴我:你覺得語言模型真的「有在思考」嗎?Llama 4 的表現,有讓你失望嗎?

    🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech

      continue reading

    212集单集

    所有剧集

    ×
     
    Loading …

    欢迎使用Player FM

    Player FM正在网上搜索高质量的播客,以便您现在享受。它是最好的播客应用程序,适用于安卓、iPhone和网络。注册以跨设备同步订阅。

     

    快速参考指南

    版权2025 | 隐私政策 | 服务条款 | | 版权
    边探索边听这个节目
    播放