Artwork

内容由柯柯與肯吉在矽谷提供。所有播客内容(包括剧集、图形和播客描述)均由 柯柯與肯吉在矽谷 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
Player FM -播客应用
使用Player FM应用程序离线!

S2E12 LLM 可解釋性 Part 2:如果我們無法看懂 AI,它會怎麼毀掉我們?

33:01
 
分享
 

Manage episode 482029129 series 2630714
内容由柯柯與肯吉在矽谷提供。所有播客内容(包括剧集、图形和播客描述)均由 柯柯與肯吉在矽谷 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

想像一下,2027 年,一座資料中心裡跑著一群諾貝爾等級的天才。他們可以主導經濟、操縱輿論、影響國家安全——但我們完全搞不懂他們怎麼做出決策。

Anthropic CEO Dario Amodei 最近寫了一篇超硬派文章,直接警告:「如果我們還看不懂 AI 它們在想什麼,人類很可能會被自己創造的東西毀掉。」

但問題來了——他為什麼這麼急?這篇文章真的只是為了拯救世界,還是為了讓 Anthropic 在 AI 安全這局搶下先機?

這集我們聊聊:

📌 可解釋性是什麼?為什麼模型愈強大,黑箱問題愈危險?

📌 稀疏自編碼器 + 自我解釋機制 + 電路追蹤:如何看懂 AI 腦袋裡的「思考路線」?

📌 Anthropic 是怎麼從 OpenAI 出走、組成七人創業團隊,打出安全第一的差異化定位?

📌 Dario 主張出口管制、輕度監管,是真的為了全球安全,還是想幫自己圍一條護城河?

📌 如果 2027 年真的出現「國家級天才 AI」,我們真的準備好了嗎?

00:00 開頭

04:11 Anthropic 的創立故事

07:46 Claude 原本可以在 ChatGPT 之前問世

09:20 「一年後 AI 會寫全部程式碼」

11:43 工程師的黃金年代結束了?

15:24 AI 是種出來的,不是蓋出來的

17:53 AI 的最大風險?

21:11 解鎖 AI 腦袋:近幾年技術的重大突破

25:55 2027 會有諾貝爾獎等級 AI?

29:17 可解釋性背後的戰略布局

🎧 如果你也覺得「看懂 AI 的思考」不只是技術問題,而是影響整個社會安全的關鍵,歡迎留言告訴我你的看法。

🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech⁠

  continue reading

212集单集

Artwork
icon分享
 
Manage episode 482029129 series 2630714
内容由柯柯與肯吉在矽谷提供。所有播客内容(包括剧集、图形和播客描述)均由 柯柯與肯吉在矽谷 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

想像一下,2027 年,一座資料中心裡跑著一群諾貝爾等級的天才。他們可以主導經濟、操縱輿論、影響國家安全——但我們完全搞不懂他們怎麼做出決策。

Anthropic CEO Dario Amodei 最近寫了一篇超硬派文章,直接警告:「如果我們還看不懂 AI 它們在想什麼,人類很可能會被自己創造的東西毀掉。」

但問題來了——他為什麼這麼急?這篇文章真的只是為了拯救世界,還是為了讓 Anthropic 在 AI 安全這局搶下先機?

這集我們聊聊:

📌 可解釋性是什麼?為什麼模型愈強大,黑箱問題愈危險?

📌 稀疏自編碼器 + 自我解釋機制 + 電路追蹤:如何看懂 AI 腦袋裡的「思考路線」?

📌 Anthropic 是怎麼從 OpenAI 出走、組成七人創業團隊,打出安全第一的差異化定位?

📌 Dario 主張出口管制、輕度監管,是真的為了全球安全,還是想幫自己圍一條護城河?

📌 如果 2027 年真的出現「國家級天才 AI」,我們真的準備好了嗎?

00:00 開頭

04:11 Anthropic 的創立故事

07:46 Claude 原本可以在 ChatGPT 之前問世

09:20 「一年後 AI 會寫全部程式碼」

11:43 工程師的黃金年代結束了?

15:24 AI 是種出來的,不是蓋出來的

17:53 AI 的最大風險?

21:11 解鎖 AI 腦袋:近幾年技術的重大突破

25:55 2027 會有諾貝爾獎等級 AI?

29:17 可解釋性背後的戰略布局

🎧 如果你也覺得「看懂 AI 的思考」不只是技術問題,而是影響整個社會安全的關鍵,歡迎留言告訴我你的看法。

🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech⁠

  continue reading

212集单集

所有剧集

×
 
Loading …

欢迎使用Player FM

Player FM正在网上搜索高质量的播客,以便您现在享受。它是最好的播客应用程序,适用于安卓、iPhone和网络。注册以跨设备同步订阅。

 

快速参考指南

版权2025 | 隐私政策 | 服务条款 | | 版权
边探索边听这个节目
播放