Artwork

内容由Joe Carlsmith提供。所有播客内容(包括剧集、图形和播客描述)均由 Joe Carlsmith 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
Player FM -播客应用
使用Player FM应用程序离线!

A taxonomy of non-schemer models (Section 1.2 of "Scheming AIs")

11:20
 
分享
 

Manage episode 385189426 series 3402048
内容由Joe Carlsmith提供。所有播客内容(包括剧集、图形和播客描述)均由 Joe Carlsmith 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
  continue reading

章节

1. A taxonomy of non-schemer models (Section 1.2 of "Scheming AIs") (00:00:00)

2. 1.2 Other models training might produce (00:00:36)

3. 1.2.1 Terminal training-gamers (or, “reward-on-the-episode seekers”) (00:01:15)

4. 1.2.2 Models that aren’t playing the training game (00:04:12)

5. 1.2.2.1 Training saints (00:04:50)

6. 1.2.2.2 Misgeneralized non-training-gamers (00:06:17)

7. 1.2.3 Contra “internal” vs. “corrigible” alignment (00:09:22)

8. 1.2.4 The overall taxonomy (00:10:15)

63集单集

Artwork
icon分享
 
Manage episode 385189426 series 3402048
内容由Joe Carlsmith提供。所有播客内容(包括剧集、图形和播客描述)均由 Joe Carlsmith 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
  continue reading

章节

1. A taxonomy of non-schemer models (Section 1.2 of "Scheming AIs") (00:00:00)

2. 1.2 Other models training might produce (00:00:36)

3. 1.2.1 Terminal training-gamers (or, “reward-on-the-episode seekers”) (00:01:15)

4. 1.2.2 Models that aren’t playing the training game (00:04:12)

5. 1.2.2.1 Training saints (00:04:50)

6. 1.2.2.2 Misgeneralized non-training-gamers (00:06:17)

7. 1.2.3 Contra “internal” vs. “corrigible” alignment (00:09:22)

8. 1.2.4 The overall taxonomy (00:10:15)

63集单集

所有剧集

×
 
Loading …

欢迎使用Player FM

Player FM正在网上搜索高质量的播客,以便您现在享受。它是最好的播客应用程序,适用于安卓、iPhone和网络。注册以跨设备同步订阅。

 

快速参考指南

边探索边听这个节目
播放