Artwork

内容由迪魔王Devmore提供。所有播客内容(包括剧集、图形和播客描述)均由 迪魔王Devmore 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
Player FM -播客应用
使用Player FM应用程序离线!

美颜后的照片,是不是也算AI在作画?【DevmoreWork#33】

1:07:18
 
分享
 

Manage episode 350437154 series 3291832
内容由迪魔王Devmore提供。所有播客内容(包括剧集、图形和播客描述)均由 迪魔王Devmore 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

# 导读
一直很想学习一下人工智能,奈何范围太大难度太高,策划了很久。AI 的技术虽然很深奥,但是早已经在我们的生活中,尤其是计算机视觉,几乎是我们日常生活中接触到最多的 AI 应用领域,从每个人手机常用的美图秀秀,人脸认证,到近期越来越火的堪比专业设计师的 AI 作画。
本期我们将深入浅出的聊聊 AI 作画和计算机视觉相关的知识,也非常荣幸的邀请到了行业非常资深的东东老师,能把深邃的知识浅显讲给每个人听也是他的本期挑战,一起听听吧~
## 主播
- 五花肉:觉得有美图秀秀还要学化妆干什么的 AI 视觉应用浅度用户。专注开发者生态运营超过八年,涉及前端、中间件、数据库、操作系统等技术栈,在云原生和开源领域有较深运营经历。
- 迪西:速学了一两周并尝试AI作画的程序员。
- 边边:上了又上,返场又返场的迪魔王老朋友,非常热爱学习新鲜事物的模范生。
## 嘉宾
- 东东:“炼丹师”,AI 领域多年程序员,从图像理解到语音理解实践均有涉猎,就职于某大厂,带领视觉认知团队继续硬核探索。
## 时间轴
Part1 -【03:33】关于AI 作画
-【03:50】AI 作画背后的简单原理
-【13:00】为什么要 AI 来作画呢?
-【16:40】AI 生成目前有哪些痛点?
Part2 -【25:42】关于人工智能
-【25:54】人工智能的技术可以分成哪几类
-【28:56】AI 技术就是在模拟人类的感知进行建模
-【31:20】计算机视觉技术在生活中有哪些日常的应用
-【33:55】美颜相机背后的 AI 技术
-【41:00】自动驾驶技术有大量的计算机视觉技术
-【45:55】计算机视觉技术的发展历史
-【53:10】AI 领域产学研人才流动非常快速
-【56:05】想要入门计算机视觉的推荐学习资料


## 延伸阅读
- 【AI】:即人工智能,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的目的就是让机器能够像人一样思考,让机器拥有智能。目前人工智能主要的应用技术方向有:
- 计算机视觉:它是研究如何让计算机“看”的科学。计算机视觉是目前 AI 应用技术中最成熟的技术。计算机视觉研究的主题主要包括图像分类,目标检测、图像分割、目标跟踪、文字识别等。
- 自然语言处理(NLP) :它是利用计算机技术来理解并运用自然语言的学科。自然语言处理研究的主题主要包括机器翻译、文本挖掘和情感分析等。自然语言处理的技术难度高,技术成熟度较低。因为语义的复杂度高,仅靠目前基于大数据、并行计算的深度学习很难达到人类的理解层次。
- 语音处理:它是研究语音发声过程、语音信号的统计特性、语音识别、机器合成以及语音感知等各种处理技术的统称。语音处理研究的主题主要包括语音识别(ASR)、语音合成(TTS)、语音唤醒、声纹识别、音频事件检测等。
- 【DSP】:Digital Signal Processing 即数字信号处理技术,DSP 芯片即指能够实现数字信号处理技术的芯片。DSP芯片、图像处理和模式识别等技术的快速发展,大大地推动了计算机视觉的发展。
- 【深度学习】:是机器学习的分支,是一种以人工神经网络为架构,对资料进行表征学习的算法。深度学习用于教计算机以受人脑启发的方式处理数据。 深度学习模型可以识别图片、文本、声音和其他数据中的复杂模式,从而生成准确的见解和预测。 您可以使用深度学习方法自动执行通常需要人工智能完成的任务,例如描述图像或将声音文件转录为文本。
## 推荐
- AI 作画:
- [DALL·E 2](https://openai.com/dall-e-2/)
- [Stable Diffusion](https://stability.ai/blog/stable-diffusion-public-release)
- [Disco Diffusion](https://github.com/alembics/disco-diffusion)
- 书籍:
- 《视觉》
- 《模式分析》
- 深度学习框架
- [pytorch](https://pytorch.org/)
- [tensorflow](https://www.tensorflow.org/)
- AI 数据集:
- [ImageNet](https://www.image-net.org/)
- 学习资料:
- [paperswithcode](https://paperswithcode.com/)
- [Andrew 的机器学习课程](https://www.coursera.org/specializations/machine-learning-introduction)
## Staff
后期:迪西
运营:潘潘
文档:天猪
## 关于节目
「迪魔王Devmore」围绕开发者生态,为你揭秘生活工作里的技术,我们相信每一位开发者都值得被看见。
[DevmoreWork](https://www.yuque.com/devmore/work),more about work,侧重专业的职场话题,邀请行业专业嘉宾,深度探索职场话题,为大家带来更多专业方向的参考。
[DevmoreLife](https://www.yuque.com/devmore/life),tech in life,是技术生活系列,技术源于生活,又归于生活,该系列跟你聊一聊生活中无处不在的技术。
[MeetDevmore](https://www.yuque.com/devmore/meet),meet with us,新系列!围绕某一个话题,邀请嘉宾和听众们边吃边聊,我们相信,每一个观点都值得被听见。
## 关于我们
比起有意义,有趣的事才会坚持下去呀。这里是迪魔王电台,Devmore。随着开发者生态发展,围绕开发者产生了很多职业,我们想邀请各种种类的朋友们来唠唠嗑,聊聊与开发者相关的有意思的事情,也欢迎投稿你作为开发者或与开发者相关的故事,到【无法成为程序员的我们】公众号。也欢迎在评论区留下你的精彩评论~

  continue reading

71集单集

Artwork
icon分享
 
Manage episode 350437154 series 3291832
内容由迪魔王Devmore提供。所有播客内容(包括剧集、图形和播客描述)均由 迪魔王Devmore 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

# 导读
一直很想学习一下人工智能,奈何范围太大难度太高,策划了很久。AI 的技术虽然很深奥,但是早已经在我们的生活中,尤其是计算机视觉,几乎是我们日常生活中接触到最多的 AI 应用领域,从每个人手机常用的美图秀秀,人脸认证,到近期越来越火的堪比专业设计师的 AI 作画。
本期我们将深入浅出的聊聊 AI 作画和计算机视觉相关的知识,也非常荣幸的邀请到了行业非常资深的东东老师,能把深邃的知识浅显讲给每个人听也是他的本期挑战,一起听听吧~
## 主播
- 五花肉:觉得有美图秀秀还要学化妆干什么的 AI 视觉应用浅度用户。专注开发者生态运营超过八年,涉及前端、中间件、数据库、操作系统等技术栈,在云原生和开源领域有较深运营经历。
- 迪西:速学了一两周并尝试AI作画的程序员。
- 边边:上了又上,返场又返场的迪魔王老朋友,非常热爱学习新鲜事物的模范生。
## 嘉宾
- 东东:“炼丹师”,AI 领域多年程序员,从图像理解到语音理解实践均有涉猎,就职于某大厂,带领视觉认知团队继续硬核探索。
## 时间轴
Part1 -【03:33】关于AI 作画
-【03:50】AI 作画背后的简单原理
-【13:00】为什么要 AI 来作画呢?
-【16:40】AI 生成目前有哪些痛点?
Part2 -【25:42】关于人工智能
-【25:54】人工智能的技术可以分成哪几类
-【28:56】AI 技术就是在模拟人类的感知进行建模
-【31:20】计算机视觉技术在生活中有哪些日常的应用
-【33:55】美颜相机背后的 AI 技术
-【41:00】自动驾驶技术有大量的计算机视觉技术
-【45:55】计算机视觉技术的发展历史
-【53:10】AI 领域产学研人才流动非常快速
-【56:05】想要入门计算机视觉的推荐学习资料


## 延伸阅读
- 【AI】:即人工智能,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的目的就是让机器能够像人一样思考,让机器拥有智能。目前人工智能主要的应用技术方向有:
- 计算机视觉:它是研究如何让计算机“看”的科学。计算机视觉是目前 AI 应用技术中最成熟的技术。计算机视觉研究的主题主要包括图像分类,目标检测、图像分割、目标跟踪、文字识别等。
- 自然语言处理(NLP) :它是利用计算机技术来理解并运用自然语言的学科。自然语言处理研究的主题主要包括机器翻译、文本挖掘和情感分析等。自然语言处理的技术难度高,技术成熟度较低。因为语义的复杂度高,仅靠目前基于大数据、并行计算的深度学习很难达到人类的理解层次。
- 语音处理:它是研究语音发声过程、语音信号的统计特性、语音识别、机器合成以及语音感知等各种处理技术的统称。语音处理研究的主题主要包括语音识别(ASR)、语音合成(TTS)、语音唤醒、声纹识别、音频事件检测等。
- 【DSP】:Digital Signal Processing 即数字信号处理技术,DSP 芯片即指能够实现数字信号处理技术的芯片。DSP芯片、图像处理和模式识别等技术的快速发展,大大地推动了计算机视觉的发展。
- 【深度学习】:是机器学习的分支,是一种以人工神经网络为架构,对资料进行表征学习的算法。深度学习用于教计算机以受人脑启发的方式处理数据。 深度学习模型可以识别图片、文本、声音和其他数据中的复杂模式,从而生成准确的见解和预测。 您可以使用深度学习方法自动执行通常需要人工智能完成的任务,例如描述图像或将声音文件转录为文本。
## 推荐
- AI 作画:
- [DALL·E 2](https://openai.com/dall-e-2/)
- [Stable Diffusion](https://stability.ai/blog/stable-diffusion-public-release)
- [Disco Diffusion](https://github.com/alembics/disco-diffusion)
- 书籍:
- 《视觉》
- 《模式分析》
- 深度学习框架
- [pytorch](https://pytorch.org/)
- [tensorflow](https://www.tensorflow.org/)
- AI 数据集:
- [ImageNet](https://www.image-net.org/)
- 学习资料:
- [paperswithcode](https://paperswithcode.com/)
- [Andrew 的机器学习课程](https://www.coursera.org/specializations/machine-learning-introduction)
## Staff
后期:迪西
运营:潘潘
文档:天猪
## 关于节目
「迪魔王Devmore」围绕开发者生态,为你揭秘生活工作里的技术,我们相信每一位开发者都值得被看见。
[DevmoreWork](https://www.yuque.com/devmore/work),more about work,侧重专业的职场话题,邀请行业专业嘉宾,深度探索职场话题,为大家带来更多专业方向的参考。
[DevmoreLife](https://www.yuque.com/devmore/life),tech in life,是技术生活系列,技术源于生活,又归于生活,该系列跟你聊一聊生活中无处不在的技术。
[MeetDevmore](https://www.yuque.com/devmore/meet),meet with us,新系列!围绕某一个话题,邀请嘉宾和听众们边吃边聊,我们相信,每一个观点都值得被听见。
## 关于我们
比起有意义,有趣的事才会坚持下去呀。这里是迪魔王电台,Devmore。随着开发者生态发展,围绕开发者产生了很多职业,我们想邀请各种种类的朋友们来唠唠嗑,聊聊与开发者相关的有意思的事情,也欢迎投稿你作为开发者或与开发者相关的故事,到【无法成为程序员的我们】公众号。也欢迎在评论区留下你的精彩评论~

  continue reading

71集单集

所有剧集

×
 
Loading …

欢迎使用Player FM

Player FM正在网上搜索高质量的播客,以便您现在享受。它是最好的播客应用程序,适用于安卓、iPhone和网络。注册以跨设备同步订阅。

 

快速参考指南