一、AIGC
AIGC,AI Generated Content,人工智能内容生成。
从技术层面AIGC可分为三个层次:
1. 智能数字内容孪生 【【应用】:图像超分、语音转字幕、文字转语音等。】
2. 智能数字内容编辑 【【应用】:视频场景剪辑、虚拟试衣、人声分离等。】
3. 智能数字内容生成 【【应用】:图像生成(AI绘画)、文本生成(AI写作、ChatBot)、视频生成、多模态生成等。】
从生成内容层面AIGC可分为五个方面:
1. 文本生成
基于NLP的文本内容生成根据使用场景可分为非交互式与交互式文本生成。
【代表性产品或模型】:JasperAI、copy.AI、ChatGPT、Bard、AI dungeon等。
2. 图像生成
【代表性产品或模型】:EditGAN,Deepfake,DALL-E、MidJourney、Stable Diffusion,文心一格等。
3. 音频生成
【代表性产品或模型】:DeepMusic、WaveNet、Deep Voice、MusicAutoBot等。
4. 视频生成
【代表性产品或模型】:Deepfake,videoGPT,Gliacloud、Make-A-Video、Imagen video等。
5. 多模态生成
以上四种模态可以进行组合搭配,进行模态间转换生成。
【代表性产品或模型】:DALL-E、MidJourney、Stable Diffusion等。
二、AIGC发展历程
从PGC到UGC再到AIGC的发展历程
自然语言处理(NLP)赋予了AI理解和生成能力,大规模预训练模型是NLP的发展趋势。
自然语言处理(NLP)的两个核心任务分别是自然语言理解(NLU)和自然语言生成(NLG),ChatGPT是NLP发展中具有里程碑式意义的模型之一
也有说法:
AI 1.0就是电,AI 2.0就是电网。AI 2.0是绝对不能错过的一次革命。
我定义的AI 1.0,是以2015年CNN卷积神经网络模型为核心的计算机视觉技术,拉开AI感知智能时代的序幕,机器开始在计算机视觉、自然语言理解技术等领域超越人类,并创造了显著的价值,开始有机器人、无人驾驶的出现。过去七八年,这一直是很振奋人心的事情。
但是AI 1.0也遇到了瓶颈,大多数行业想利用 AI,需要花费巨大的成本来收集和标注数据,而这些数据集和诸多模型各成“孤岛”缺乏纵效,不能跨领域使用。
AI 2.0 时代的第一个现象级应用是生成式 AI(Generative AI),也就是国内流行的AIGC。
三、 AIGC产业地图
- 产业上游:数据服务
2. 产业中游:算法模型
- 产业下游:应用拓展
四、AIGC的核心技术有哪些?
模型名称 | 提出时间 | 应用场景 |
---|---|---|
1、深度变分自编码(VAE) | 2013年 | 图像生成、语音合成 |
2、生成对抗神经网络(GAN) | 2014年 | 图像生成、语音合成 |
3、扩散模型(Diffusion Model) | 2015年 | 图像生成 |
4、Transformer | 2017年 | 语言模型 |
5、Vision Transformer(ViT) | 2020年 | 视觉模型 |