“ 全景透视:揭秘AIGC技术的进化之路 ”
前言
随着人工智能技术的突飞猛进,内容创作方式的发生了革命性的转变从早期专业人员主导的内容生产,到现如今生成式人工智AIGC能创作时代本篇文章主要讲解AIGC技术的演变历程。
一、内容创作发展历程
1PGC时代Professional Generated Content专业人员生成内容,早期互联网时代的内容创作主要有媒体机构的专业人员编辑发布,如新浪、网易等门户网站。 2UGC时代User Generated Content用户生成内容,用户成为主流内容创作者,普通用户都可以参与创建和分享,包括微信、微博、今日头条、抖音等平台。 3AIGC时代Artificial Intelligence Generated Content人工智能生成内容,人工智能开始参与内容创作通过机器学习和自然语言处理技术,AI能够自动生成新闻、文章、图片等。
二、AIGC底层原理
ChatGPT底层到底是怎么理解人类语言的呢? 向量化 1)数字化把现实问题转换为数学问题计算机将现实世界的内容文章或者图片全部转化为0101这样的二进制进行存储 2)向量化对于计算机来讲,他只是把文章和图片存起来了,但是文章里面讲的啥,或者图片里面画的啥,他是不知道的?无无法理解的 将单词或者图片拆解为多维度向量数字之后,使得计算机可以通过数学计算的方式推算2个单词的距离,从而发现他们的关联关系 比如当两个单词的向量值,计算的距离越近,相似度越高
三、AIGC之谷歌word2vec算法
2013年google开发了word2vec计算法,主要将单词转换为向量,而这些向量在向量空间中的位置能够反映单词之间的相似性,从而使得计算机能够更好地理解和处理自然语言。变成向量后,就可以从数学角度,进行计算2个单词的向量之间的距离
四、AIGC之Transformer算法模型的出现
1传统神经网络算法
1)卷积神经网络算法CNN主攻图片处理 2)循环神经网络RNN主攻自然语言 3)卷积循环神经网络CRNN主攻音视频
2Transformer算法模型
Transformer对比传统模型的优越性 自注意力机制每个词向量都会关注输入序列中的其他词,以捕捉它们之间的关系。这允许模型建立上下文表示,其中每个词都包含有关整个输入序列的信息,可以捕获长距离关系,传统的循环神经网络算法,只能捕获短距离相近的序列中的词的依赖关系。 并行化处理由于Transformer不依赖于前一个时间步的输出来生成当前时间步的输出,它可以在整个输入序列上进行并行化的计算,提高了处理长序列数据的速度和效率。 全局上下文Transformer的自注意力机制允许模型直接获取整个输入序列的上下文信息。这使得它在处理复杂的语言模式和长距离依赖时更为高效 核心概念 自注意力Self-Attention(能够在不同位置不获取全局信息,以便模型更好的理解句子的语义和结构模型在处理一长段序列数据时,可以关注检查到序列中的所有位置的其他元素不需要像循环神经网络那样进行循环处理,即可对每一个输入元素一个词向量与其他元素进行交互,加权计算的到一个输出的向量即找他们之间的关联干系。 多头注意力由多个自注意力组成。它包含多个自注意力机制的头Head,每个头关注序列的不同部分。多头注意力机制将Query、Key和Value分割成多份,每个头分别处理一份,然后再将结果合并
五、AIGC之Transformer算法模型演进
BERT模型
公司Google 训练方式自编码 预测目标给定上下文,预测缺失的单词 输入处理双向学习同时考虑一个词的左右两个上下文 架构基于Transformer的编码器 语言模型判别式 优点对上下文理解力强 适用场景擅长完形填空、有助于信息提取,适合问答系统,情感分析等
GPT 模型
公司OpenAI 训练方式自回归 预测目标给定前面的单词,预测下一个单词 输入处理单向学习从左到右或者从右到左 架构基于Transformer的解码器 语言模型生成式 优点预测连贯性比较强 适用场景擅长词语接龙、预测下一个单词适合文章、创作、生成式任务
六、AIGC之ChatGPT模型现世
OpenAI对GPT进行微调,专攻自然语言方向,投入了大量的对话数据进行训练,优化加强了大模型的语言回复能力。增加了训练层数、向量维度、训练数据当参数达到一定量的时候超过1000亿,让GPT产生了“智能”,ChatGPT 出现了 GPT12018年,引入了预训练加微调 GPT22019年,加大的训练规模,提出了无监督多任务学习 GPT32020年,进一步加大训练规模,引入了少量样本学习能力 GPT42022年,多模态模型图像的输入理解,各方面性能提升、扩展了上下文窗口
结束语
ChatGPT的问世是内容创作领域的一场划时代变革,它代表了人工智能技术演进至一个新的里程碑,标志着智能内容生成AIGC技术的兴起,目前AIGC已经成为创作内容中不可或缺的工具。它不仅极大地丰富了用户的内容体验,而且正逐步重塑各行各业的工作流程。
标签:
AIGC推荐阅读
每日一言
"<!doctype html> <html lang="Zh-cn"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <meta name="robots" content="noindex,nofollow"> <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no"/> <meta name="renderer" content="webkit"> <title>您请求的文件不存在!</title> <link type="text/css" rel="stylesheet" href="https://www.oick.cn/css/404.css" /> <link rel="shortcut icon" href="http://www.oick.cn/favicon.ico" type="image/x-icon" /> </head> <body> <div id="wrap"> <div> <img src="https://www.oick.cn/imgs/404.png" alt="404" /> </div> <div id="text"> <strong> <span></span> <a href="javascript:history.back()">返回上一页</a> </strong> </div> </div> <div class="animate below"></div> <div class="animate above"></div> </body> </html>"