AIGC(AI Generated Content)即生成式AI,多领域应用逐渐成熟。《从算力、算法、数据及应用看AIGC[PDF]》分别从数据、算力、算法及应用阐述了AIGC未来的巨大潜力。
生成式AI:自然语言处理演变十余年,迎来变现阶段
AIGC涉及无监督和半监督学习算法,截至目前其发展历程主要分为三个阶段:
统计机器学习方法阶段(2010年前)
首先对数据进行手工标注,然后构建其重要特征,最后构建概率模型并进行参数优化,从而将概率最大的输出作为结果;
基于深度学习的神经网络模型(2010年-2017年)
深度学习算法被引入,本质上是通过大量数据训练神经网络,主要表现形式为:CNN(卷积神经网络)、RNN(循环神经网络)等。相比统计学习方法省去了复杂且手工的特征构建;
基于Transformer结构的预训练模型(2017年至今)
利用大量无标注数据进行自监督学习,然后再使用少量的标注数据对下游任务进行微调(即迁移学习)。
数据:大模型训练的基础资源,需求不断扩大
数据是训练大模型的基础资源,以GPT系列模型为例,对比三代模型间使用的数据集,训练所需的数据集在质量和数量方面均不断提升。随着人工智能模型迭代发展高质量数据集的需求将进一步增长。
从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练,必须经过专业化的采集、加工,形成相应的工程化训练数据集后才能供深度学习算法等训练使用。
目前,带有监督学习的算法对于训练数据的需求远大于现有的标注效率和投入预算,基础数据服务将持续释放其对于算法模型的基础支撑价值。
算力:算力需求不断攀升,GPU行业市场巨大
AIGC模型硬件以GPGPU为主,GPU市场规模有望在2030年超过4000亿美元。GPU在并行计算方面具有性能优势,在AI领域分化成两条分支:一条是传统意义的GPU,专门用于图形图像处理用途;另一条是GPGPU作为运算协处理器,增加了专用指令来满足不同领域的计算需求。使用GPGPU在云端进行模型训练算法能够显著缩短海量训练数据的训练时长,减少能源消耗,从而降低人工智能的应用成本,目前全球人工智能相关处理器解决方案仍以GPGPU为主。
英伟达
高算力芯片龙头,AI芯片市场地位领先。人工智能平台需要巨大的数据处理能力,英伟达的A100显卡适合于支持ChatGPT、Bard等工具的机器学习模型,这款芯片能够同时执行众多简单的计算,而这对于训练和使用神经网络模型很重要,使得A100显卡成为目前主流AI芯片。
AMD
高算力芯片代表企业,即将推出世界首款集成数据中心CPU和GPU的APU产品。在2023年的CES上,AMD预览了AI推理加速器AMD Alveo V70,主打高能效,峰值AI算力可达到400TOPS,TDP仅75W。AMD称这是最强AI算力的75W TDP级产品。
算法:OpenAI领跑通用型AI,各大厂商各有千秋
在算法领域,目前通用型AI的领军者是OpenAI,其发布的GPT-4模型是一种多模态语言模型,能接受图像和文本输入,再输出正确的文本回复。相较于ChatGPT基于的GPT-3.5模型,它拥有强大的识图能力,文字输入限制提升,准确性显著提高,风格上也有了变化,例如能够生成歌词和创意文本。
Azure
算力支持,数亿投入始现回报。GPT系列是OpenAI打造的自然语言处理模型,基于文本预训练的GPT-1、GPT-2、GPT-3三代模型都采用以Transformer结构为核心的模型。
OpenAI
正式发布多模态预训练大模型GPT-4,识图能力强大,实现多模态能力。相较前一代GPT-3.5,其主要在两方面实现飞跃式提升:1、具备了强大的识图能力,可以接受图像和文本输入;2、回答准确性显著提高。OpenAI目前已升级ChatGPT,ChatGPT Plus订阅者可以获得具有使用上限的GPT-4 访问权限,开发者则可以通过注册等待以获取GPT-4的API访问权限。
谷歌
发布目前最大视觉语言模型PaLM-E,有望率先落地智能机器人相关产品。PaLM-E是一种多模态视觉语言模型(VLM),具有5620亿个参数,是全球已知的最大视觉语言模型。
产业应用:AIGC市场潜力巨大,落地领域迎来生产力解放
AIGC市场潜力巨大,即将实现多领域应用。根据Tractica的预测数据显示,全球AI软件市场规模将在2025年达到1260亿美元2021年到2025年年复合增长率为41.02%。在大模型的快速迭代推动下,AIGC市场预计将保持高速增长,市场潜力巨大。
【搜索引擎】微软Bing:高质量广告更加符合用户需求
【办公软件】微软Office 365:AI助手解放生产力,办公模式迎来变革
【汽车】通用汽车:与OpenAI达成合作,提升车载助手智能程度
【媒体】Buzzfeed:率先落地AI,互动更加个性化
【设计绘画】Stability AI:AI高效绘图,改变行业工作模式
【游戏】Scenario、网易:生成游戏素材,增强交互体验
【广告营销】Jasper AI:快速创建各类广告内容,降低营销成本
《从算力、算法、数据及应用看AIGC_2023》完整版下载
文章中的软件均来自于互联网,仅供学习参考之用,如涉及版权问题,请及时联系我们删除,谢谢!