北京时间3月15日凌晨1点,openai正式推出gpt-4文本生成ai系统。
据悉,gpt-4是新一代多模态大模型,支持图像和文本输入以及正确的文本输出,拥有强大的识图能力,文字输入限制提升至2.5万字,支持多个语言,回答准确性显著提高,从而让新的chatgpt更聪明。此外,gpt-4还开放了角色扮演和性格定制能力。另外,gpt-4版本还会随着时间进行自动更新。
据openai介绍,gpt-4在各种专业学术基准上有着人类水平表现。根据官方实验表明,gpt-4在各种专业测试和学术基准上的表现与人类水平相当。
首先,在美国bar律师执照统考模拟中,gpt-4得分约为前10%——击败了90%人类,而chatgpt背后的gpt-3.5得分约为倒数10%;生物奥林匹克竞赛,gpt-3.5能达到后31%水平分位,gpt-4可达到前1%水平分位;研究生入学考试 、sat数学考试成绩中,也有大幅提升,击败了80%以上的人类答题水平,而医学知识自测考试准确率达75%。
第二个测试是与其他英文机器学习模型的技术能力。研究团队使用微软azure translate,将mmlu 基准——一套涵盖57个主题、14000个多项选择题翻译成多种语言。在测试的英语、拉脱维亚语、威尔士语和斯瓦希里语等26种语言中,有24种语言下,gpt-4优于gpt-3.5 和其他大语言模型的英语语言性能。
华泰证券表示,gpt-4 的核心升级点包括:1)能够处理复杂的长文本,准确性显著提升;2)接受文本和图像的输入;3)风格多样化,创造力强。建议关注应用落地方向包括:1)对话机器人:利用gpt-4 的提升交互能力,如社交与教育应用、直播、游戏等;2)搜索:借助gpt-4 的分析能力,总结生成建议,如导购平台、搜索引擎等;3)办公:引领b 端生产力变革,如营销文本等;4)开放内容创作:如小说创作。
中信证券认为,伴随成本下降以及多模态的持续演进,gpt等大模型有望构筑aigc核心基石,推动ai商业化进程加速和市场天花板打开。建议持续关注相关领域的ai公司:1)应用层;2)基础设施层。
1、chatgpt通过大模型突破ai瓶颈,gpt-4多模态应用带动商业化加速
chatgpt凭借大算力、大规模数据训练、基于人类知识的强化学习等方式突破ai技术瓶颈,获得超预期的用户体验效果与市场反响。回顾gpt系列模型演进,gpt-1结合无监督预训练与有监督微调过程,gpt-2突出零样本设定,gpt-3强调上下文学习能力,参数量、训练数据量不断提升。我们预计即将推出的gpt-4或支持多模态应用,开启通往人工通用智能之路,并有望控制训练成本,降低使用门槛。目前,chatgpt已在c端推出chatgpt plus订阅计划,b端开放chatgpt api,且成本降低为0.002美金/1000token,海外多个应用率先接入。我们预计在gpt-4带动下,未来大模型以及多模态模型的商业化应用将进一步加速,带动行业景气度持续向上。
2、transformer架构支撑gpt走向多模态,构筑aigc领域核心基石
gpt系列模型使用transformer架构,当前基于transformer的多模态研究为ai领域研究热点,transformer已开始打破nlp与cv领域壁垒,有望支撑gpt系列模型走向多模态应用,构筑aigc领域核心能力基石。我们梳理出gpt的潜在基础能力包括文本生成、代码生成、对话交互、机器翻译、图像生成、视频生成等。我们认为,前述基础能力将支撑gpt系列模型在通用与垂直领域的应用,典型应用场景如:通用领域—搜索引擎/办公软件,垂直领域—教育/金融/医疗/图像视频等。
3、通用与垂直场景多点开花,gpt变革内容生成与交互方式
gpt有望革新各行各业的内容生成与交互方式。基于gpt 文本amp;代码amp;对话amp;翻译amp;图像amp;视频,我们看好gpt类技术未来在通用与垂直场景的应用空间。例如,搜索引擎结合gpt将重塑搜索结果呈现方式,多模态的引入带来一站式的文本、图像、视频汇集结果,将大为提升用户信息收集效率。
中金公司机构以下四大环节有望迎来新机遇:
算力方面,chatgpt训练所耗费的算力大约为3640 pf-days,即假设每秒运算一千万亿次,需要连续运行3640天,训练大模型需要强大的算力。人工智能的跨越式发展将成为算力流量消耗的重要驱动力,未来数据中心和相关的配套产业有望实现更好增长。其中,数据中心建设有四大重点方向:
①第三方idc运营环节:宝信软件、数据港、科华恒盛(与腾讯合作)、奥飞数据、美利云、光环新网、铜牛信息等。
②储能温控环节:英维克、佳力图(绑定中国移动)、高澜股份、依米康、申菱环境、朗进科技、科华数据、润泽科技等。
③传输网设备、光纤光缆、光模块等ict环节:光模块领域的新易盛、中际旭创、博创科技;光器件领域的天孚通信、腾景科技、光库科技;光纤光缆领域的中天科技、亨通光电等。
④高性能计算芯片板块:澜起科技、国芯科技、聚辰股份、兆易创新、景嘉微、寒武纪、芯原股份等。
数据标注方面,chatgpt的训练过程加大了人工标注的力度和精度,这代表着在未来的人工智能领域,优质的数据源和强大的标注能力,将成为行业的基础设施。
nlp(自然语言处理)方面,安信证券表示,由于chatgpt主要基于自然语言处理,因此在nlp领域沉淀较多的企业,有望率先实现功能的部分复现,nlp头部厂商将率先受益。
aigc(人工智能生成内容)方面,chatgpt是aigc应用的又一个起点,随着深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,aigc有望加速发展。
本文源自:金融界
作者:大江大河
热门文章