ChatGPT来了,中国AI企业迎新一轮发展契机
通过GPT-3训练ChatGPT的过程并不顺利,对话的效果并不理想,因此OpenAI决定将ChatGPT放到“野外”供大众使用。
结果,2022年年底ChatGPT实现了现象级的传播,这出乎制作团队所料。“这绝对令人惊讶。”OpenAI首席技术官米拉·穆拉蒂在接受媒体时说。OpenAI用了5年时间在GPT大模型迭代上完成了一场自我革命,在对话的场景中实现爆发。
“ChatGPT通过一种非常简单的对话方式,构造了非常好的应用场景。”360创始人周鸿祎认为,ChatGPT提供的这些应用场景非常贴近大多数人日常的刚需和痛点,所以它才会火起来,能出圈。
出圈是偶然的,但ChatGPT的成功却并非偶然,“OpenAI在GPT系列模型的基础上,对算法、算力、数据等人工智能关键要素都进行了一定的升级和优化。”中国信通院云计算与大数据研究所人工智能部副主任董晓飞说。
在算法层面,ChatGPT的基础是世界上最强大的LLM之一——GPT-3,同时引入了基于人类反馈的强化学习方法,提高了对话的质量。“从GhatGPT的表现上来看,它的精确性和整个性能效果确实提高了。”董晓飞说。
同时,AI的训练和使用也需要强大的算力支持。ChatGPT的训练是在微软云上进行的,在全球云计算市场,微软云的市场份额排名第二。高水平、高市场份额,再加上芯片技术的高速发展,这都为ChatGPT的横空出世奠定了坚实的算力基础。
除了算法和算力,AI大模型的进步迭代,需要大量的数据进行训练。2020年发布的GPT-3,其训练参数量已经达到了惊人的1750亿个,“大量的数据被反复‘喂’给ChatGPT。”一位目前在北京大学从事人工智能研究的博士生对
而且,ChatGPT的训练成本支出巨大。据LambdaLabs首席科学官Chuanli介绍,拥有1750亿个参数的GPT-3单次训练成本达到460万美元。在知乎上,网友在讨论ChatGPT时,也都认为它很“烧钱”。因此,可以说ChatGPT是一个靠大算力、高成本,用大规模的数据“喂”出来的AI模型。
董晓飞指出,虽然国内外企业在算法研发上基本保持同等水平,但国内更注重大模型技术与行业场景的融合,对于数据标注和模型训练等高成本的人力投入更为谨慎。
“我们真正缺乏的是技术积累,包括数据怎么清洗、标注以及模型的结构设计,怎么训练、推理,这个地方很多都需要经验和积累。”网上一篇爆火的《ChatGPT专家深度解读》这样解释。
搜狐创始人张朝阳在一场直播中说:“ChatGPT的产生是量变到质变的过程,积累了很多年,涉及到算力要有多少服务器,知识库、标注等很多问题,若没有这些能力的公司跟风入局,会消耗掉许多资源。”
热潮已经袭来,有技术基础的企业在强势突围,没有技术基础的企业准备发力,尚待进场。而等热潮退去,能否留在场上,还需看清自己的优势和短板。
ChatGPT是AIGC的一种实现。董晓飞认为,在AIGC的大模型建设和应用层面,国内企业在技术基础和创新环境上都存在着相对优势。
首先,国内持续投入大模型研发、技术基础扎实。目前,阿里达摩院的多模态大模型M6参数量已达10万亿,是全球最大的AI预训练模型;华为盘古、百度文心等大模型的参数量都超过了千亿,其中百度文心模型参数量已经达到2600亿,不逊于GPT-3。“国内有关企业、研究机构近几年在大模型方面已经有了技术积淀。”董晓飞说。
其次,国内加快“产业数字化转型”、实现人工智能与实体经济融合等政策为人工智能提供了创新发展环境。近日,国务院国资委印发《关于做好2023年中央企业投资管理进一步扩大有效投资有关事项的通知》,指出要加大对5G、人工智能、数据中心等新基建投入。近年来,我国发布了一系列政策文件,为人工智能核心技术攻关、产品落地应用以及探索发展新模式新路径提供支持。
把握优势的同时,也要看到目前面临的一些挑战。如AI领军人才相对短缺,AI与实体经济的融合程度仍需进一步加深等等。对此,董晓飞建议,要特别关注一些底层技术的发展,如大模型框架、算法等,还要进一步拓展AI的应用场景。同时他也表示,要进一步提升大众对AI的认知,“这对于AI的发展是有好处的。”
但董晓飞也指出,基于大模型的聊天机器人成本投入巨大,“企业前期投入需保持一定的谨慎,且需要看清方向。”
中国新一代人工智能发展战略研究院发布的《中国新一代人工智能科技产业发展报告》数据显示,中国人工智能企业布局侧重在应用层和技术层。其中,应用层人工智能企业数占比最高,达85.18%;技术层和基础层企业数分别占比12.41%和2.41%。由此可以看出,我国人工智能发展在应用层面有较大优势。
在董晓飞看来,ChatGPT的成功出圈模式为企业提供了大模型、生成式AI、智能对话等技术的商业化应用路径,尤其将助力“生成式AI”通过更多形式实现在更多行业的探索和应用。
“目前来看,国内大模型开发厂商一是布局以大模型为基础的通用对话、生成等能力;二是将其能力整合到引擎、智能客服、智能音箱等产品线中;三是通过能力调用为中小企业满足具体场景落地需求。”董晓飞说。
随着ChatGPT的爆火,随之而来的安全、隐私保护、知识产权等问题也值得关注。“目前国外出现有学生使用ChatGPT写论文作弊的情况。模型使用大量的数据进行训练,也存在使用过程中可能提供他人创作的行为风险。”董晓飞认为,如何防止ChatGPT类产品的滥用对社会产生潜在负面影响亟须得到重视,“更希望我们目前的一些主流企业、科研机构,在生成式AI上发力,能引领新时代的AI发展。”