首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    中华读书报 2023年12月13日 星期三

    随着新一代信息技术加速融入千行百业,无处不在的算力正在成为激活数据要素潜能,驱动数字经济发展的新引擎。可以预见,算力未来也会像水、电一样“触手可及”,搭乘“AI大模型”快车,必将激发我国数字经济新动能,驱动数字经济跑出加速度。

    算力已成为数字经济发展的新引擎

    史爱武 杨凯 《 中华读书报 》( 2023年12月13日   18 版)

        今年,自ChatGPT掀起生成式AI的风暴以来,算力行业经历了各种火爆场面。国内互联网大厂、科研院所和高校纷纷拥抱大模型,国内更是出现了“百模大战”的盛况,算力需求大幅飙升。大模型训练所需算力是非线性增长的,随着大模型参数不断升级,算力需求将呈指数增长。一时之间,世界各国纷纷出现了“算力慌”“一卡难求”的现象,这种境况可能还将持续很长一段时间。

        此外,数字技术发展应用和各级政策出台也在积极推动算力需求上涨。随着5G、工业互联网、人工智能、云计算等新技术的发展及其在各行各业数字化转型的创新应用,算力需求进一步加大。10月,工信部等六部门印发《算力基础设施高质量发展行动计划》中提出,到2025年,计算力方面,算力规模超过300EFLOPS(FLOPS是每秒浮点数运算次数,1EFLOPS=FLOPS),智能算力占比达到35%。应用赋能方面,打造一批算力新业务、新模式、新业态,工业、金融等领域算力渗透率显著提升,医疗、交通等领域应用实现规模化复制推广,能源、教育等领域应用范围进一步扩大。从加快构建智能算力基础设施入手,增加算力规模就是为数字经济发展建设一条“高速公路”,有助于推动数字经济更快、更高质量发展。

        算力的分类

        2018年诺贝尔经济学奖获得者Wil⁃liam D.Nordhaus在《计算过程》一文中提出,算力就是设备根据内部状态的改变,每秒可处理的信息数据量。行业里通常将CPU、GPU等芯片技术及能力称为算力。芯片已经成为算力的代名词,算力其实就是芯片的计算能力。常用的算力计量单位FLOPS是每秒执行的浮点数运算次数,算力数值越大代表综合计算能力越强。

        算力服务于社会各行各业,而社会各领域应用对算力需求是存在差异的。网购、追剧、打车、即时通讯聊天等消费领域,传统制造、物流交通、金融保险、教育医疗等行业领域,智慧城市、城市一卡通、城市大脑等城市治理领域,不同领域应用的数据和算法对算力的特性有不同的要求,需要不同类型的算力。

        因此,算力通常划分为通用算力、智能算力和超算算力三大类。通用算力主要是基于CPU芯片的服务器所提供面向基础通用计算的计算能力;智能算力主要是基于GPU、FPGA、ASIC等芯片的加速计算平台(服务器)提供面向人工智能训练和推理的计算能力;超算算力主要是基于超级计算机等高性能计算集群所提供面向科学工程的计算能力。

        通用算力以CPU输出的计算能力为主,通常采用单精度浮点数(FP32)计算能力来衡量。CPU内部有指令集,按指令集架构的不同,CPU可分为x86架构与非x86架构。x86架构是英特尔(Intel)公司首先开发并长期主导的,具有比较好的生态,市场占有率也比较高。非x86架构的芯片类型比较多,主要有ARM、PowerPC、SPARC、MIPS等,特别是广泛应用于消费类电子产品的ARM芯片,这些年市场占有率不断提升。

        智能算力是以GPU(图形处理器)、FP⁃GA(现场可编程门阵列)、ASIC(专用集成电路)芯片等输出的计算能力为主,通常采用半精度浮点数(FP16)计算能力来衡量。特别是GPU,目前行业内可以说是炙手可热,一卡难求。

        超算算力则是以超级计算机输出的计算能力为主,通常采用双精度浮点数(FP64)计算能力来衡量。它利用并行工作的多台计算机系统构成计算资源集群,通过专用的操作系统来处理极其复杂的计算密集型或数据密集型问题,价格极为昂贵但性能也较为强劲,主要应用于尖端科研、国防军工等高精尖领域。

        依据算力类型的不同,数据中心也分为通用数据中心、智算中心和超算中心。日常使用的互联网服务来自于通用数据中心;智算中心是专门进行智能计算(人工智能、大模型训练等)的数据中心;超算中心是由一些承担各种大规模科学计算和工程计算任务的超级计算机构成的数据中心。

        AI大模型催生巨大算力需求

        ChatGPT为代表的大模型预示着强人工智能的里程碑,正掀起新一轮智能化热潮。目前大模型已达到的能力大致可分为助手型与专家型两类。大模型在文档编

        写、客户服务、图形图像设计等领域可以担任虚拟助手,辅助人类完成重复性、劳动密集型的工作,提升工作效率。另外,通过大量领域数据训练的大模型已经可以在特定领域担任专家角色,提供智能咨询和决策支持。未来,大模型要实现单体到群体、理性到感性的智能飞跃,仍需要解决许多技术难题,其中最关键的就是计算基础设施对大模型提供的算力支撑。

        大模型的训练和推理都是建立在巨大的参数量和运算量之上,对算力提出了极高要求。例如,GPT-3模型训练使用了128台英伟达A100服务器(训练34天),对应640P算力(1E=1000P,据测算,1E约为5台天河二号超级计算机或25万台主流双路服务器或200万台主流笔记本的算力输出),GPT-4模型训练使用了3125台英伟达A100服务器(训练90-100天),对应15625P算力。从GPT-3至GPT-4模型参数规模增加约10倍,但用于训练的GPU数量增加了近24倍(且不考虑模型训练时间的增长)。随着模型参数规模大幅增长,大模型训练所需的算力更是指数激增。

        随着ChatGPT带来的大模型热潮需要大量计算资源进行训练和推理,市场上对算力需求也面临爆发式增长。中国信通院数据显示,中国算力规模特别是智能算力规模不断提升。截至2023年6月底,中国算力规模达到197EFLOPS,其中通用算力规模占比达74%,智能算力规模占比达25%,智能算力规模同比增加60%。据有关数据预测,2023年AI服务器(集成GPU、FPGA、ASIC等芯片)出货量近120万台,年增长率38.4%;AI服务器占整体服务器的出货量有望从2023年近9%提升至2026年15%,年复合增长率达22%。

        算力是人工智能产业创新的基础,大模型的持续创新应用驱动算力需求爆炸式增长。可以说,大模型训练的效率和创新速度实际上取决于算力大小。

        10月25日,国家数据局正式挂牌,标志着数据管理与治理获得重要进展。据中

        国信通院预测,2035年全球数据量将达到2142ZB,是2020年的45倍至46倍。庞大数据量的背后是日益高涨的算力需求。数据显示,我国算力总规模达到197EFLOPS,位居全球第二,算力总规模近5年年均增速近30%。算力正加速向政务、工业、交通、医疗等各行业各领域渗透。根据《2022-2023中国人工智能计算力发展评估报告》预计,2026年中国智能算力规模将达到1271.4EFLOPS,2021年至2026年的年复合增长率达到52.3%。

        随着数字经济时代全面开启,丰富的智能化应用场景促使数字经济创新对算力的需求规模更大,增长更快,算力一跃成为新的关键生产力。根据中国信通院测算,算力每投入1元,将带动3至4元的GDP经济增长。IDC联合浪潮信息、清华大学全球产业研究院发布的《2022—2023全球计算力指数评估报告》提出,尽管全球GDP增长普遍放缓,但数字经济保持强劲增长,算力是经济增长的主要驱动力。算力指数平均每提高一个点,就会带动国家数字经济和GDP分别增长3.5‰和1.8‰。这表明,算力指数的提高对于推动数字经济的快速发展至关重要。所以,算力已经成为数字经济发展的新引擎,加快算力基础设施建设,将有力推进数字技术给各行各业数字化转型赋能升级,推动数字经济与实体经济深度融合,同时也创造新的社会和经济价值。

        数字经济时代已经到来。算力就像农耕时代的水力、工业时代的电力一样,已成为数字经济时代的关键生产力,是全社会数字化、智能化转型的重要基础。拥有更多的算力,就意味着拥有更多的财富。如今,生成式人工智能、元宇宙、数字孪生、无人驾驶、智慧城市、智慧交通、生命医学、气候预测……各个领域都离不开算力支撑。算力的深入广泛应用不断催生新技术、新模式、新业态。随着新一代信息技术加速融入千行百业,无处不在的算力正在成为激活数据要素潜能,驱动数字经济发展的新引擎。可以预见,算力未来也会像水、电一样“触手可及”,搭乘“AI大模型”快车,必将激发我国数字经济新动能,驱动数字经济跑出加速度。

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有