人工智能:努力成为值得信赖的“未来顾问”




你能想象到的“预测技术”什么样儿?当通用大模型的基础能力、专用预测模型的精准特性、外部工具的实用价值和可信机制的保障作用有机融合,人工智能那双洞察未来的智能新慧眼,将在金融风控、气象预报、公共治理、工业生产等关键领域,成为人类值得信赖的“未来顾问”,为人类社会把握未来走向提供智慧支撑,成为赋能社会发展、服务国家治理现代化的重要力量。
“预测未来”的四条技术路径
面对现实世界中日益复杂的预测需求,科研人员围绕大模型预测技术,走出了两大核心主线、四种具体技术路径。这些路径并非相互取代的“竞争对手”,而是在不同场景下各展所长、互为补充,共同构筑起大模型预测的完整研究框架。
两大核心主线的本质区别,在于是否为预测任务量身打造专属模型:一条是“借船出海”,巧用现有成熟大语言模型完成预测;一条是“造船远航”,重构面向预测的专用基础模型,两条路径齐头并进,适配着千差万别的任务需求。
直接调用大语言模型,是大模型预测最易落地的“入门捷径”。科研人员将各类预测任务转化为通俗的自然语言问题,把历史信息、事件背景和约束条件等悉数交由模型,让其直接研判未来趋势、输出预测结果。这种方式实现门槛低,无需对模型做大幅改造,只是给现成的工具换个用法,便可在新闻事件分析、商业趋势判断等开放世界问题中表现亮眼。但美中不足的是,受限于大语言模型本身数值计算能力的短板、事实输出易出现偏差的问题,它终究难以满足气象、金融等领域对高精度数值预测的严苛要求。
时间序列词元化建模,则是跨领域的“智慧借鉴”。它将自然语言处理的经典思路巧妙引入时序数据分析,通过离散化、缩放、量化等技术手段,把连续的时间序列数据,转化为类似语言中单词的词元表示,再用类语言模型的架构开展训练。代表模型Chronos就通过将时间序列映射到固定词表,实现了概率预测和跨数据集泛化,能直接复用成熟的语言模型架构,大幅降低研发成本。但这份便捷也伴随着代价,数据转化过程中难免造成数值细节的损失和量化误差,如同给精细的零件做了一次粗略的打磨,会影响预测的精准度。
构建专用时间序列基础模型,标志着大模型预测研究从“借势而行”走向自主创新。科研人员不再将时间序列简单视作伪文本,而是围绕时序数据的本质规律和预测任务的核心需求,量身设计预训练方案和模型架构。谷歌开发的TimesFM采用解码器架构,展现出强大的零样本预测能力;由美国多个大学和科研机构开发的Lag-Llama深耕细作,聚焦概率预测与跨领域泛化;美国人工智能企业开发的Moirai大胆尝试,用统一训练方式适配更多场景。这类模型如同为预测任务量身定制的“专属铠甲”,更贴合预测任务本身的特性,能实现更高精度的数值预测,成为高精度预测场景的不二之选。
大语言模型重编程与多模态融合,为大模型预测提供了低成本的思考。Time-LLM的相关研究证实,无需重新训练动辄千亿参数的超大时序模型,只需通过重编程让时间序列与文本原型精准对齐,就能让“冻结”的大语言模型参与到预测任务中。这一方式为通用大模型+专用适配的技术路线,打通了可行的通道,更推动了文本、数值、上下文知识的深度联合建模,让预测能像人类思考一样,综合融合多源异构信息,更贴合现实世界中复杂多变的预测场景需求。
这四条技术路径没有绝对的优劣之分,它们如同不同的钥匙,适配着不同的锁芯。当预测任务需要结合通用知识、文本背景进行开放化趋势判断时,大语言模型相关路线如同万能钥匙,更具优势;当任务追求高精度数值输出、稳定的跨领域泛化能力时,专用时间序列基础模型则成为精准匹配的定制钥匙。它们在不同的研发资源条件、不同的实际任务需求下相互支撑、彼此成就,共同推动大模型预测技术稳步向前。
走向真实应用场景
在大模型预测技术的研究赛道上,国际研究起步更早,技术体系更趋系统,在基础研究和前沿探索方面走得更深、更远;国内研究虽起步稍晚,却凭借着强劲的爆发力迎头赶上,在场景适配、开源生态和应用落地方面形成了独树一帜的优势。
国际学界的大模型预测研究,经历了从文本推理到多元预测的精彩拓展。早期研究主要聚焦于把大语言模型用于文本推理和事件发展判断,如同在一片小天地里精耕细作;近两年则逐步突破边界,扩展到时间序列、时空数据乃至科学预测等更广泛的领域,开启了“开疆拓土”的新阶段。在更复杂的科学预测领域,微软研发的ClimaX率先搭建起天气和气候任务的基础模型框架,同为微软研发的Aurora更是将基础模型思想延伸至地球系统,能同时处理天气、空气质量、海浪等多类预测任务,如同为地球装上了智能预警系统,展现出科学基础模型在复杂系统预测中的巨大潜力。
尤为可贵的是,国际学界始终对大模型的预测能力保持着理性审慎的态度。相关研究发现,大模型在标准化测试中的优异表现,并不等同于在真实世界未来事件判断中的可靠性——GPT-4在开放世界预测竞赛中,其概率预测表现就曾弱于中位数人类群体预测。围绕这一核心问题,国际科研人员相继开展竞赛研究、检索增强研究、不确定性检测研究,让国际研究形成了“模型能力提升+预测结果验证+可信机制构建”三者并重的鲜明特点,为技术的落地应用筑牢了坚实的根基。
国内研究则依托通用大模型的快速发展,实现了漂亮的后发赶超,逐步形成了通用大模型快速迭代、综述研究系统展开、应用落地稳步推进的良性发展格局。在通用模型生态建设的赛场上,各家选手各显神通:千问3在多语种支持、推理效率优化上形成了完整体系,如同打造了一座多语言的智能桥梁;DeepSeek-V3实现了高性能开源模型的技术突破,让核心技术不再高高在上;文心4.5则在多模态融合和工程化部署上持续精进,不断贴近实际应用需求。这些通用大模型虽非以预测为唯一研发目标,却为国内大模型预测研究搭建起坚实的能力底座,让科研人员能站在“巨人”的肩膀上,开展更具针对性的研究。
在应用落地层面,国内正积极探索让大模型预测技术走出“象牙塔”,走向千行百业的真实应用场景。有研究将专家知识与大语言模型深度融合,用于战略征候预警,在复杂情境中精准实现趋势判断和风险识别;也有研究将大模型与气象监测数据紧密结合,尝试提升短期降水预测的精度和时效性。这类研究虽不完全等同于纯数值的时间序列预测,却标志着国内大模型预测技术正从理论讨论走向场景落地,开始探索符合本土需求、贴合行业实际的技术路径。
总体而言,国外在预测专用基础模型研发、科学预测等基础研究方面挖掘更深,如同在地下开凿出了四通八达的隧道,形成了较为完善的技术体系;国内则在中文场景适配、低成本开源生态构建和行业应用落地方面更具特色,如同在地面上搭建起了贴合本土的高楼大厦。随着国内高质量时序数据、行业专属数据的不断积累,以及专用评测体系的逐步完善,面向预测任务的国产基础模型未来仍有巨大的提升空间,也必将为全球大模型预测技术的发展,贡献独特而珍贵的中国智慧。
“从强大到可信”仍须跨越“鸿沟”
相较传统预测方法,大模型预测技术实现了从“单点计算”到“综合研判”的深层次蜕变,让原本冰冷机械的计算工具,进化为能理解背景、权衡因素、给出理性判断的智能体。这份独特能力源于其与生俱来的核心优势,却也如同成长中的新星,正朝着“从强大到可信”稳步进化,努力成为值得人类信赖的“未来顾问”。
大模型预测技术的核心优势,是与生俱来的天赋异禀,在实际应用中尤为突出。其一,跨任务迁移能力强。传统农业产量预测模型无法直接用于股市走势分析,换领域便要推倒重来;而大模型凭借大规模预训练的通用表示能力,能在少样本下快速适配农业、金融、工业等不同领域,一通百通。其二,处理复杂依赖关系的潜力大。像汛期河流水位预测,受降雨、上游泄洪、地形等多重因素影响,传统模型难以捕捉复杂关联,而时间序列基础模型能在上下文范围内学习规律,如同拥有“火眼金睛”,看清数据背后的联系。其三,多源信息融合能力优。传统气象预测仅依赖数值监测数据,而大模型能融合卫星云图、气象文本播报、地理信息等多源内容,让预测从“管中窥豹”变为“全景观察”。其四,预测解释与决策支持能力佳。它不仅能预测某只股票的涨跌趋势,还能阐释背后的行业政策、市场供需等影响因素,甚至给出风控建议,成为决策者的专业智能伙伴。
尽管优势显著,大模型预测技术却并非完美无缺,从实验室到真实应用场景,仍有一道亟待跨越的“鸿沟”。首先,模型的生成、推理能力不等同于实际预测能力。有些模型在模拟的气象预测测试中表现优异,却在实际的强对流天气预警中屡屡“失灵”,只因测试答案藏在训练数据中,而真实预测需要对未发生事件做综合研判,纸上谈兵易,“真刀真枪”难。其次,检索增强治标不治本。为模型搭配信息检索后,预测准确率虽有提升,却也说明模型仅靠自身记忆的知识,如同守着旧书库,难以跟上现实的变化,实时获取最新知识才是关键。再者,幻觉与事实不稳定是核心障碍,如同隐藏的定时炸弹。此外,成本、数据与评价体系的制约,让大规模应用举步维艰。训练高精度模型需要海量计算资源,研发成本居高不下;现实中时序数据碎片化、标注不统一,劣质原料怎么造出精品?而现有评价体系重数值误差、轻事实稳定性,让不少模型看似优秀,却难以落地。
展望未来,大模型预测技术的发展方向清晰明确,核心围绕“从强大到可信”,打造能稳定服务现实决策的成熟技术体系。其一,通用大模型向预测专用基础模型演进,在气象、金融等高精度需求场景,专用模型展现更强竞争力。其二,工具增强成为重要方向,让模型自主调用搜索、仿真等外部工具,如同为智能体装上百宝箱,以更好应对复杂场景。其三,可信、可控、可解释成为研究重点,未来的预测系统不仅要数值精准,更要能量化风险、追溯判断依据,这是高风险场景落地的关键。其四,低成本部署和产业化落地加速,随着推理成本下降、开源生态完善,技术将从少数机构的专属资产,变为各行业的通用工具。其五,国内研究深耕本土化适配,结合中文语境、本土数据打造专属模型,让大模型在国内金融风控、政务预警等场景中更准、更稳、更可信。
(作者:吕本富、徐中涛,分别系中国科学院大学经管学院教授,中国科学院大学经管学院博士生)