人工智能:努力成为值得信赖的“未来顾问”

作者：吕本富徐中涛《光明日报》（2026年05月07日 16版）

　　你能想象到的“预测技术”什么样儿？当通用大模型的基础能力、专用预测模型的精准特性、外部工具的实用价值和可信机制的保障作用有机融合，人工智能那双洞察未来的智能新慧眼，将在金融风控、气象预报、公共治理、工业生产等关键领域，成为人类值得信赖的“未来顾问”，为人类社会把握未来走向提供智慧支撑，成为赋能社会发展、服务国家治理现代化的重要力量。

“预测未来”的四条技术路径

　　面对现实世界中日益复杂的预测需求，科研人员围绕大模型预测技术，走出了两大核心主线、四种具体技术路径。这些路径并非相互取代的“竞争对手”，而是在不同场景下各展所长、互为补充，共同构筑起大模型预测的完整研究框架。

　　两大核心主线的本质区别，在于是否为预测任务量身打造专属模型：一条是“借船出海”，巧用现有成熟大语言模型完成预测；一条是“造船远航”，重构面向预测的专用基础模型，两条路径齐头并进，适配着千差万别的任务需求。

　　直接调用大语言模型，是大模型预测最易落地的“入门捷径”。科研人员将各类预测任务转化为通俗的自然语言问题，把历史信息、事件背景和约束条件等悉数交由模型，让其直接研判未来趋势、输出预测结果。这种方式实现门槛低，无需对模型做大幅改造，只是给现成的工具换个用法，便可在新闻事件分析、商业趋势判断等开放世界问题中表现亮眼。但美中不足的是，受限于大语言模型本身数值计算能力的短板、事实输出易出现偏差的问题，它终究难以满足气象、金融等领域对高精度数值预测的严苛要求。

　　时间序列词元化建模，则是跨领域的“智慧借鉴”。它将自然语言处理的经典思路巧妙引入时序数据分析，通过离散化、缩放、量化等技术手段，把连续的时间序列数据，转化为类似语言中单词的词元表示，再用类语言模型的架构开展训练。代表模型Chronos就通过将时间序列映射到固定词表，实现了概率预测和跨数据集泛化，能直接复用成熟的语言模型架构，大幅降低研发成本。但这份便捷也伴随着代价，数据转化过程中难免造成数值细节的损失和量化误差，如同给精细的零件做了一次粗略的打磨，会影响预测的精准度。

　　构建专用时间序列基础模型，标志着大模型预测研究从“借势而行”走向自主创新。科研人员不再将时间序列简单视作伪文本，而是围绕时序数据的本质规律和预测任务的核心需求，量身设计预训练方案和模型架构。谷歌开发的TimesFM采用解码器架构，展现出强大的零样本预测能力；由美国多个大学和科研机构开发的Lag-Llama深耕细作，聚焦概率预测与跨领域泛化；美国人工智能企业开发的Moirai大胆尝试，用统一训练方式适配更多场景。这类模型如同为预测任务量身定制的“专属铠甲”，更贴合预测任务本身的特性，能实现更高精度的数值预测，成为高精度预测场景的不二之选。

　　大语言模型重编程与多模态融合，为大模型预测提供了低成本的思考。Time-LLM的相关研究证实，无需重新训练动辄千亿参数的超大时序模型，只需通过重编程让时间序列与文本原型精准对齐，就能让“冻结”的大语言模型参与到预测任务中。这一方式为通用大模型+专用适配的技术路线，打通了可行的通道，更推动了文本、数值、上下文知识的深度联合建模，让预测能像人类思考一样，综合融合多源异构信息，更贴合现实世界中复杂多变的预测场景需求。

　　这四条技术路径没有绝对的优劣之分，它们如同不同的钥匙，适配着不同的锁芯。当预测任务需要结合通用知识、文本背景进行开放化趋势判断时，大语言模型相关路线如同万能钥匙，更具优势；当任务追求高精度数值输出、稳定的跨领域泛化能力时，专用时间序列基础模型则成为精准匹配的定制钥匙。它们在不同的研发资源条件、不同的实际任务需求下相互支撑、彼此成就，共同推动大模型预测技术稳步向前。

走向真实应用场景

　　在大模型预测技术的研究赛道上，国际研究起步更早，技术体系更趋系统，在基础研究和前沿探索方面走得更深、更远；国内研究虽起步稍晚，却凭借着强劲的爆发力迎头赶上，在场景适配、开源生态和应用落地方面形成了独树一帜的优势。

　　国际学界的大模型预测研究，经历了从文本推理到多元预测的精彩拓展。早期研究主要聚焦于把大语言模型用于文本推理和事件发展判断，如同在一片小天地里精耕细作；近两年则逐步突破边界，扩展到时间序列、时空数据乃至科学预测等更广泛的领域，开启了“开疆拓土”的新阶段。在更复杂的科学预测领域，微软研发的ClimaX率先搭建起天气和气候任务的基础模型框架，同为微软研发的Aurora更是将基础模型思想延伸至地球系统，能同时处理天气、空气质量、海浪等多类预测任务，如同为地球装上了智能预警系统，展现出科学基础模型在复杂系统预测中的巨大潜力。

　　尤为可贵的是，国际学界始终对大模型的预测能力保持着理性审慎的态度。相关研究发现，大模型在标准化测试中的优异表现，并不等同于在真实世界未来事件判断中的可靠性——GPT-4在开放世界预测竞赛中，其概率预测表现就曾弱于中位数人类群体预测。围绕这一核心问题，国际科研人员相继开展竞赛研究、检索增强研究、不确定性检测研究，让国际研究形成了“模型能力提升+预测结果验证+可信机制构建”三者并重的鲜明特点，为技术的落地应用筑牢了坚实的根基。

　　国内研究则依托通用大模型的快速发展，实现了漂亮的后发赶超，逐步形成了通用大模型快速迭代、综述研究系统展开、应用落地稳步推进的良性发展格局。在通用模型生态建设的赛场上，各家选手各显神通：千问3在多语种支持、推理效率优化上形成了完整体系，如同打造了一座多语言的智能桥梁；DeepSeek-V3实现了高性能开源模型的技术突破，让核心技术不再高高在上；文心4.5则在多模态融合和工程化部署上持续精进，不断贴近实际应用需求。这些通用大模型虽非以预测为唯一研发目标，却为国内大模型预测研究搭建起坚实的能力底座，让科研人员能站在“巨人”的肩膀上，开展更具针对性的研究。

　　在应用落地层面，国内正积极探索让大模型预测技术走出“象牙塔”，走向千行百业的真实应用场景。有研究将专家知识与大语言模型深度融合，用于战略征候预警，在复杂情境中精准实现趋势判断和风险识别；也有研究将大模型与气象监测数据紧密结合，尝试提升短期降水预测的精度和时效性。这类研究虽不完全等同于纯数值的时间序列预测，却标志着国内大模型预测技术正从理论讨论走向场景落地，开始探索符合本土需求、贴合行业实际的技术路径。

　　总体而言，国外在预测专用基础模型研发、科学预测等基础研究方面挖掘更深，如同在地下开凿出了四通八达的隧道，形成了较为完善的技术体系；国内则在中文场景适配、低成本开源生态构建和行业应用落地方面更具特色，如同在地面上搭建起了贴合本土的高楼大厦。随着国内高质量时序数据、行业专属数据的不断积累，以及专用评测体系的逐步完善，面向预测任务的国产基础模型未来仍有巨大的提升空间，也必将为全球大模型预测技术的发展，贡献独特而珍贵的中国智慧。

“从强大到可信”仍须跨越“鸿沟”

　　相较传统预测方法，大模型预测技术实现了从“单点计算”到“综合研判”的深层次蜕变，让原本冰冷机械的计算工具，进化为能理解背景、权衡因素、给出理性判断的智能体。这份独特能力源于其与生俱来的核心优势，却也如同成长中的新星，正朝着“从强大到可信”稳步进化，努力成为值得人类信赖的“未来顾问”。

　　大模型预测技术的核心优势，是与生俱来的天赋异禀，在实际应用中尤为突出。其一，跨任务迁移能力强。传统农业产量预测模型无法直接用于股市走势分析，换领域便要推倒重来；而大模型凭借大规模预训练的通用表示能力，能在少样本下快速适配农业、金融、工业等不同领域，一通百通。其二，处理复杂依赖关系的潜力大。像汛期河流水位预测，受降雨、上游泄洪、地形等多重因素影响，传统模型难以捕捉复杂关联，而时间序列基础模型能在上下文范围内学习规律，如同拥有“火眼金睛”，看清数据背后的联系。其三，多源信息融合能力优。传统气象预测仅依赖数值监测数据，而大模型能融合卫星云图、气象文本播报、地理信息等多源内容，让预测从“管中窥豹”变为“全景观察”。其四，预测解释与决策支持能力佳。它不仅能预测某只股票的涨跌趋势，还能阐释背后的行业政策、市场供需等影响因素，甚至给出风控建议，成为决策者的专业智能伙伴。

　　尽管优势显著，大模型预测技术却并非完美无缺，从实验室到真实应用场景，仍有一道亟待跨越的“鸿沟”。首先，模型的生成、推理能力不等同于实际预测能力。有些模型在模拟的气象预测测试中表现优异，却在实际的强对流天气预警中屡屡“失灵”，只因测试答案藏在训练数据中，而真实预测需要对未发生事件做综合研判，纸上谈兵易，“真刀真枪”难。其次，检索增强治标不治本。为模型搭配信息检索后，预测准确率虽有提升，却也说明模型仅靠自身记忆的知识，如同守着旧书库，难以跟上现实的变化，实时获取最新知识才是关键。再者，幻觉与事实不稳定是核心障碍，如同隐藏的定时炸弹。此外，成本、数据与评价体系的制约，让大规模应用举步维艰。训练高精度模型需要海量计算资源，研发成本居高不下；现实中时序数据碎片化、标注不统一，劣质原料怎么造出精品？而现有评价体系重数值误差、轻事实稳定性，让不少模型看似优秀，却难以落地。

　　展望未来，大模型预测技术的发展方向清晰明确，核心围绕“从强大到可信”，打造能稳定服务现实决策的成熟技术体系。其一，通用大模型向预测专用基础模型演进，在气象、金融等高精度需求场景，专用模型展现更强竞争力。其二，工具增强成为重要方向，让模型自主调用搜索、仿真等外部工具，如同为智能体装上百宝箱，以更好应对复杂场景。其三，可信、可控、可解释成为研究重点，未来的预测系统不仅要数值精准，更要能量化风险、追溯判断依据，这是高风险场景落地的关键。其四，低成本部署和产业化落地加速，随着推理成本下降、开源生态完善，技术将从少数机构的专属资产，变为各行业的通用工具。其五，国内研究深耕本土化适配，结合中文语境、本土数据打造专属模型，让大模型在国内金融风控、政务预警等场景中更准、更稳、更可信。

　　（作者：吕本富、徐中涛，分别系中国科学院大学经管学院教授，中国科学院大学经管学院博士生）