当前位置: 首页 >> 研究项目 >> 视觉推理 >> 正文

未来事件预测


发表时间:2025-01-08 20:19 点击数:


从视觉中理解并预测未来事件是人类基础认知能力的核心之一。视频中的事件具有动态演变特性(如动作连续性、环境变化、多对象交互),要求模型理解事件因果关系与逻辑链(如“开门”后可能“进入房间”),迫使AI从被动识别转向主动推理,推动其向类人认知水平迈进。针对该问题,本项目提出基于常识知识和因果效应的视频未来事件预测方法,创新性地利用“思维链”技术引导大模型利用自身知识挖掘视频事件序列中的潜在因果关系,推动AI认知能力升级。该方法可用于提前预警潜在冲突或事故、预测患者意外风险及为影视创作提供自动化剧情推演支持等多领域的实施决策,突破视频理解技术瓶颈,提升智能化场景落地的核心能力。