我们实验室正在设计一套分布式环境下验证 AI 推理结果真实性的机制,覆盖文本、图片、视频、音频四种模态。协议设计已完成,现在需要一位懂大模型推理底层的合作者,通过真实 GPU 实验验证这套机制是否成立 核心交付不是脚本,是判断 你需要帮我们回答的问题 一、文本(LLM) teacher forcing 重放验证在什么条件下成立?跨硬件(4090 vs A100)的 logits 漂移有多大?