OmniTools 6月8日消息,小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed 模型,首次在单台标准 8-GPGPU 节点上实现 1 万亿参数 MoE 模型超 1000 tokens/s 的推理输出速度,无需依赖 Cerebras 或 Groq 等专用硬件方案。
该模型提供限时免费聊天体验,UltraSpeed API 定价为普通版本的 3 倍,实测输出体验提升约 10 倍。申请开放时间为 6 月 8 日至 23 日(PDT),企业用户可发送邮件至 business-mimo@xiaomi.com 联系合作。