行业动态

追踪 AI 与 Web3 行业的最新进展与深度洞察

Runway 推出 Aleph 2.0 视频编辑模型,支持一键智能适配多宽高比

OmniTools 6月9日消息,Runway 近日推出 Aleph 2.0 视频编辑模型,该功能可基于单条原始视频自动适配不同平台所需的宽高比。用户上传视频并选择目标尺寸(如 9:16、4:3 或 1:1)后,模型将利用 AI 智能填充画面边缘区域,生成自然连贯的扩展内容,使成片观感如同原生拍摄。 该功能现已上线 Runway 桌面 Web 应用,无需额外插件或本地部署。据官方介绍,Aleph 2.0 的填充逻辑基于场景语义理解与运动一致性建模,主要面向短视频分发与社交媒体...

亚马逊推出AI定制商品功能

OmniTools 6月8日消息,亚马逊近日在Amazon Shopping应用中上线AI驱动的定制商品功能。用户可通过点击底部Alexa图标或搜索“customize”,使用自然语言向Alexa描述创意,即时生成T恤、连帽衫、保温杯等商品的设计图。 该功能依托亚马逊自有印刷按需服务(Merch on Demand),支持包括V领衫、长袖衫、Polo衫、运动衫、卫衣、水瓶等十余类商品。设计完成后可直接下单,由Prime物流配送。 目前该功能仅面向美国用户开放,使用免费,用户仅...

OpenRouter 推出 Advisor 工具:支持小模型动态咨询高智能顾问模型

OmniTools 6月8日消息,OpenRouter 近日上线新服务器工具 Advisor,允许较小参数规模的模型在运行过程中动态咨询更高智能水平的“顾问”模型。该机制旨在帮助小模型突破推理瓶颈,避免陷入逻辑循环或错误响应,同时协助开发者向成本更低的模型迁移。 Advisor 通过服务端协调实现跨模型协同,不改变原有模型架构。官方表示,该方案有助于在保障输出质量的同时,降低对昂贵大模型的依赖。目前该功能已集成至 OpenRouter 平台。

WWDC 2026前瞻:Siri深度重构、Apple Intelligence升级与iOS 27亮相

OmniTools 6月8日消息,苹果公司于北京时间6月9日凌晨1点(美国太平洋时间6月8日10点)正式开启WWDC 2026全球开发者大会。本次大会聚焦AI能力全面落地,重点涵盖Siri的深度重构、Apple Intelligence功能扩展及iOS 27等系统更新。 据TechCrunch报道,新版Siri将接入Google Gemini技术,以实现多轮上下文理解与跨应用任务执行,并有望推出独立Siri应用以对标主流AI聊天机器人。相机应用将新增“Visual Intel...

Hivemind 推出面向 AI 编程智能体的持续学习功能

OmniTools 6月8日消息,Hivemind 正式发布面向 AI 编程智能体的持续学习功能,即日起开放使用。该工具可收集团队中运行的各类编程智能体(包括 Claude Code、Codex、Cursor、Hermes 和 Pi)的操作轨迹,自动提炼为可复用技能,并同步至全部接入智能体。 所有数据默认存储于用户自有云存储环境,保障数据主权。其内置 SkillOpt 模块支持技能持续训练,测试显示 Claude Code 准确率提升 19.1 分,Codex 提升 24.8...

面壁智能发布语音生成模型 VoxCPM2 技术报告并开源

OmniTools 6月8日消息,面壁智能(OpenBMB)正式发布语音生成模型 VoxCPM2 技术报告。该模型参数量为20亿,基于超200万小时多语言语音数据训练,支持30种语言及9种中文方言。 VoxCPM2 具备自然语言语音设计、可控语音克隆与高保真延续性语音生成能力。其技术方案采用16kHz语义编码与48kHz波形重建双阶段架构,集成AudioVAE实现高保真语音重建,并在零样本及指令跟随TTS基准测试中达到SOTA或极具竞争力水平。 目前,相关模型权重、微调代码与...

小米 MiMo-V2.5-Pro-UltraSpeed 实现单节点千 token/s 推理速度

OmniTools 6月8日消息,小米 MiMo 联合 TileRT AI 发布 MiMo V2.5 Pro UltraSpeed 模型,首次在单台标准 8 GPGPU 节点上实现 1 万亿参数 MoE 模型超 1000 tokens/s 的推理输出速度,无需依赖 Cerebras 或 Groq 等专用硬件方案。 该模型提供限时免费聊天体验,UltraSpeed API 定价为普通版本的 3 倍,实测输出体验提升约 10 倍。申请开放时间为 6 月 8 日至 23 日(PDT...

Kimi Code 宣布焕新升级,同步发布配套视频教程

OmniTools 6月8日消息,月之暗面(Moonshot)旗下 AI 编程辅助工具 Kimi Code 近日宣布完成版本焕新升级。本次更新重点优化了代码理解与生成能力,进一步强化了对长上下文处理及多文件协同分析的支持。 升级后,Kimi Code 在 Python、JavaScript、TypeScript 等主流编程语言的代码补全、错误诊断与重构建议等场景下表现更为流畅。官方已同步上线配套视频教程,详细演示了安装配置、核心功能操作及典型开发场景应用。 据悉,此次升级维持...

开发者开源视频翻译工具 xiaohu-video-translate:一句话指令全自动转写翻译

OmniTools 6月8日消息,开发者小互(@xiaohu)开源视频翻译工具 xiaohu video translate。该工具支持通过自然语言指令(如“把链接翻译成中文字幕视频”)自动完成视频下载、Whisper 本地语音转写、AI 翻译润色、字幕烧录及文稿生成全流程,转写环节完全本地运行,无需调用外部 API。 工具兼容 YouTube、Bilibili、抖音等平台链接及本地视频文件,支持英、日、韩、法、西等多语种转译为中文字幕。字幕时间戳精确至词级,按语义断句,单行...

Hugging Face 联合多家机构推动 OpenEnv 成为智能体强化学习标准环境协议

OmniTools 6月8日消息,Hugging Face 官方博客宣布,开源项目 OpenEnv 正式升级为面向智能体强化学习(Agentic RL)的协作标准,并由 Meta PyTorch、Reflection、Unsloth、NVIDIA、Hugging Face 等机构组成的联合委员会共同治理。项目代码库已迁移至 huggingface/OpenEnv。 OpenEnv 明确自身定位为互操作性协议层而非奖励框架,旨在标准化环境的发布、部署与调用。它提供兼容 Gymn...

Hugging Face 发布多智能体经济模拟实验:揭示 AI 涌现行为的高度依赖性

OmniTools 6月8日消息,Hugging Face 于今日发布技术博客《The crash that vanished: control and emergence in a five model economy》,复盘了其在 2026 年 6 月 Build Small Hackathon 中开展的多智能体经济模拟实验。 实验初期使用单一小模型驱动五个虚拟角色,成功复现了类似银行挤兑的资产价格崩盘现象;但当替换为五个异构小模型(涵盖 OpenAI、NVIDIA、Op...

开发者基于Hugging Face黑客松构建本地化反诈AI助手Pakistan Notice Helper

OmniTools 6月8日消息,Hugging Face 官方博客 6月8日消息,为应对巴基斯坦境内频发的短信诈骗问题,开发者 Abid Ali Awan 在 Hugging Face Build Small Hackathon 活动中开发了轻量级 AI 工具 Pakistan Notice Helper。该工具专为识别银行、电信、税务、交通等机构名义发送的可疑消息而设计,支持英文、乌尔都语及罗马乌尔都语输入,可处理文本与截图两种形式。 该工具不直接判定消息真伪,而是作为安...

心洲科技开源749B智能体模型Macaron-V1-Preview

OmniTools 6月8日消息,心洲科技(Mindverse)旗下Mind Lab正式开源个人智能体模型Macaron V1 Preview,参数量为749B。该模型基于GLM5.1预训练底座,支持202K上下文,采用MIT协议开源。 技术架构方面,模型创新采用Mixture of LoRA(MoL)设计,将情感交互、工具调用、代码生成等能力封装为独立LoRA技能包,支持秒级动态切换与数据隔离。后训练阶段仅需微调轻量技能包,无需更新744B基座参数,团队使用不足300张GP...

阿里云发布 AgentScope Java 2.0,聚焦企业级 AI 智能体开发

OmniTools 6月8日消息,阿里云正式发布 AgentScope Java 2.0,面向企业级 AI 智能体开发场景。新版本采用分布式无状态架构,支持 Kubernetes 弹性扩缩容与会话恢复。 该版本引入 Workspace 抽象实现多租户隔离与安全数据分离;通过 HarnessAgent 统一管理上下文并提供容错能力,保障长期运行稳定性;同时支持细粒度权限控制及 Human in the Loop 安全执行机制。 AgentScope Java 2.0 专为 JV...

Qwen3-VL 实现 Android 端侧推理全流程打通

OmniTools 6月8日消息,通义千问最新多模态大模型 Qwen3 VL 已完成在 Android 平台的端侧推理全流程适配。该方案通过 Agent 辅助开发方式,实现模型量化、部署、调用及交互的一站式集成。 据公开技术信息,适配工作覆盖主流 Android 设备,支持离线运行与低延迟响应,无需依赖云端服务。相关代码与工具链已开源,可供开发者直接复用。 此次端侧落地标志着 Qwen3 VL 在移动端多模态理解与生成能力进入实用化阶段,适用于图像描述、文档解析、视觉问答等本...

生数科技与华策集团共建AIGC影视创制中心

OmniTools 6月8日消息,生数科技与华策集团宣布达成战略合作,共同建设AIGC影视创制中心,推进AI技术在影视产业的融合应用。 双方将依托生数科技的AI视频生成模型Vidu,结合华策集团在影视制作领域的资源与经验,探索AIGC在剧本生成、预可视化、特效制作等全流程环节的应用。 合作将侧重技术研发与真实场景验证,旨在加速AI工具在影视行业的规模化落地。

邵猛开源 Brand to DESIGN.md 技能,警示复刻式设计或催生新“AI Slop”

OmniTools 6月8日消息,设计师邵猛开源了 Brand to DESIGN.md 技能(GitHub 仓库:shaom/brand to design md skill),旨在帮助 AI Agent 学习品牌设计品味并复刻网站界面。该技能聚焦 Design Skill、Taste Skill 与 Anti AI slop design skill 三类能力。 邵猛指出,当前部分复刻实践虽意图规避低质 AI 设计(AI Slop),但过度依赖模板化模仿,反而衍生出新的“...

微信AI启动内测,提供自动与开发两种接入模式

OmniTools 6月8日消息,IT之家6月8日消息,微信开发者平台正式宣布微信AI进入内测阶段。该AI助手集成于微信生态内,支持用户通过自然语言对话调用、访问及操作小程序。 开放平台当前提供两种接入方式:自动模式允许授权平台读取小程序源码,无需额外开发即可实现AI对页面的直接操作;开发模式则由开发者自主构建技能,经审核后供微信AI调用。两种模式可同时启用。 官方服务条款提示,“微信AI”或为临时名称,最终命名尚未确定。接入该功能为可选行为,不影响现有小程序的正常运行与服务...

PixVerse 上线 Creative Partner Program 2.0,面向AI视频创作者开放申请

OmniTools 6月8日消息,PixVerse 宣布 Creative Partner Program(CPP)2.0 正式上线,面向 AI 视频创作者开放申请。 该计划聚焦真实创作场景,涵盖内容发布、模型测试、教学分享、故事片制作及新功能公开推广等方向。参与创作者可获得多重支持:单周合格内容最高奖励 150,000 credits;每周设 2,500 美元现金奖励池,单人单周上限 850 美元;对大型项目、教程、测试内容及电影节投稿提供专项扶持。 此外,入选者还将获得平...

CoreWeave 分析当前计算市场增长驱动与制约因素

OmniTools 6月8日消息,据彭博社报道,美国 AI 算力服务商 CoreWeave 对当前计算市场进行分析,指出市场增长受多重因素推动,同时也面临一定的制约条件。该公司表示,其市场策略正围绕驱动与制约两大维度展开动态调整。

高德发布全球首个3D原生城市世界模型ABot-Earth0.5

OmniTools 6月8日消息,阿里巴巴旗下高德正式发布全球首个3D原生城市世界模型ABot Earth0.5,目前已建成覆盖190多个国家和地区的3D地图。 该模型支持用户输入卫星图像或文字描述,在消费级GPU上约10分钟即可生成公里级3D城市模型,输出格式为可编辑的3DGS,可直接导入Unity等主流引擎。 官方数据显示,其制图成本约为传统方式的1%,效率提升约1000倍,适用于具身智能、低空经济、应急救援等场景。目前模型已开放内测,申请入口为abot earth.am...

腾讯混元联合多家机构发布首个音频编辑基准MMAE

OmniTools 6月8日消息,腾讯混元团队联合上海交通大学、南洋理工大学等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个面向AI音频编辑能力的综合性评测基准。该基准聚焦模型对现有音频的理解与按自然语言指令进行精确修改的能力,而非单纯生成新音频。 MMAE包含2000个真实场景高保真音频样本、17741条细粒度评估项,覆盖声音、音乐、语音及混合等7种模态,支持6类任务复杂度(从基础修改到多跳推理与多轮编辑)和...

苹果内部召开秘密会议,启动Siri全面升级以应对AI竞争压力

OmniTools 6月8日消息,据彭博社报道,苹果公司近期召开一场秘密会议,正式承认其在人工智能领域面临显著劣势,并将Siri的全面重构列为优先事项。会议聚焦于提升Siri的响应能力、上下文理解与多模态交互水平,旨在缩小与当前主流AI助手的技术差距。此举反映出苹果正加速推进AI战略落地,相关工程已进入实质性开发阶段,但具体发布时间尚未公布。

英伟达与LG集团共建AI工厂,推进具身智能、自动驾驶与AI基础设施

OmniTools 6月8日消息,英伟达(NVIDIA)与LG集团宣布共建AI工厂,旨在加速LG在机器人、自动驾驶、数据中心技术及GPU云服务等领域的AI应用落地。该AI工厂将提供加速计算基础设施,支持AI模型的训练、仿真、验证与部署。 双方将整合英伟达全栈AI工厂平台与LG在消费电子、机器人、智能空间及数据中心技术等领域的产业能力,构建覆盖AI模型开发、物理AI数据生成、机器人仿真训练、边缘部署及工厂级数字孪生的统一工作流。LG电子正基于NVIDIA Isaac Sim、I...

NAVER携手NVIDIA扩建千兆瓦级AI工厂,部署主权AI基础设施

OmniTools 6月8日消息,韩国科技巨头NAVER宣布与NVIDIA深化合作,基于NVIDIA DSX平台在其世宗市GAK Sejong数据中心扩建主权AI基础设施。项目首期规模为55兆瓦,未来将扩展至千兆瓦级,旨在满足全球激增的AI算力需求。 该AI工厂将全面采用NVIDIA全栈加速计算平台,重点支持HyperCLOVA X大模型迭代、首尔世界模型(Seoul World Model)开发及企业级AI智能体服务。NAVER计划于今年下半年在韩国推出基于NVIDIA N...

SK电信与英伟达合作建设韩国AI云基础设施

OmniTools 6月8日消息,SK电信与英伟达宣布将基于NVIDIA DSX™平台在韩国建设千兆瓦级AI云,首座AI工厂计划于2027年上线。该AI云将专为训练、推理及智能体(agentic)AI工作负载优化,支持主权AI、物理AI及企业级AI服务。 新基础设施采用NVIDIA DSX全栈参考架构,涵盖加速计算硬件、系统、软件及运营方案,旨在实现每兆瓦最高token性能与最低token成本。SK电信将借此强化其在物理AI与智能体AI领域的现有布局,包括在SK海力士晶圆厂应...

微软调整GitHub Copilot计费模式,AI行业面临Token成本与盈利压力

OmniTools 6月8日消息,TechCrunch 6月7日报道,微软近期宣布调整GitHub Copilot定价模式,引发行业对AI服务成本结构的广泛关注。部分企业内部已将此次调价称为“Tokenpocalypse(Token末日)”。 随着Anthropic等头部AI公司推进上市进程,盈利压力正加速传导至产品端。多位分析人士指出,当前AI服务高度依赖融资补贴,实际运营成本远高于用户感知价格,未来更多厂商或将跟进涨价或引入用量限制。 值得注意的是,企业端AI支出增速已超...

黑客松项目“Amazing Digital Dentures”放弃AI生成3D游戏功能,转向轻量HTML工具

OmniTools 6月8日消息,托管于 Hugging Face 的黑客松项目“Amazing Digital Dentures”作者发文透露,已放弃利用 AI 生成可运行 3D 网页游戏的目标。该项目受动画《The Amazing Digital Circus》启发,原计划构建 AI 数字宠物以生成互动冒险游戏。开发中,作者尝试调用 Nemotron 30B 模型,结合长提示词、技能卡片(Skill Cards)及 RAG 技术生成 Three.js 游戏代码,但因上下文...

Hugging Face 上线 Room360:基于 AI 的视频转 3D 空间重建平台

OmniTools 6月8日消息,Hugging Face 平台上线 Room360 项目,这是一个基于 AI 的视频转 3D 空间重建平台。该平台可将普通智能手机拍摄的室内视频自动转化为交互式三维环境,无需依赖 LiDAR 或深度相机等专用硬件。 Room360 采用五阶段处理流程:视频分解、帧提取、单帧图像生成 3D 模型、空间对齐与融合、交互式可视化。在图像转 3D 环节,系统调用开源模型生成几何与纹理,随后通过旋转估计与模型融合算法,将多视角重建结果对齐至统一坐标系,...

开发者推出 Mythograph Atelier:基于对话式 AI 的个性化抽象艺术生成应用

OmniTools 6月8日消息,Hugging Face 博客近日介绍了一款名为 Mythograph Atelier 的 AI 艺术应用。该项目在 Build Small Hackathon 活动中启动,旨在通过 AI 协作生成具有个人意义的抽象绘画。 Mythograph Atelier 摒弃了单次提示直接出图的传统模式,采用对话式交互流程:AI 会主动提问,逐步理解用户的审美倾向、情绪状态、文化参照及核心表达意图,随后据此构建图像生成提示词。当前版本基于 FLUX 模...

OpenAI 拟对 ChatGPT 进行重大改版,向 Agent 平台转型

OmniTools 6月8日消息,据市场消息,OpenAI 正筹备 ChatGPT 自 2022 年上线以来最大规模改版,计划从传统聊天机器人升级为具备自主执行能力的超级应用/Agent 平台。新版预计整合 Codex 编程工具、图像生成功能及第三方服务(如 Canva、Booking),旨在打造跨平台个人 AI 助手,并探索免提示词交互模式。该改版预计将于未来几周内在网页端与移动端上线。 业务数据方面,ChatGPT 目前周活跃用户约 9 亿,付费用户达 5000 万,月收...

Notion 恢复 Anthropic 模型接入服务

OmniTools 6月8日消息,Notion 已恢复对 Anthropic Claude 系列模型(包括 Opus 4.7 和 4.8)的接入服务。此前因 Anthropic 基础设施出现短暂故障,导致相关模型错误率升高,Notion 于本周末临时禁用了所有 Anthropic 模型在 Notion AI 中的调用。 Notion 产品负责人 Max Schoening 表示,此次中断属临时性服务故障,并非模型质量所致;Anthropic 官方亦确认问题已解决,系“短暂基础...

特朗普政府与OpenAI探讨设立公共财富基金入股AI初创企业

OmniTools 6月8日消息,据《金融时报》报道,特朗普政府正与OpenAI就设立公共财富基金展开讨论,拟通过该机制使美国政府间接入股AI初创企业。具体方案为:AI公司向基金捐赠少量股权,基金以账户或分红形式将收益返还美国公民,不涉及政府直接运营企业。 该模式区别于特朗普政府此前对英特尔提供的90亿美元直接财政注资。OpenAI此前已提出公共财富基金构想,旨在长期持有资产,让公众共享AI技术发展红利。 政策动因包括缓解选民对AI引发失业、数据中心建设成本及企业权力集中的担...

加里·马库斯评AI生产力瓶颈:图表揭示技术进展缓慢现状

OmniTools 6月7日消息,认知科学家加里·马库斯在个人专栏中提及《金融时报》记者约翰·伯恩 默多克发布的一张图表,指出该图精准概括了当前AI技术在实际生产力提升方面进展有限的核心问题。 文中未提供新数据或实验结论,而是借图表引出对AI领域“Slop”(指低质量、冗余、不可靠输出)现象及其对真实世界应用效能制约的反思。 马库斯长期关注AI系统可靠性与可解释性,此次评论延续其对当前大模型实用边界的技术性质疑。

苹果将AI列为核心战略,相关进展将于WWDC 2026公布

OmniTools 6月7日消息,苹果公司近期召开一次内部秘密会议,决定将人工智能正式纳入公司核心战略。此举标志着其在AI领域的投入进入新阶段。 会议后,苹果启动全面AI转向,涵盖系统架构、开发工具及终端功能等多个层面。据公开信息,相关技术进展计划在2026年全球开发者大会(WWDC 2026)上集中发布。 目前尚未披露具体技术细节或产品名称,但iOS 27被提及为关键落地平台之一。

Symbolica 2.0 发布:支持 Python 与 Rust 的可编程符号系统

OmniTools 6月7日消息,Symbolica 2.0 正式发布。作为一款可编程符号系统,该版本新增对 Python 和 Rust 语言的原生支持。目前该更新已在 Hacker News 平台获得 100 点热度,引发开发者社区关注。官方表示,Symbolica 旨在兼顾高性能与易用性,适用于数学计算、符号推导及相关工程场景。项目已开源,完整文档与源码可访问官网获取。

Hugging Face “Build Small”黑客松引入 OpenAI Codex 专项赛道

OmniTools 6月7日消息,Hugging Face 社区近日在“Build Small”黑客松活动中上线 OpenAI Codex 赞助凭证,并设立 Codex 专项赛道。该赛道提供 1 万美元奖金及 ChatGPT Pro 订阅,前三名作品将由 Codex 模型作为评审进行打分。 参赛要求开发者使用 Codex 作为编码代理构建 Space,将代码推送至包含 Codex 提交记录的公共 GitHub 仓库,并在 Space README 中附上链接。针对部分开发者反...

Hugging Face 社区发布 Claude 代码会话分析工具 Her

OmniTools 6月7日消息,开发者在 Hugging Face 发布开源工具 Her(हेर),专为分析 Anthropic Claude 的代码会话(Code sessions)设计。该工具可解析会话生成的 .jsonl 日志文件,自动还原执行过程、定位关键操作(如部署、配置变更、密钥使用)、追踪 token 消耗及工具调用路径,并以自然语言呈现分析结果。 Her 基于本地运行的 Nemotron Mini 4B Instruct 模型(通过 ZeroGPU 在 Hu...

英伟达在韩国PC网吧展示RTX Spark超芯片,联合T1与游戏厂商推广AI PC生态

OmniTools 6月7日消息,英伟达于 COMPUTEX 台北 GTC 大会期间正式发布 RTX Spark 超芯片,该芯片面向 Windows PC,旨在支持个人 AI 代理运行,并兼顾本地 AI 推理、内容创作与游戏性能。随后,英伟达创始人兼 CEO 黄仁勋赴韩国,在首尔多家 PC 网吧现场演示该芯片。 在 T1 基地网吧,黄仁勋与《英雄联盟》世界冠军战队 T1 及选手李相赫(Faker)共同揭晓 RTX Spark,并宣布将联合 Riot Games 为《英雄联盟》...

UIUC与Chroma联合推出20B检索子智能体Harness-1

OmniTools 6月7日消息,伊利诺伊大学厄巴纳 香槟分校(UIUC)与Chroma团队联合推出Harness 1,一款参数量达20B的检索子智能体。该模型基于强化学习在有状态搜索框架中训练,框架内维护候选池、重要性标注集、证据图及验证记录,并由策略自主决策搜索、筛选、验证与终止时机。 Harness 1在8项基准测试中实现0.730的平均curated recall,较当前最佳开源检索子智能体提升11.4个百分点,性能仅略低于Opus 4.6。目前,模型权重与配套框架代...

OpenRouter 上线 Opus 4.8 缓存命中率与有效价格实时查看功能

OmniTools 6月7日消息,OpenRouter 已在 Anthropic Claude Opus 4.8 模型页面新增实时数据功能。用户现可通过 Pricing 标签页直接查看该模型的缓存命中率与历史流量,并对比不同模型提供商的有效价格差异。相关数据已同步至官方定价详情页。

开发者实测:Opus 4.8 在网页设计任务中表现优于 GPT-5.5

OmniTools 6月7日消息,开发者宝玉近期对比测试了 GPT 5.5 与 Opus 4.8 在网页设计任务中的实际效果,结果显示 Opus 4.8 生成质量明显更优。 测试基于开源工具 baoyu design Skill,该工具支持通过自然语言描述生成 HTML 页面,并允许用户点击预览界面中的任意元素发起针对性修改指令。其可通过 npx skills add JimLiu/baoyu design 安装并在本地运行。 项目官方建议优先搭配 Opus 4.8 使用以获...

Harness 工程团队分享基于 OpenAI Codex 的智能体开发实践

OmniTools 6月7日消息,Harness 工程团队在 OpenAI 官网发布技术文章《Harness 工程:在智能体优先的世界中运用 Codex》,系统介绍了其在智能体(Agent)优先架构下集成与应用 OpenAI Codex 的工程实践。 文章聚焦 Codex 在自动化代码生成、任务编排及智能体工作流构建中的实际落地路径,详细探讨了工具链适配、提示工程优化与错误恢复机制等核心技术细节。 该文发布后迅速引发技术社区关注,并登上 Hacker News 热榜。

OpenAI拟合并ChatGPT与Codex推出“超级应用”,强化AI智能体能力

OmniTools 6月7日消息,据新浪财经报道,OpenAI正计划将旗下编程工具Codex与ChatGPT合并为一款桌面端“超级应用”,预计在未来数周内上线。此次整合旨在强化AI智能体执行复杂任务的能力,重点提升长时间、多步骤操作及外部工具调用表现。 报道指出,Codex已具备更优的底层工具调用框架(harness),并支持本地文件访问。截至5月底,Codex周活跃用户已达500万,企业客户收入实现周环比50%增长。OpenAI内部已将ChatGPT、Codex及API团队...

Cursor 社区推出 Design 技能:支持浏览器元素标注与本地 HTML 生成

OmniTools 6月7日消息,据 AI 社区开发者分享,一款名为 Cursor Design 的本地技能插件近日引发关注。该工具基于 Claude 模型运行,用户只需描述界面需求即可自动生成高质量 HTML 代码,并支持在预览中点击任意元素进行语音或文本指令修改。 该技能推荐搭配 Anthropic Opus 4.8 模型使用,开发者可通过终端命令 npx skills add JimLiu/baoyu design 进行安装,相关源码已开源至 GitHub。

谷歌每月向SpaceX支付9.2亿美元获取xAI数据中心算力

OmniTools 6月7日消息,据CNBC报道,谷歌已与SpaceX达成协议,将每月支付9.2亿美元以获取位于xAI数据中心的计算能力。该交易的具体金额与合作细节于本周披露,旨在大幅扩充谷歌的AI算力资源。目前协议尚未公开具体技术条款、服务期限及数据中心确切位置。此次合作标志着科技巨头在AI算力基础设施领域的深度协同。

MiniMax M3 与 Claude Opus 代码审计对比:同等检出率下成本显著更低

OmniTools 6月7日消息,MiniMax 官方 6 月 6 日发文对比了 M3 与 Claude Opus 4.8 的代码审计能力。在相同代码库、相同提示词及预置 17 个已知漏洞的条件下,MiniMax M3 成功检出 13 个漏洞,成本仅为 0.07 美元;Claude Opus 4.8 同样检出 13 个漏洞,但花费达 1.30 美元。该测试凸显了 M3 在单位成本效率上的优势。MiniMax 官方表示此次对比结果“非常有趣,绝对值得一读”。

OpenAI 推出 Lockdown Mode 防范提示注入攻击

OmniTools 6月7日消息,OpenAI 宣布推出 Lockdown Mode(锁定模式),旨在降低提示注入攻击导致敏感数据泄露的风险。该模式将禁用实时网页浏览(仅允许访问缓存内容)、网页图片检索与显示(仍支持图像生成)、深度研究及智能体模式。 OpenAI 指出,即使启用 Lockdown Mode,ChatGPT 仍可能受提示注入影响——例如恶意指令可能隐藏于缓存网页内容或用户上传文件中,进而干扰响应行为或准确性。该功能并非面向所有用户,主要适用于处理敏感数据、需强...

ResNet 获 CVPR 2026「时间检验奖」,阶跃星辰首席科学家张祥雨为合著者

OmniTools 6月7日消息,CVPR 2026 官方宣布将「时间检验奖」(Test of Time Award)授予经典论文《Deep Residual Learning for Image Recognition》。该论文提出的残差网络(ResNet)架构对深度学习视觉模型发展产生了深远影响。 论文作者包括何恺明、张祥雨、任少卿与孙剑。其中,张祥雨现任阶跃星辰首席科学家。 「时间检验奖」旨在表彰过去十年间在计算机视觉领域产生持久学术与工业影响力的论文。ResNet 最...

斯里拉姆·克里希南将卸任白宫AI高级政策顾问

OmniTools 6月7日消息,前科技高管及a16z合伙人斯里拉姆·克里希南(Sriram Krishnan)宣布将于6月底卸任白宫人工智能高级政策顾问一职。克里希南在声明中表示,任职期间深度参与了特朗普政府AI行动方案的制定,该方案侧重于数据中心建设,并弱化监管与安全框架。他还透露,下一步将牵头组建外部机构,继续在能源、数据中心及AI普惠路径等议题上影响美国及其盟友的AI政策。该计划已获《华盛顿邮报》证实。