Google DeepMind 昨日推出了全新 AI 模型 Genie 3,被形容為「世界模型(World Model)」領域的重大突破。這款系統能夠根據 text prompt(文字指令)即時生成 720p、24fps 的虛擬世界,而且這些世界不只是影像,而是具備物理屬性、可互動的環境,類似 open-world video game。
與傳統影像生成不同,Genie 3 不僅「看懂世界」,更能「創造世界」——就像反轉的感知系統,模擬如果它擁有眼睛會看到的景象。這項能力對 autonomous systems(自主系統)與 robots(機器人)來說意義重大,因為它提供了無限的模擬訓練空間。
除了 Genie 3,AI 圈還有兩大消息
- OpenAI 發布 GPT○ OSS
- Anthropic 推出 Claude Opus 4.1
Genie 3 的技術亮點
- 即時高解析度:可生成 720p 畫面並維持 24fps 流暢度
- 物理一致性:物體具備可互動的物理屬性,並且這種一致性是 emergent property(湧現特性),並非人工程式調整的結果
- 持續互動:可支援多分鐘的互動情境,而不是短暫片段
- 多場景生成:既能創造逼真的世界,也能生成虛構場景
對人類來說,Genie 3 是個有趣的玩具;對機器人來說,則是訓練與學習的無限場地。隨著 humanoid robots(人形機器人)如 Unitree R1 以 5,900 美元的價格問世,離機器人替人類煮飯、遛狗、甚至陪伴的時代已不遠。
CLI 開發工具新秀:Warp
除了 AI 模型,Warp 近期也受到矚目。這是一款 agentic development environment(代理式開發環境),結合了 CLI 的速度與 IDE 的便利,能夠編輯檔案、檢視 diff、一次處理多檔案,並利用 codebase embeddings(程式庫嵌入)進行更深層的上下文理解與規劃。在 terminal bench 測試中擊敗了 Claude Code 與 Gemini CLI,成為第一名。