IF9.CN 消息,1 月 27 日,DeepSeek 发布全新 DeepSeek-OCR 2 模型,采用创新的 DeepEncoder V2 方法,让 AI 能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左到右扫描。这种方式模拟了人类在观看场景时所遵循的逻辑流程。最终,该模型在处理布局复杂的图片时,表现优于传统的视觉-语言模型,实现了更智能、更具因果推理能力的视觉理解。
DeepSeek发布OCR2,能够以人类相同逻辑顺序识图
- THE END -
本文由 @决策财经 修订发布于 2026-01-27 14:01:11
本文来自投稿,不代表本站立场,如若转载,请注明出处:/news/live-news/141315
评论 (共 条评论,人围观)
