登录

首页 > 写作技巧 > 刚刚，DeepSeek 又发新模型，小而美玩出新高度

刚刚，DeepSeek 又发新模型，小而美玩出新高度

发布时间：2025-10-20 21:26:20

就在刚刚，DeepSeek 开源了一个 3B 模型 DeepSeek-OCR。虽然 3B 体量不大，但模型思路创新的力度着实不小。

众所周知，当前所有 LLM 处理长文本时都面临一个绕不开的困境：计算复杂度是平方级增长的。序列越长，算力烧得越狠。

于是，DeepSeek 团队想到了一个好办法。既然一张图能包含大量文字信息，而且用的 Token 还少，那不如直接把文本转成图像？这就是所谓的「光学压缩」——用视觉模态来给文本信息「瘦身」。

而 OCR 正好天然适合验证这个思路，因为它本身就是在做「视觉→文本」的转换，而且效果还能量化评估。

论文显示，DeepSeek-OCR 的压缩率能达到 10 倍，OCR 准确率还能保持在 97% 以上。

啥意思呢？就是说，原本需要 1000 个文本 Token 才能表达的内容，现在只用 100 个视觉 Token 就搞定了。即使压缩率拉到 20 倍，准确率也还有 60% 左右，整体效果相当能打。

OmniDocBench 基准测试结果显示：

只用 100 个视觉 Token，就超过了 GOT-OCR2.0（每页 256 个 Token）的表现
用不到 800 个视觉 Token，干翻了 MinerU2.0（平均每页超过 6000 个 Token）

在实际生产中，一块 A100-40G 显卡就能每天生成超过 20 万页的 LLM/VLM 训练数据。20 个节点（160 块 A100）直接飙到每天 3300 万页。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“商媒体用户上传并发布"，本平台仅提供信息存储服务。

下一篇:谁会为手机厂商的“两亿像素”买单？

上一篇:逼近人类感知水平，SharpaWave 灵巧手量产出货

创作交流更多>>

长安汽车：UBS、Temasek Holdings Pte Ltd等多家机构于6月18日调研我司上海车展B站展区多款创意车型亮相痛车版“陆地航母”登场当对手陷入内卷，东风汽车却选择了赋能整个行业辅助驾驶系统全面升级一汽丰田举办bZ5技术发布会兰博基尼首款电动汽车推迟至2029年发布尊界超级工厂落成！“国产迈巴赫”来了纯电续航155km BJ40e将于12月17日开启预售后驱小钢炮雷诺5 Turbo 3E外观官图发布

新车测评更多>>

科技赋能合资豪华品牌，Momenta携手凯迪拉克、别克开启“智驾技术反击” 美国新势力Lucid工程师：已购小米SU7学习如何制造电动汽车长安启源全新SUV预告图发布！外观时尚前卫，车长近5米坦克300柴油版无伪街拍亮相，预计明年3月上市，搭载2.4T柴油引擎奥迪全新一代Q7最新消息曝光，明年下半年首发，2026年初上市星舰7上市，对自主SUV有哪些影响，长安CS75 PLUS更值得买？小米YU7座舱前瞻：有特殊屏幕、英伟达智驾芯片拖上市后腿为救销量彻底疯狂！卡罗拉降到7.98万起售，和秦PLUS同价选谁？

媒体学习更多>>

特斯拉股价大涨6.14% 马斯克个人财富再创新高英菲尼迪美国销量下滑，日产墨西哥合资工厂减产50% 兰博基尼Urus SE迈阿密特别版亮相！提供专属配色，加速仅3.4秒续航破千的智己L6，行业技术突破的新开端东风本田烨S7即将上市，明年2月底亮相，搭载纯电W架构财富飙升速度赶超火箭！马斯克成全球身家超4000亿美元“第一人” 丰田的反击开始了？首搭端到端智驾，bZ3C续航破600km！雷诺迷之操作？在国内建研发中心学习国产技术，新车返销欧洲！

生态内容更多>>

千家企业参加上海车展，宝马的展台竟成了“人气王”？ 2025上海车展：豪华高度再拔高，仰望U8L亮相福特汽车和SK On的电池合资企业获美国政府96.3亿美元贷款特斯拉股价创新高世界首富马斯克身价突破4700亿美元东风风行星海S7长续航版将于12月21日上市奔驰劳资委员会主席呼吁调整在华战略，以夺回“失地” 哈弗H9柴油版售23.39万起！搭载2.4T柴油发动机销冠不是虚名，全新岚图梦想家的成功始于技术与品质

原创分享更多>>

纯电小钢炮要换代！全新日产Leaf官图曝光，续航604km 他俩拥抱了！余承东喊话：备好产能董明珠再点名小米汽车，冲上热搜让对手如何应对！ID.车型大幅优惠4万，高配竟超性价比？ 800V高压平台知多少：15-20万价格段占比高达21%，车企加速布局奇瑞风云A8L C-DM将于12月17日上市首搭上汽πPlus 星际X将于12月18日上市丰田凯美瑞光辉版亮相！配备运动风格套件，有望12月底上市

写作技巧更多>>

联想拯救者解答手机跑分超百万但游戏掉帧，称性能调度可能波动谷歌推出安卓17 Beta 2：上线EyeDropper取色器API等内存价格暴涨！第一个撑不住的手机品牌出现：魅族宣布暂停手机新品研发 vivo Pad6 Pro配置曝光：13.2英寸超高刷屏，骁龙8 Elite Gen5 苹果不送充电器又被罚了13万！网友怒斥：环保就是个幌子博通出货3.5D XDSiP先进封装平台首款SoC富士通MONAKA 谷歌Nano Banana 2又刷屏了：又快又便宜，设计师当场破防美团：加快研发图像识别、后厨预警等食品安全AI产品

Copyright 2016-2025 商媒体版权所有京ICP备20241218号-1