大模型推理还在“一个字一个字蹦”?在 OpenVINO™ GenAI 中上手 EAGLE-3 草稿模型

作者:武卓、卢致翔做过本地大模型推理的开发者,通常都会遇到一个很现实的问题:模型能力够强,但输出就是不够“跟手”。尤其是在本地代码生成、对话助手、Agent 工具调用这类场景里,用户真正感知到的并不是模型参数有多大,而是它首字出来够不够快、整段生成够不够流畅。而自回归解码的天然顺序性,决定了大模型往往只能“一个 token 一个 token”往前走,这也是生成时延迟居高不下的根源。OpenVINO

openlab_96bf3613 26天前
680 0 0

那个“Prompt”出的未来:人人都是构建者

被我们亲切地称为“小龙虾”的开源AI智能体OpenClaw,在极短时间内就席卷全球科技界。它究竟为何爆火?又将如何颠覆性地改变行业生态和普通人的生活?近期,知名AI播客Lex Fridman对话“小龙虾之父” – OpenClaw的创作者Peter Steinberger,深度畅谈OpenClaw正在引发的变革。Prompt出来的奇迹“I was annoyed that it didn’t ex

openlab_7bf40019 28天前
1104 0 0

OpenVINO™ 2026.0 重磅发布:更多新模型、更强 GenAI、压缩更智能

作者:武卓2026 年马年新年已至,也欢迎体验 OpenVINO™本年度的首个版本发布!随着 AI 持续快速演进,我们始终致力于为开发者提供所需工具,帮助大家在英特尔硬件上高效落地这些创新。OpenVINO™ 2026.0 以更丰富的模型支持、GenAI 能力增强以及更出色的压缩优化,为新一年强势开局。无论你是在部署对话式 AI、构建 Agentic 系统,还是打造自主机器人,OpenVINO™都

openlab_96bf3613 1月前
2216 0 0

OpenVINO™ 2025年度回顾:让生成式AI跑得更快、更简单、更智能

年度总览:核心摘要2025年,OpenVINO™ 共发布5个主要版本,完成四大跃迁:一句话:2025年的OpenVINO™,从“英特尔的推理后端”进化为“生成式AI应用开发的通用底座”。五大技术维度年度演进四大里程碑NPU:从“能跑”到“好用”路径:2025.0预览 → 2025.2 8B模型 → 2025.4 多模态+内存优化收益:边缘部署不妥协模型规模,AI PC能效优势兑现RAG:从“检索”

openlab_96bf3613 1月前
1948 0 0

旅行规划别再靠“瞎聊”了:用 OpenVINO™搭建一套多智能体多模态旅行规划师

作者:武卓旅行规划听起来很简单——直到你真的开始做。你从“北京三日游”起步,下一秒就要同时处理最新的网页信息(开闭馆时间、购票规则、天气导致的行程变更)、个人偏好(口味、预算、行动便利性约束),有时还要处理图片(“我照片里的这个地方是哪?”)。单纯的 LLM 对话看起来可能很自信,但旅行规划恰恰属于那种:没有事实依据的自信,很容易生成一份“看着合理、实则坑很大”的行程。在这篇博客里,我们将带你走

openlab_96bf3613 1月前
2092 0 0