用英特尔CPU及GPU运行OpenAI-whisper模型语音识别

作者 英特尔创新大使 黄明明 介绍 Whisper 作为一款卓越的自动语音识别(ASR)系统,依托海量且多元的监督数据完成训练,其数据规模高达 680,000 小时,涵盖多种语言及丰富多样的任务类型,广泛采撷自网络资源,以此铸就了坚实的性能根基。 从技术架构层面剖析,Whisper 构建于先进的 Transformer 框架之上,采用经典的编码器 - 解码器模型设计,也就是广为人知的序列到序列模型

openlab_96bf3613 4月前
2764 0 0

OpenVINO™ 2024.5 新发布 | 使用流水线简易部署多模态 AI

作者 | Whitney Foster OpenVINO™ 产品专家 Yury Gorbachev 英特尔院士 OpenVINO™ 产品架构师 翻译 | 武卓 博士 英特尔 OpenVINO™ 布道师 在过去的一年里,大语言模型(LLM)彻底改变了文本处理,为文本摘要、重写、文档分析等提供了解决方案。然而,我们每天与之交互的数据不仅仅是文本,而是多模态的,包括视频、音频和图像。多模态的存在非常普遍

openlab_96bf3613 4月前
1440 0 0

使用Intel AI PC为YOLO模型训练加速

英特尔创新大使 黄明明 英特尔开发者技术推广经理 李翊玮 背景在以往的实践中,当我们针对 ultralytics 的 YOLO 模型开展训练工作时,可供选择的计算设备通常局限于 CPU、mps 以及 cuda 这几种。然而,自 PyTorch2.5 版本发布之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助 Intel Intel® Arc™ 显卡来进行

openlab_96bf3613 4月前
2124 0 0

最新端侧小钢炮!利用OpenVINO部署GLM-Edge全家桶

作者 | 杨亦诚 英特尔 AI 软件工程师 今天智谱发布其最新的GLM-Edge系列SLM模型, GLM-Edge 系列是智谱在面向端侧真实落地使用的场景下的一次尝试,由两种尺寸的大语言对话模型和多模态理解模型组成( GLM-Edge-1.5B-Chat,GLM-Edge-4B-Chat,GLM-Edge-V-2B,GLM-Edge-V-5B)。其中,1.5B / 2B模型主要面向手机、车机等平台

openlab_96bf3613 4月前
1248 0 0

使用 OpenVINO™ C# 异步推理接口部署YOLOv8——在哪吒开发板上也可以实现视频推理

2024 Intel®**“走近开发者”**互动活动-哪吒开发套件免费试用AI创新计划:哪吒开发板是专为支持入门级边缘AI应用程序和设备而设计,能够满足人工智能学习、开发、实训等应用场景。为了测试该开发板的推理性能,同时测试所推出的[OpenVINO™ C# API](https://github.com/guojin-yan/OpenVINO-CSharp-API)项目能否应用到该开发板上,我们

openlab_96bf3613 5月前
2268 0 0