Neuchips 在2024 年消费电子展上展示面向个人电脑的低功耗人工智能升级产品
发布时间:2024-01-12 00:00:00

  如果任何台式电脑通过一次升级就可以成为人工智能推理野兽,会怎样?这是Neuchips提出的想法,这是一家成立于 2019 年的台湾初创公司,以提供一流的人工智能效率而闻名。它在CES Unveiled 2024 主赛事之前的媒体预赛秀上亮相,带有 PCIe 附加卡,可以升级典型台式计算机的 AI 功能,同时仅增加 PC 的功耗预算 55 瓦。


Neuchips 在2024 年消费电子展上展示面向个人电脑的低功耗人工智能升级产品xx


  这不仅仅是一个概念。该卡被插入展厅的台式电脑,并提供与由Meta 流行的 Llama 2 7B 大语言模型支持的聊天机器人的实时离线对话Neuchips 表示该卡也将运行 Llama 2 13B。


  Neuchips 的 Evo PCIe 加速卡是围绕该公司的 Raptor Gen AI 加速芯片构建的。Raptor 芯片可实现“每秒高达 200 兆兆次的运算”,该公司表示,它针对基于变压器的模型进行了优化。


  Neuchips 展示的卡具有 Raptor 芯片,但单芯片并不是该卡的最终形式。Neuchips 的首席执行官 Ken Lau在英特尔工作了 26 年表示,Raptor 可用于设计带有不同数量芯片的卡。


  “该芯片实际上是可扩展的,”刘说。“所以我们从一个芯片开始。然后我们有四个芯片。然后是八块筹码。” 根据Neuchip 的新闻稿,每个芯片每秒可提供高达 200 万亿次操作 (TOPS) 。该卡还搭载 32 GB LPDDR5 内存,内存带宽达到 1.6 TB。内存带宽很重要,因为它通常是在单台 PC 上处理人工智能推理时的一个因素。


  Neuchips 希望为用户提供有效使用该卡所需的工具,尽管距离发布还有数月时间,此处的详细信息仍然有点稀疏。Neuchips 的一位代表表示,该公司拥有编译器软件,并将提供驱动程序。我看到的演示有一个用于与 Llama 2 7B 模型交互的自定义??界面。Neuchips 的卡正在运行,但看起来很简单。


  任何人都可以将硬件插入台式机的 PCIe 插槽,以大幅提高 AI 性能。它被称为 GPU,英伟达在市场上拥有垄断地位。在性能上与 Nvidia 正面交锋是很困难的。事实上,Nvidia 在 CES 2024 上宣布了专注于 AI 的新卡;RTX 4080 Super 将于 1 月 31 日起零售价为 999 美元,AI 性能高达 836 TOPS。


  然而,Neuchips 看到了一个机会。“我们专注于能效,”刘说,“并致力于处理现有的许多不同模型。”


  现代显卡功能强大,但也耗电。RTX 4080 Super 的功耗高达 320 W,通常需要计算机配备至少 750 W 的电源。相比之下,Neuchips 的 Evo PCIe 加速器仅消耗 55 W 的功耗。事实上,它的功耗非常低,以至于 Neuchips 在CES上展示的卡没有外部 PCIe 电源连接。对于大多数 GPU 卡来说,此类连接器是必需的。


  我还被告知,最终的卡将于 2024 年下半年发货,其尺寸大约是 CES 上展示的卡的一半。这是一个重要的细节,因为我看到的卡与大多数当前的 Nvidia GPU 卡一样大,并且太大而无法适应大多数小型台式电脑。较小的卡将使 Evo PCIe 加速器可用于各种现代 PC 硬件。


  Neuchips 的加速器虽然可能是 CES 2024 上最引人注目的 AI 加速器卡,但在展会上绝非孤例。几家初创公司推出了自己的人工智能加速器,具有独特的功能。Panmnesia 的 AI 加速器荣获 CES 创新奖,该加速器包括用于访问巨大内存池的 Compute eXpress Link 接口。其他拥有人工智能加速器的公司包括DeepX和MemryX。英特尔和AMD也参与其中。每款产品都在其最新的 CPU 架构中提供了人工智能加速器。


  毫无疑问:Nvidia 仍然是这个领域中 800 磅重的大猩猩,而且这一点不会在一夜之间改变。尽管如此,Neuchips 的 Raptor 和 Evo PCIe 卡等新型 AI 加速器似乎已经准备好为那些不关心图形或需要在运行 AI 推理时提高电源效率的开发人员提供新的选择。



相关文章: 适用于汽车应用领域的3款电路保护器件  TDK超声波 ToF 传感器工作距离可达5米  什么是双向可控硅?双向可控硅工作原理与作用  蝶眼传感器捕捉紫外线图像,生物仿生技术窥探光谱的新区域  443端口是什么协议?443端口是干什么的?443端口和80端口的区别  联想悄然推出了一款运行 Android 系统的商用投影仪  二极管符号是什么?二极管符号怎么看方向?二极管符号正负极判断  stm32f103是什么电子元件?stm32f103的功能作用和应用领域  什么是第一宇宙速度?第一宇宙速度是多少千米/马赫?  3款高可靠性电路保护器件,更有效的过压保护  开年第一梯《采购自助餐交流会》  对讲机怎么用?对讲机怎么说话和接听?对讲机使用图解  RDS 推出紧凑、高性能 OLED 显示模块  光学变焦是什么意思?光学变焦和数码变焦的区别  恩智浦半导体推出的全新汽车级无刷直流电机控制 MCU  晶达光电即将推出 EN 50155 平板电脑  ST汽车级双运算放大器TSB182融合了中等电压和精度  lm339是什么电子元件?lm339参数/工作原理/引脚图及功能等中文资料  中国首家!意行半导体推民用毫米波雷达MMIC解决方案  PCC是什么意思?PCC和PLC、IPC的区别  什么是SOC?SOC是什么意思?  人工智能改进了气候变化模型,提高了卫星对降雨量的估计  Vishay将收购Nexperia的纽波特晶圆厂,预计将于2024年第一季度完成  固态硬盘和机械硬盘的区别详解  lm324是什么电子元件?lm324参数/引脚图及功能等中文资料  Microchip的四款航空航天和军用级MEMS振荡器  iTunes备份文件在哪里?不同操作系统下iTunes备份文件的位置  英飞凌将1.2kV和2kV的SiC MOSFET半桥引入62mm模块封装  关于雷达和智能物联网的 11 个误解  红/绿/红外多LED封装“SFH 7018”,亮度比公司上一代产品提高约40%  采用双线圈传感器技术的 IPS,适用于高速电机  PCI总线是什么?pci总线是串行总线吗?pci总线和pcie总线的区别  英特尔:全新 Xeon CPU是目前市场上最适合人工智能的 CPU  Picocom 推出小型低功耗 5G 小型蜂窝 O-RU  焦距是什么意思?镜头焦距公式与换算  什么是寄存器?寄存器的作用是什么?寄存器和存储器的区别  ON 的 Hyperlux LP 图像传感器可延长电池寿命  什么是raid卡?raid卡是干什么的?有什么作用?  英国Pickering公司推出其首款高压表面贴装簧片继电器  英飞凌推出采用PQFN封装的15V沟槽型功率MOSFET  DDR4是什么意思?ddr3和ddr4有什么区别  激光雷达让汽车的自动驾驶变得智能  网线的线序:交叉网线线序和直连网线线序图解  苹果凭借适用于Mac的M3处理器系列保持领先地位  金刚石半导体器件具有最高的击穿电压  罗姆的新型高功率激光二极管可扩展激光雷达范围  stc89c52rc是什么电子元件?stc89c52rc的参数/引脚图及功能和应用领域  tl431是什么电子元件?tl431的参数/引脚图及功能等中文资料  什么是节流阀?节流阀工作原理与作用  发烧友使用 AMD Ryzen 的 3D V-Cache 来生产微型、超快的伪 SSD