信息网_www.520link.cc

爱链网_信息网 > 北京信息 > 正文

云天励飞:IPU-X6000加速卡已适配超过30个开源大模型,预期能使大模型推理成本大幅度下降

网络整理 2024-09-18 00:44

(原标题:云天励飞:IPU-X6000加速卡已适配超过30个开源大模型,预期能使大模型推理成本大幅度下降)

经济观察网讯 7月24日,云天励飞在上证e互动平台表示,公司2024年推出的IPU-X6000加速卡主要用于大模型云端推理,其内置高效大模型推理DeepEdge200芯片,具有256T大算力、486GB/s超高带宽、128GB大显存、c2c mesh互联,可应用于语言大模型、视觉大模型、多模态大模型等各类大模型推理加速领域。目前已经支持适配云天书、通义千问、百川智能、智谱清言、Meta等30+开源大模型,涵盖1.5B参数到70B参数量,预期能使大模型推理成本大幅度下降。(实习记者 李青阳 编辑 李仕静)

Tags:[db:TAG标签](555565)

转载请标注:信息网——云天励飞:IPU-X6000加速卡已适配超过30个开源大模型,预期能使大模型推理成本大幅度下降

搜索
网站分类
标签列表