第五届硬核芯生态大会
距离投票结束还有--

昆仑芯科技

正在参评4大奖项,请为他投票!

提名最佳AI芯片
昆仑芯科技

昆仑芯2代芯片

采用100%自研昆仑芯XPU-R架构,核心算力提升2-3倍,支持硬件虚拟化。

提名最具创新精神IC设计企业
昆仑芯科技

昆仑芯科技深耕AI加速领域十余年,是国内AI芯片领域的先行者。

提名最佳创业团队
昆仑芯科技

昆仑芯科技深耕AI加速领域十余年,是国内AI芯片领域的先行者。

提名最具投资价值项目
昆仑芯科技

昆仑芯科技深耕AI加速领域十余年,是国内AI芯片领域的先行者。

企业介绍
生成企业专属海报

公司介绍:

昆仑芯(北京)科技有限公司前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约130亿元。在国内最早布局AI加速领域,深耕10余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的AI芯片企业。

昆仑芯科技团队成员拥有全球顶尖学术和行业背景。2017年,该团队首次提出100%自研的、面向通用人工智能计算的核心架构昆仑芯XPU,从设计理念上就做到了通用性、易用性和高性能的兼顾,技术设计基于客户和场景真实需求。研究成果也在Hot Chips、ISSCC等国际顶级学术会议中成功发表。

目前,昆仑芯科技已实现两代昆仑芯通用AI计算处理器(即昆仑芯1代、昆仑芯2代产品)的量产及落地应用。两代产品先后斩获2020、2021年中国芯“优秀技术创新产品”奖。昆仑芯1代于2020年量产,在百度搜索引擎、小度等业务中部署超过2万片,是国内唯一一款经历过互联网大规模核心算法考验的云端AI芯片,同时也被广泛部署在互联网、工业制造、智慧城市、智慧交通、科研等领域。搭载新一代架构昆仑芯XPU-R的昆仑芯2代于2021年6月回片并当天点亮,8月量产发布。昆仑芯2代是国内首款采用GDDR6显存的通用AI芯片,相比昆仑芯1代性能提升2-3倍,且在通用性、易用性方面也有显著增强。昆仑芯2代已启动互联网及各行业客户交付,当前商业化进展顺利。

为顺应市场需求的爆发,昆仑芯将持续发力,更先进的昆仑芯3代等多个产品均已启动研发。

昆仑芯科技的使命是让计算更智能,愿景是成为划时代、全球领先的智能计算公司。昆仑芯科技致力成为芯片创新链、产业链的“赋能者”,与上下游企业携手,积极构建软硬一体化的AI芯片生态,打造从芯片到终端、应用、云端、服务的生态闭环,创造更大的商业和社会价值。


产品介绍:昆仑芯2代芯片

昆仑芯2代芯片采用新一代自研架构昆仑芯XPU-R,是国内首款采用GDDR6显存的通用AI芯片,相比昆仑芯1代性能提升2-3倍,且在通用性、易用性方面也有显著增强,2021年已启动互联网及各行业客户交付,当前商业化进展顺利。


产品性能:

采用新一代自研架构昆仑芯XPU-R,通用性和性能显著提升。


新一代自研架构:

采用昆仑芯XPU-R架构,通用性和性能显著提升


算力强大:

256 TOPS@INT8,128 TFLOPS@FP16


技术领先:

7nm先进工艺,GDDR6 高速显存


功能完备:

支持硬件虚拟化,芯片间互联和视频编解码

7nm先进工艺32GB高速内存512GB/s内存带宽


技术创新: 

昆仑芯2代芯片基于软件定义的AI芯片架构昆仑芯XPU-R,具有如下核心优势:通用计算能力显著增强,可灵活支持AI算法的演进,提升资源投入效用

通过自研的XPU-R架构将通用计算核心算力提升2-3倍, 极大增强了产品的通用计算能力。 针对典型AI负载,R200 AI加速卡的实

测吞吐性能是业界主流150W GPU的1.5倍。

硬件虚拟化,提升AI算力资源的利用率

支持硬件虚拟化功能,其计算单元和存储单元可实现物理隔离、供多个用户使用。在保证服务质量(Quality of Service,QoS)的

情况下,显著提升AI加速卡的资源利用率。

高性能分布式AI系统,加速AI数据并行和模型并行中的高速数据交换

昆仑芯R480-X8 AI加速器组采用OAM模组,为单节点的AI服务器提供高达1PFLOPS FP16的AI算力。同时,通过多芯片互联,产品可提供200GB/s聚合带宽,能有效支持模型并行和数据并行等训练策略中数据的高速交换要求。

 

昆仑芯科技持续对芯片架构、指令集等底层核心技术进行优化,以适配人工智能应用及各类算法,不断提升产品的性能、能效和易用性。目前,昆仑芯科技的产品跟国际主流方案进行参数对标,可以提供更为优秀的性能功耗比和性价比。

 

以R200 AI加速卡为例,经过业务规模部署的实际测试,对典型AI负载的性能提升在1.5倍左右。以推理场景中的吞吐率举例,加速效果如下:

GEMM通用矩阵乘性能加速为1.7倍;

BERT自然语言处理的典型算法Bert性能加速达1.4倍,对Transformer类的其他算法的加速性能表现优异;

YOLOv3视觉的目标检测算法YOLO性能加速为1.3倍;

ResNet50视觉的图像分类模型ResNet50性能加速为1.2倍;


客户服务:  

昆仑芯2代芯片主要面向高性能的数据中心推理市场,包括云端和边缘端的数据中心,灵活支持视觉、语音、自然语言处理和搜索等深度学习和机器学习算法,灵活支持用户自定义算子开发;昆仑芯2代芯片支持主流互联网应用、泛视觉、金融、工业互联网和政务类等行业应用。

昆仑芯一代产品已经在百度搜索引擎、小度和广告业务中部署超过2万片、也有50多家外部客户,是国内唯一一款支撑了互联网大规模核心算法的AI芯片,经过互联网数据中心最严苛的业务上线考验,产品的可用性、可靠性、稳定性、鲁棒性得到了充分验证,同时证明了昆仑芯团队在芯片架构、软件栈、系统工程化上的技术实力。

目前,昆仑芯2代芯片已经在头部互联网、智慧政务、智慧工业、智慧交通和智慧金融等行业实现商业落地,未来可期。

 

应用案例介绍: 

应用案例一:百度搜索引擎

数据中心的业务形态丰富多样,对于AI算法的诉求各不相同,比如:百度的搜索引擎业务以自然语言理解NLP为主,视觉和语音为辅,这就要求AI加速卡能支持多种类型的AI算法,真正实现业务算法的通用化支撑。昆仑芯的产品已经在百度数据中心实现万卡级别的部署上线,目前稳定运行。

数据中心搜索对于业务的实时性和高并发性有很强的要求,对比GPU的主流推理卡,昆仑芯的加速卡能够提供更高的性能,更低的成本,整体TCO降低1/3以上,实现了商业上的降本增效。


应用案例二:工业机器视觉

昆仑芯2代芯片的工业质检方案已规模应用在国内某智能制造企业,实现国内和国际知名品牌的上亿级3C零件的质量检测,完成人工质检的最大化替代,大大节省了人力成本,整体方案大概14个月即可收回成本。同时昆仑芯产品支持“5G+AI+工业互联网”整体解决方案,可大大提高传统企业的智能化水平,帮助企业降低损耗,提升约10%的良品率,提高企业利润。


应用案例三:国产化金融业务

当前银行等金融业务上有大量的证件图片类数据需要人工提取,存在极大的效率和成本瓶颈;同时金融IT国产化水平指标要求,在满足业务需求的情况下期望使用全国产化的解决方案。昆仑芯2代芯片支持大量成熟可靠的商业化OCR模型和算法,硬件上搭载基于国产CPU的一体机,可快速对接客户业务系统实现身份证件等准确的结构化数据抽取,提升业务的执行效率。该方案在2021年成功落地国内某商业银行,在国内率先实现AI能力引擎的全国产化AI解决方案。


企业管理者/IC设计团队/创业团队名称:

欧阳剑先生/昆仑芯AI芯片设计团队/昆仑芯(北京)科技有限公司


企业管理者:

欧阳剑,昆仑芯(北京)科技有限公司CEO,原百度首席架构师,智能芯片业务总经理,基础技术体系联席技术委员会主席。欧阳剑在计算机体系结构和系统领域有长时间的积累,参与过数据中心AI芯片、ARM服务器、软件定义Flash、智能网卡等一系列项目,曾在Hot Chips、ASPLOS、ISSCC等国际顶级会议发表过数篇论文,两次获得中国专利优秀奖。


研究成果:

国内工业界首篇在国际计算机系统及体系结构顶级会议论文(ASPLOS 2014)、2014/2016/2017/2020

4篇Hot Chips(业界最多): 

Baidu Kunlun An AI processor for diversified workloads

SDA: Software-Defined Accelerator for general-purpose big data analysis system

SDA: Software-Defined Accelerator for Large-Scale DNN Systems

XPU – A Programmable FPGA Accelerator for Diverse Workloads.

团队提出100%自研通用AI计算处理器核心架构XPU,性能表现领先业界;


领衔昆仑芯(原百度昆仑)通用AI计算处理器项目,2020年量产的第一代云端通用AI处理器产品——昆仑芯1代,是中国第一款云端全功能AI芯片,也是国内唯一一款经历过互联网大规模核心算法考验的云端AI芯片; 昆仑芯2代芯片于2021年8月量产,是中国首款采用GDDR6显存的AI芯片。

团队介绍:昆仑芯科技团队成员拥有全球顶尖学术背景,多数成员来自百度、高通、Marvell、Tesla等行业头部公司,在数据中心、无人驾驶及生物计算等各类AI场景均有深厚的研发经验。

昆仑芯科技团队于2011年开始启动基于FPGA的AI加速研发,至今已有十余年。昆仑芯科技坚持从产业出发、从场景出发,集十余年人工智能产业技术实践和业务场景历练经验,持续推进核心技术攻关。目前,在团队带领下,昆仑芯1代和昆仑芯2代均已实现量产,在智慧交通、智慧城市、工业质检等多个场景落地,两代产品先后获得“中国芯”优秀技术创新产品奖。

昆仑芯科技团队始终坚持学术成果与工程落地并重的理念,目前已有数篇学术研究成果在Hot Chips、ISSCC等国际顶级学术会议中成功发表,拥有国内外350余项发明专利申请和多项软件著作权,开拓了国内业界人工智能研究领域的先河。除此之外,昆仑芯科技在AI芯片及人工智能相关领域也已构建起了全方位、体系化的知识产权布局,已有多项中国及海外发明专利申请和软件著作权,为公司核心研发保驾护航。


项目名称:

昆仑芯AI芯片


项目背景:

信息技术革命以来,计算机性能飞速提升,人类生产力发展已经进入算力时期,计算能力成为这个时期的新型生产力,AI芯片正成为引领芯片行业未来发展的重要方向。

(1)半导体产业战略地位提升,各国前所未有高度重视.主要国家半导体产业扶持政策大力推进。半导体作为科技产业底层技术、其重要性、战略性不言而喻,半导体供应链全球化、分工化的特征也使得它在当前国际环境中扮演多重角色。以俄乌冲突、新冠疫情、中美贸易战等为代表的“黑天鹅”事件或将重塑半导体供应链体系。此背景下,世界各国将半导体产业上升到国家安全战略层面,中、美、欧、日、韩等纷纷出台大量相关政策支持产业发展。


(2)国内外AI芯片行业发展差距较大,国内半导体行业仍较为落后。人工智能芯片产业链上游主要是为人工智能芯片企业提供算法和IP的行业,目前比较流行的算法有神经网络算法,其中提供算法的知名企业大部分为国外巨头;而从应用领域分类来看,一家独大全球云端训练芯片市场,除此之外还有第三方异构计算平台以及云计算服务商自研加速芯片这两种方案,全球各芯片厂商基于不同方案,都推出了针对于云端训练的人工智能芯片。除了传统芯片大厂涉足云端推断芯片以外,初创公司也加入竞争。中国公司里,昆仑芯、寒武纪、比特大陆等也一直在积极布局云端芯片业务,希望构建自有的产品和生态能力。


 (3)近年来,国家高度关注人工智能芯片产业的发展,发布一系列产业支持政策,人工智能芯片市场取得快速发展。芯片产业是整个信息产业的核心部件和基石,是国家信息安全的最后一道屏障,当前,我国芯片高度依赖进口非常不利于国家安全与行业发展。因此,近年来国家高度关注人工智能芯片产业的发展,相继发布一系列产业支持政策,为芯片行业建立了优良的政策环境,促进芯片行业的发展。

 

昆仑芯(北京)科技有限公司前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约130亿元。在国内最早布局AI加速领域,深耕10余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的AI芯片企业。

 

昆仑芯科技团队成员拥有全球顶尖学术和行业背景。2017年,该团队首次提出100%自研的、面向通用人工智能计算的核心架构昆仑芯XPU,从设计理念上就做到了通用性、易用性和高性能的兼顾,技术设计基于客户和场景真实需求。研究成果也在Hot Chips、ISSCC等国际顶级学术会议中成功发表。

目前,昆仑芯科技已实现两代昆仑芯通用AI计算处理器(即昆仑芯1代、昆仑芯2代产品)的量产及落地应用。两代产品先后斩获2020、2021年中国芯“优秀技术创新产品”奖。昆仑芯1代于2020年量产,在百度搜索引擎、小度等业务中部署超过2万片,是国内唯一一款经历过互联网大规模核心算法考验的云端AI芯片,同时也被广泛部署在互联网、工业制造、智慧城市、智慧交通、科研等领域。搭载新一代架构昆仑芯XPU-R的昆仑芯2代于2021年6月回片并当天点亮,8月量产发布。昆仑芯2代是国内首款采用GDDR6显存的通用AI芯片,相比昆仑芯1代性能提升2-3倍,且在通用性、易用性方面也有显著增强。昆仑芯2代已启动互联网及各行业客户交付,当前商业化进展顺利。

为顺应市场需求的爆发,昆仑芯将持续发力,更先进的昆仑芯3代等多个产品均已启动研发。


昆仑芯1代芯片 & 昆仑芯2代芯片已与智能产业的上下游企业建立了良好的合作生态,通过向不同行业提供以人工智能芯片为基础的算力产品,辐射互联网、智慧城市、智算中心、智慧工业、智慧应急、智慧交通、智慧金融等“智慧+”产业,以计算驱动智能,以智能促进发展。

目前,昆仑芯芯片产品已实现多场景落地,并取得显著的社会效益与经济效益。

 

成果社会效益:

在互联网、工业制造、智慧城市、智慧交通、科研等领域:

实现新一代高性能机器学习芯片在数据中心或超算中心开展应用示范,并推广至自动驾驶、智能家居等人工智能领域更多应用场景。

进一步提升我国数据中心领域机器学习芯片的研究水平和国产化进度,促进国产机器学习框架的应用。最终使得国产机器学习芯片技术上对齐并局部超越国外先进产品,攻克大规模部署应用的挑战。推广至自动驾驶、智能家居等人工智能领域更多应用场景,助力国产人工智能芯片推广、应用以及生态建设。


宜昌市点军区:

2021年,昆仑芯科技充分发挥AI芯片技术优势,助力点军区率先在全市建成50P人工智能算力中心。在此算力支撑下,“超级电脑”可实时分析前端智能设备图像采集范围内的各类行为,实时有效识别各类潜在安全隐患,为城市治理保驾护航。“超级电脑”的诞生,是点军区顺应数字经济发展新趋势、加快推动大数据产业发展的一项重要布局,也是点军区认真落实宜昌市“智慧赋能”战略要点的成功范例。

虎年元宵节,湖北宜昌举行了有史以来规模最大、规格最高的元宵节主题焰火晚会,约有30万市民前来观赏。在这场焰火秀中,“超级电脑”时刻精准地守护着主观赏区域群众的安全。一旦发生异常,“超级电脑”可在秒级时间内提醒现场工作人员进行快捷管理与有效疏散,最大程度地保障了现场市民的安全与健康。借助“超级电脑”,目前该系统已实现对60公里禁钓江段监管的全覆盖,截至2月底宜昌市利用在线指挥监控系统预警非法钓鱼百余起。

 

成果经济效益:

百度:

引入无损低精度推理的方案,软硬件的优化设计,既发挥了定点计算的效率优势,又避免了精度损失。在引入过程中改良了编程模型,动态优化缓存分配,数据流重构等一系列创新技术,充分挖掘算力和架构的优势。

得益于昆仑芯科技的方案,百度搜索业务效果在各个指标上都得到了大幅提升。性能相比原有GPU FP32 和FP16有2倍以上的提升。替代万片以上GPU和相关服务器等,TCO节省上亿降低固定资本投入。这也使百度搜索业务能有更多的算力资源进行新算法开发&迭代。


微亿制造:

在部署了昆仑芯科技产品的智能工厂,机器自动对物体表面的缺陷进行大小、位置、形状的检测,任何微小的瑕疵都能够被直接标记。算法机同时处理24个模型,处理完所有流程仅需480毫秒。通过深度学习算法对于各种缺陷进行学习后,能准确识别产品的全部33类缺陷,漏检率控制在0.1%以内,并能使全检出货达到AQL 0.4标准(极高的合格质量水平)。该设备相对于标传统视觉检测的同类机型,投资回报率是传统机型的 6.5倍。

在【参与的奖项右侧】点击【为他投票/为他评分】

投票领豪礼
活动说明

评分&投票规则:

1. 线上投票/评分时间:2022.8.15-9.14;

2. 奖项揭晓:2022.11.16;

评选结果将于2022年11月16日《第四届硬核中国芯领袖峰会暨2022汽车芯片技术创新与应用论坛》活动现场揭晓,并对获奖企业进行现场颁奖表彰;

3. 评分/投票规则:

产品奖:采用评分制,您可以为所有参评产品评分,不可重复为同一产品打分;

企业奖:采用投票制,您可以为所有参评企业投票,不可重复为同一企业投票;

团队奖:采用投票制,您可以为所有参评团队投票,不可重复为同一团队投票;

项目奖:采用投票制,您可以为所有参评项目投票,不可重复为同一项目投票;

4. 抽奖规则:每次投票/评分后,可参与1次抽奖;

5. 兑奖方式:请正确填写您的个人信息,中奖后,请添加工作人员完成兑奖,实物奖品将于活动结束后寄出!

6. 温馨提示:未正确填写个人信息,中奖记录做作废处理。


奖品由贸泽电子独家赞助提供:

贸泽电子(Mouser Electronics)是全球授权半导体和电子元器件分销商,致力于以高效的方式向电子设计工程师和采购推广新一代产品和新技术, 全面支持研发阶段的采购。Mouser.cn一个芯片也可出货,新一代产品信息和技术内容每日更新,可在线搜寻超过 1200 家品牌制造商的 3100 多万种产品,其中 680 多万种产品可直接在线订购,产品涵盖的应用领域包括工业、机器人技术、物联网、新能源、汽车电子等。想深入了解贸泽电子, 请访问:http://www.mouser.cn

扫描下方二维码,为该企业助力投票!

投票后即可参与抽奖哦

惊喜豪礼等你来拿!

申请加入专家评审团

唐淋(Yeri)

电话:19928756834

微信:gsi24001

邮箱:yeri.tang@gsi24.com

参评联系

董向(Icey)

手机:13266743572(微信同号)

邮件:icey@gsi24.com

芯师爷

今日芯闻

全球物联网观察

Top