• 设为首页
  • 加入收藏
  • 联系我们
  • 语言切换
请选择 进入手机版 | 继续访问电脑版
一牛网 首页 全部资讯 查看内容

国产CPU研究框架——行业深度报告

2021-2-19 11:05  发布者: chy825

阅读 630
导读:目录一、CPU投资逻辑框架1.从指令集架构看CPU市场格局2.CPU产业链:先进制程数字芯片产业链3.当前国产CPU发展的三大路线4.我们如何看待国产CPU未来格局一、CPU投资逻辑框架1.从指令集架构看CPU市场格局2.国产CPU产业 ...
目录
一、CPU投资逻辑框架
1.从指令集架构看CPU市场格局
2.CPU产业链:先进制程数字芯片产业链
3.当前国产CPU发展的三大路线
4.我们如何看待国产CPU未来格局

一、CPU投资逻辑框架
1.从指令集架构看CPU市场格局

国产CPU研究框架——行业深度报告


2.国产CPU产业链一先进制程数字芯片产业链

■CPU是数字芯片,基于制程越小,性能越好的规律,¢PU产业链是先进制程数字芯片产业链

■当前国产PU产业链进口替代:设计环节,华为鲲鹏,飞腾等龙头已经跻身世界一流水平,封测环节,通富承接AMD7 nmCPU封测,14nm及以下结点的先进制程,设备、材料、EDAP、制造等环节与国外领先龙头差距较大,目前仍采用“外循环为主+内循环为辅”的模式。

海外CPU产业链一先进制程数字芯片产业链

■CPU产业链的巨头大多集中在海外,它们位居产业链各个环节核心,对全球CPU行业起着决定性的作用。

■设计环节:英特尔和AMD几乎垄断通用型CPU的市场;设备、材料、EDAP等环节国内龙头与国外龙头差距较大,国产化率较低;制造环节:目前只有台积电三星有5nm制程生产能力,但均需使用美国设备封测环节:目前中国台湾、中国大陆、美国三分天下。


3.当前国产CPU发展的三大路线

指令集授权方式 技术路线 自主化程度
IP内核授权 ■基于指令系统进行SOC集成设计
■Ⅹ86内核授权
■自主化程度:低,未来扩充指令集难度较大,但生态迁移成本小、性能高
■缺点:安全基础不牢靠
指令集架构授权 ■基于指令集架构授权自主设计cPU核心
arm指令集授权
■自主化程度:较高,安全基础相对牢靠、拥有自主发展权
■缺点:生态构建较为困难
授权+自主研制指令集 ■自主研制指令集
■M|IPS架构+自研
■ Alpha架构+自研
■自主化程度:极高,申威已基本实现完全自主可控
■缺点:生态构建极其困难

4.我们如何看待国产CPU未来格局

除了先进制程某些环节缺失以外,国产CPU还存在一个严重的短板,即来自于国内CPU生态建设的落后生态对于CPU产业影响极大。上世纪90年代,以复杂指令集为代表的英特尔凭借着与微软的 Wintel体系,在通用CPU领域占据了绝大多数份额,至今仍牢不可破。精简指令集则被逐渐挤压到嵌λ式市场,后来智能手机兴起后才获得新生:ARM通过构筑与 android的生态合作(AA体系),占据了全球95%的移动芯片授权市场

■对于X86内核授权的厂商:生态最为完善,但发展存在安全可控和技术授权两大壁垒,海光自去年被美国政府列入实体清单后,AMD表示最新的架构不再进行授权,兆芯使用威盛电子的x86早期授权,性能相对落后。

■对于Arm指令集授权厂商:生态体系与安全可控最为平衡,且通过架构授权把握主动权,随着Arm生态愈发繁荣,若不考虑美国实体清单的负面影响,前景最为光明对于自硏架构厂商:完全自主可控的引领者,厚积而薄发,其最大的瓶颈在于生态壁垒总结:目前国产CPU主要需求来自服务器、政企、工业等市场,鲜少出现在消费级市场。我们以为基于安全的自主可控是推动国产cPU成长的主要力量,且基于架构的差异性带来的应用不同,我们认为指令集架构不会直接消亡,不同架枃都会行生出行业龙头,考虑通用CPU等格局极为稳固,可关注物联网以及汽车等新兴领域。


二、详解CPU:IC产业中的“珠穆朗玛峰”

1.CPU的定义及内部结构

2.CPU的指令集与微架构

3.CPU发展历程与未来趋势剖析

4.CPU的需求侧与供给侧分析


1.CPU定义和内部结构

■中央处理器( Central Processing Unit)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元,CPU核心主要是由大量的运算器、控制器、寄存器组成。

■运算器负责算术运算和逻辑运算。控制器负责应对所有的信息情况,调度运算器把计算做好。寄存器既要承接控制器的命令,传达命令给运算器;还要帮运算器记录已处理或者将要处理的数据。

■几乎所有的CPU的运作可以简要概括为“取解码”和“执行”三大步骤,此三个步骤统称为指令周期通常,CPU核心从存储单元或内存中提取指令。然后,根据指令集由指令解码器执行解码,将指令转换为控制CPU其他部份的信号。最后通过运算器中的微架构进行运算得到结果。

■CPU内核的基础就是指令集和微架构。

国产CPU研究框架——行业深度报告


2.CPU指令集概述

■cPU指令集( nstruction Set)是CPU中计算和控制计算机系统所有指令的集合。

■指令集包含了基本数据类型,指令集,寄存器,寻址模式,存储体系,中断,异常处理以及外部J/,一系列的 opcode即操作码(机器语言),以及由特定处理器执行的基本命令。

■指令集一般被整合在操作系统内核最底层的硬件抽象层中。指令集属于计算机中硬件与软件的接口,它向操作系统定义了cPU的基本功能。

■现阶段的指令集可以被划分为复杂指令集(CsC)与精简指令集(RISC)两类。

国产CPU研究框架——行业深度报告


3.CPU指令集:RISC剖析

■精简指令集采用小型,高度优化的指令集而非更复杂和特定化的指令精简指令集的主要特点是通过大量寄存器和髙度规则的指令流水线优化了指令集,从而使毎条指令的时钟周期数减少。

■精简指令集的另一个特点是读取/存储结构,在该指令集中存储访问必须通过完整的特定指令而不是特定指令中的-部分。

■精简指令集的思想成立于1970年代,成熟于1980年代。斯坦福大学的MPS指令集和伯克利分校的 SPARC指令集是当时的先驱。随着2010年RSCν的推出,精简指令集进入了开源的第五世代。

■目前,精简指令集被广泛地运用于眢个领堿。以ARM为代表的精简指令集被广泛地运用于手机、平板等移动终端。日本富岳超算也运用精简指令集,登顶2020年6月的超算排行榜。

国产CPU研究框架——行业深度报告


4.CPU指令集:CSC与RSC特点的对比

■CSC与RSC无论哪一方都没有绝对的优势或劣势。

■丛硬件角度分析:CSC采用的是不等长指令集,因此在执行单条指令时需要较多的处理工作,但是它的优势往往在于部份特定专业领域的应用。而RSC执行的是等长精简指令集,CP在执行指令的时候速度较快且性能稳定,因此RSC适合采用流水线方式运作,且在并行处理方面明显优于CSC。

■丛性能角度分析:CSC阵营的ntel和AMD在提升芯片性能上做岀了持续的努力,CISC芯片的功耗被放在了性能后的第二位;而RISC-ARM本身出现时间较CSC-X86晚十年左右(ARM诞生于1985年,X86诞生于1978年),ARM、MIPS在创始初期缺乏与Intel产品对抗的实力,专注于以低功耗为前提的高性能芯片。

SC复杂指令集 SC精简指令集
指令系统 使用频率差别大,可变长格式 使用频率接近,定长格式,大部分为单周期指令,操作寄存器,只有Load&nBSP;Store操作内存
指令数 一般大于200 一般小于100
通用寄存器数量 较少
寻址方式 支持多种,一般大于4 支持方式少,一般小于4
实现方式 微程序控制技术 增加了通用寄存器;硬布线逻辑控制为主;适合采用流水线
控制方式 主要为微程序控制 主要为硬布线控制
应用场景 95%以上的PC和服务器市场 95%以上的移动计算市场
其他 研制周期长 优化编译,有效支持高级语言

5.CPU指令集:CSC与RSC发展趋势与阵营对比

■CSC与Rlsc从上世纪后期已经在逐步走向融合,并且该趋势持续至令。例如2005年苹果通过引入Rosetta将原先BM的 power pc指令集转译为英特尔处理器接受的X86指令集。2020年苹果发布基于ARM指令集的M1处理器后,将 Rosetta更新为 Rosetta2以便将原英特尔的X86指令集快速转译为M1的ARM指令集。

■整体来看,以高通骁龙联发科,三星 Exynos,苹果A系列为代表的ARM架构RSC处理器占据了移动处理器的市场。而在个人电脑领域以 Winte联盟为基础的X86架构CSC处理器占据了该市场。MPS, Power, Alpha等架构虽然已经不是市场的主流,但在特定领域内仍然在被使用。


6.CPU指令集的软件生态对比

■软件生态方面,X86远行的主要为DoS,非ARM版 Windows,旧版 MacOs等操作系统,起步早,基Vinte联盟,生态完善。全世界有65%以上的软件开发商都为X86提供生态服务。

■ARM方面运行的主要有安卓IOS, iPadOS, Windows10移动版, Macos Big Sur等。原先适应X86指令集的软件需要经过翻译后才可运行,如苹果的 Rosetta2可以将86指令转换为ARM指令,所以运行速度会减慢。

■ARM成本低,选代快,其软件生态正在加速追赶X86的软件生态,苹果应用商店软件数量从2008年7月的5万个发展到2020年的342万个。同年 Google Play商店有270万款可供下载的软件。


7.CPU微架构定义

■微架构是( MICro Architecture)一种给定的指令集架构在处理器中执行的方法。相同的指令集可以在不同的微架构中执行,但实施的目的和炇果可能不同。优秀的微架构对℃Pυ性能和能提升发挥着至关重要的作用。计算机体系是微架构和指令集的结合

■众多的算数单元、逻辑单元和寄存器文件在三态总线和单向总线,以及督个控制线的连接下组成了cPU的微架枃。计算机的总线组织由CPU的复杂程度决定,二者常同向变化

■CPU微架构中常见的单元有执行端口、缓冲单元、整数运算单元、矢量运算单元等。

国产CPU研究框架——行业深度报告



8.CPU微架构工作流程概述

■CPU的每个核心有独占的L1指令缓存、 L1数据缓存和L2缓存,多数核心共享L3缓存。所有缓存中L1缓存通过虚拟地址空间寻址,L2/L3通过线性地址空间寻址。

■CPU非核心部分主要是 system Agent(系统代理):包含PCU(电源控制单元)DM控制器与ICH连接、QP控制器与其他CPU连接、内存控制器。

■微架构工作流程概述:以英特尔的 Sandy Bridge(右图)为例,CPU先使用取指令单元(右图紫色部份),将代码段从内存中取出通过解码单元(右图橘色部份)将机器码按序转化为定长的uop(微操作),发射到 uop Decoder Queue(微操作解密等候区);乱序单元(右图黄色部份)从微操作解密等候区中取岀微操作,根据执行条件,依赖关系,重新排序后发送到Scheduler(调度器);调度器将计算指令发送到计算单元(右图蓝色部份),得到计算结果;将内存读写指令发送给访存单元(右图绿色部份),完成内存读写。


9.CPU微架构:取指单元

■微架构通过执行指令"exec()“,执行某个二进制数时,该二进制数首先被kernel(核心)从硬盘加载到内存。

■Instruction FETCh Unit执行获取单元)会按照执行顺序将bin的代码段,从内存中读入到cPU。当遇到分支代码时,需要查询 Branch Predictors(分支预测)。执行获取单元增加访问电路,可以并发地访问内存、寄存器,解决流水线气泡问题

■在 Precoded(预解码)中解码的X86指令集,会被保存到nstruction Queue(指令等候区),等待解码。

■现在的cPU均使用超标量的结构。例如 Sandy Bridge是16条。每个 CPU cycle有16个操作在并行执行,需要系列设计来保证流水线不被中断。


相关阅读
发表评论
引用 zuoxiaomo1 2021-2-20 10:41
什么时候赶上别国

查看全部评论(1)

一牛网,为研发而生!一流电子通讯技术门户网站 一牛网官方微博
深圳市宝安区西乡大道300号华丰金源商务大厦A座四楼3A15-3A19 客服热线:0755-23726406   业务QQ:2064607811

营业执照 | EDI证 | ©2013-2016 www.16rd.com 深圳一流网络技术有限公司版权所有

| 一牛网 ( 粤ICP备13053961号 )|网站地图 |Sitemap GMT+8, 2021-3-4 02:12