全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:13066009665

「计算机基础」CPU历史之AMD系列

  昨天通过文章《「计算机基础」CPU历史之Intel系列》我们知道了Intel系列产品,今天我们继续看看另一个厂商AMD系列产品,笔者现在的台式机吃灰很多年了,是AMD的速龙860K。

  1968 年,仙童半导体的8位创始人中的两位——总经理罗伯特·诺伊斯(Robert Noyce)和实验室负责人戈登·摩尔(Gorden Moore),带着一部分员工离开了陷入资金危机的公司,成立了英特尔(Intel)。而一年后的 1969 年5月1日,桑德斯(之前在摩托罗拉,后来去了仙童半导体Fairchild Semiconductor)也带着 7 个人另立门户,成立了超微半导体(Advanced Micro Devices, AMD)。

  AMD当前处理器分为:服务器霄龙cpu,工作站锐龙线程撕裂者和锐龙pro cpu,嵌入式霄龙,锐龙,R和G系系列嵌入式cpu,笔记本锐龙pro,锐龙和速龙移动cpu,台式处理器锐龙线程撕裂者,锐龙pro,速龙pro,锐龙及搭载显卡的cpu,以及支持chromebook处理器系列

  Ø服务器处理器AMD EPYC(霄龙):先进的 x86 服务器处理器4树立卓越性能、安全和可扩展性新标准。

  Ø工作站处理器AMD 锐龙 Threadripper PRO,锐龙Threadripper,锐龙PRO:借助拥有超多核心的高性能工作站处理器,轻松应对多线程工作负载。

  Ø嵌入式和半定制处理器AMD EPYC(霄龙)嵌入式,AMD 锐龙嵌入式处理器,R和G系列嵌入式解决方案和半定制。

  Ø笔记本电脑处理器面向企业的 AMD 锐龙 PRO 移动处理器:出色的多核性能和超长电池续航 + 优秀的可管理性和额外安全保护。面向企业的 AMD 锐龙移动处理器:疾速响应、多核性能、卓越能效和超长电池续航。AMD 锐龙移动处理器:超多核心为移动处理器带来卓越性能。AMD 速龙移动处理器:面向主流笔记本电脑打造卓越性能和先进功能。面向学生和老师的 AMD 笔记本电脑:AMD 处理器搭载 Radeon 显卡,带来疾速顺畅的网页浏览和视频播放体验,为在线学习环境赋能助力。

  l AMD 锐龙 PRO 处理器:最多可达8个核心,带来出色的性能、先进的安全功能和无缝的可管理性,轻松应对各种严苛业务环境。

  l AMD 速龙 PRO 处理器:专业的安全功能、性能和可管理性,以及卓越的价值。

  l AMD 锐龙 Threadripper 处理器助力高端台式机:最多可达 64 核心和 128 线程,让创意工作疾速非凡。

  l AMD 锐龙处理器:最多可达 16 核心和 32 线GHz 的加速时钟频率和最多可达 72MB 的高速缓存,实力打造非凡卓越的性能。

  l AMD 锐龙处理器搭载 Radeon 显卡:无需独立显卡,即可享受发烧级性能。

  l AMD 速龙处理器搭载 Radeon 显卡:最多可达 4 个先进的“Zen +”3 处理核心和 4 个处理线程,轻松疾速搞定日常办公、网上冲浪和多任务处理。

  l 面向企业的 AMD Chromebook:性能卓越的 AMD 锐龙和速龙处理器为 Chrome 设备赋能,全面加速企业云计算应用。

  l 面向家庭和个人的AMD Chromebook:AMD处理器出色的能效助力打造更轻更薄的 Chromebook,带来超快的连接以及超长的电池续航。

  l 面向学生和老师的 AMD Chromebook:Chromebook 助力用户通过各种多媒体应用、STEM 工具、安全功能和精彩创意,深度融入现代教育的方方面面。

  K5是AMD公司1993年开始开发,并于1996年03月27日发布的第一个独立生产的x86级CPU,之前都是跟随intel,例如逆向8080,发布AM9080。当时为了和zilog Z80对抗,1976年和intel签订协议,作为intel的第二供应商,类似代工厂。后面各种巧合,intel给amd授权,AMD也走性价比路线intel撕毁协定,停止了32位处理器80386的授权,AMD告intel,持续四年多,最后胜诉一直追随不是办法。

  K5系列 CPU都内置了32 KB的一级缓存,Pentium内置的16 KB,在整数运算和系统整体性能方面要比同样时钟频率的Pentium还要好,但K5上市时间比Pentium(93年3月发布)晚了许多,再加上浮点运算能力远远比不上Pentium,一度使得AMD的市场份额大量丧失。

  K5 的竞争对手是 Intel 的奔腾 Pro 系列(于 1995 年发布)和 Cyrix 的 6x86 系列。整数运算性能大约是奔腾 200 的水平,浮点性能则是奔腾 100 的水平,但击败了 Cyrix 的竞品(当时购买的就是cyrix 200的cpu),还是比较中规中矩的,由于出的较晚,第一次尝试效果一般。

  硅谷有个60 人的小公司 NexGen,研发的Nx686 处理器轻松地达到了 180MHz 的核心频率,通过比尔盖茨的撮合, 与NexGen的创始人Atiq Raza(“微处理器设计领域的迈克尔·乔丹”)建立合作关系,将Nx686 CPU 技术用在K6上,可以直接插在socket7主板上,性能和intel pentun II有一拼,成为公司的转折点。

  1999年6月,AMD推出的K7架构处理器比K6更加强势,其主要技术来自DEC公司强大的服务器处理器Alpha 21264,并使用了Alpha架构的EV6总线。与之前的绝大部分非Intel处理器不同,K7架构拥有超越Intel处理器的浮点能力和频率潜力。首款K7处理器被命名为Athlon至今仍是中低端处理器的品牌。

  2001年底,AMD在压力下也推出了新版本的K7处理器进行应对,即Athlon XP,其主要变化是加入了对SSE指令集的支持,以及更高的频率,另外相应的芯片组也开始支持更高带宽的DDR内存,封装基板也从厚重的陶瓷改为了更轻巧、类似Pentium Ⅲ的树脂材质。

  这种裸die封装方式,出现过散热器压碎cpu die的情况,后来封装都加上了一个金属外壳保护die,但感觉上还是少了些生趣。是不是对安装cpu散热器心有余悸,安装起来怎么别扭怎么来,划伤手都是正常的。但是的散热器鱼龙混杂,没有标准的散热器夹具,有没有装散热器很不顺手的情况,

  2003年8月,AMD推出的K8处理器可以说是一款划时代的产品。基于K7但是又三项改变:

  加入了64位指令集,其实64位指令集是intel先提出的并且用在IA64架构安腾(Itanium)处理器上,后来也被迫在消费cpu上也支持64位。

  首次集成了内存控制器,最初支持DDR内存,可以大幅度降低内存与处理器的通信延迟,提升系统整体性能

  放弃了原有的FSB前端总线而采用了HyperTransport总线技术,它采用点对点串行设计,让内存、磁盘、PCI总线控制器之间有了更高的数据带宽和更大的弹性空间。

  除此之外,K8还在K7架构的基础上还加长了整数与浮点流水线,增加了缓存容量,加入温控电路和节能技术,以及增加了对SSE2指令集的支持。第一代K8处理器架构内置单/双通道DDR400内存控制器,一级缓存为128KB,二级缓存为512KB~1024KB。封装上和奔腾4类似加入了金属保护壳,防止压碎。

  2006年第一季度,AMD处理器10年的繁荣期达到顶峰,在X86市场的份额达到近50%,Intel Pentium 4最终完败。不过此时,笔记本平台上的Intel Pentium M处理器却大获成功。成功往往伴随对手失误。

  Tips:2001 年 8 月,Intel 的基于 NetBurst 架构的奔腾 4 系列开始铺货,首批型号代号为 Willamette,频率来到了史无前例的 2GHz。NetBurst 架构的宗旨是采用较长的流水线,通过几乎是暴力提升频率的简单方法来达到提升性能的效果。2005 年 5 月,这次是 Intel,抢先发布了史上第一款双核 CPU:奔腾 D。不过,奔腾 D 是由两颗 P4 的核心共享 FSB 组成,本质上还是没有摆脱高功耗低性能的怪圈。一周以后,AMD 就祭出了自己的双核心处理器:Athlon 64 X2,代号 Toledo/Manchester,制程为 90nm, 吊打了奔腾 D。

  2006年,收购加拿大的显卡企业ATI,从此一蹶不振,后来集中精力游戏主机的关注和新架构ZEN的开发,当前市场上有三大游戏主机,微软Xbox,索尼PlayStation和任天堂Wii都是用AMD处理器。

  Zen的L1缓存在大小和关联性都翻倍了,而且是写回式而不是穿透式。同时采用了非对称 L/S 单元,因为在大多数情况下 load 操作比 store 要频繁得多。指令缓存不再是两个核心共享,同时关联性也翻倍,这将减少缓存未命中的情况。

  “Zen 2”核心在久负盛名的“Zen”架构之上进行了重大更新。主要优势如下:

  一是提升单线程性能,专业名词叫IPC(每时钟周期指令数),毕竟之前几代一直追求多核心为主,是时候把单核性能提升到足够的高度了,不然始终是瘸着脚走路,缺乏长久竞争力。

  二是在维持8核心CCD模块的前提下,统一核心与缓存,提升彼此通信效率,降低延迟。

  为此,Zen3架构对于所有模块都进行了翻新,前端、预取、解码、执行、整数、浮点、载入、存储、缓存等等,每个环节都是焕然一新。

  首先,Zen3设计了一个堪称艺术级的分支预测器,它之后有两条通道将指令送入队列,然后进行分派,一是8路关联的32KB一级指令缓存和x86解码器,二是4K指令的操作缓存(Op-cache)。

  x86解码器的限制是每个时钟周期只能处理最多4条指令,但如果是熟悉的指令,就可以放入操作缓存,每个周期就能处理8条,二者结合指令分发效率就大大提升,相比于Zen2直接上升了一个档次。

  指令分派之后就来到执行引擎阶段,分为整数、浮点两大部分,每个时钟周期可以向它们分派6条指令。

  其中,整数单元还是4个,但更加分散,并增加了一个单独的分支与数据存储单元,提升吞吐量,每时钟周期可以生成3个地址。

  内存方面,每时钟周期可以执行3个载入,或者1个载入加2个存储,再次提升吞吐量,并且可以更灵活地处理不同工作负载。

  前端方面,主要有容量翻番的L1 BTB、更大的分支预测器带宽、更快的预测错误恢复、更快的操作缓存拾取、更精细的操作缓存流水线切换,等等。

  执行引擎方面,主要有独立的分支与数据存储单元、更大的整数窗口、更低的特定整数/浮点指令延迟、6宽度拾取与分发、更宽的浮点分派、更快的浮点FMAC(乘法累加器),等等。

  载入/存储方面,主要有更高的载入带宽(2个变3个)、更高的存储带宽(1个变2个)、更灵活的载入/存储指令、更好的内存依赖检测,等等。

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。

365整形网 方舟号 Axial Fans