Adreno616和malit720性能-G52,哪个性能更好

  • 量子点技术AI画质算法自动识别播放场景,采用鸿鹄818芯片(双核A73+双核A53 CPU构架)以及自动升降摄像头,60帧一碰投屏手机智慧控屏,智能家居控制
  • 特色分类:LED电视,智能电視,4K电视,HDR电视;屏幕尺寸:75英寸;观看距离:3.5米以上;机身尺寸:含底座:47.9×341.1mm 不含底座:8.2×59.9mm;功耗:214W;
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕呎寸:65英寸;观看距离:3.5米以上;机身尺寸:含底座:6.6×282.1mm 不含底座:0.3×59.9mm;能效等级:二级能效;功耗:195W;
  • 特色分类:量子点电视,智能电视,4K电视,HDR電视;屏幕尺寸:55英寸;观看距离:4.5米;机身尺寸:含底座:2.3×261.3mm,不含底座:3.5×58.7mm;能效等级:二级能效;功耗:170W;
  • 特色分类:LED电视,智能电视,4K电视,HDR電视;屏幕尺寸:55英寸;观看距离:3.0-3.5米;机身尺寸:含底座:9×241.3mm 不含底座:8.4×74.3mm;
  • 小米电视5 65英寸,4K广色域屏幕全面屏设计,97%高屏占比6.02mm纤薄金屬机身,标配4单元喇叭内置小爱同学。
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:55英寸;观看距离:3.0-3.5米;机身尺寸:含底座:×338mm 不含底座:×70mm;能效等级:二级能效;功耗:214W;
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:55英寸;观看距离:3.0-3.5米;机身尺寸:含底座:×280mm 不含底座:×76mm;能效等级:三级能效;功耗:150W;
  • 70英寸4K HDR大屏体验大腔体发声单元,支持多格式文件直读以及投屏可满足办公需求内置小米同学+PatchWall,能够轻松控制和管理智能家庭设备
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:55英寸;观看距离:3.0-3.5米;机身尺寸:含底座:3.3×250.2mm 不含底座:7.2×50.9mm;功耗:114W;
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:55英寸;观看距离:3.0-3.5米;机身尺寸:含底座:3.3×250.2mm 不含底座:7.2×59.9mm;能效等级:二级能效;功耗:114W;
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:65英寸;机身尺寸:含底座:×290mm 不含底座:×95mm;能效等级:三级能效;功耗:200W;
  • 尛米电视大师82英寸采用了星幕锐影背光系统,10.7亿原色120Hz MEMC,AI大师引擎+HDR并支持杜比全景声。
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:65渶寸;观看距离:3.5米以上;面板类型:IPS硬屏;屏幕刷新频率:60Hz;屏幕响应速度:6ms;CPU:1.5GHz 四核;GPU:G51 四核;机身尺寸:含底座:×326mm;能效等级:二級能效;功耗:175W;
  • 特色分类:智能电视,4K电视,HDR电视;屏幕尺寸:55英寸;观看距离:4.5米;面板类型:AAA级;屏幕刷新频率:60Hz;屏幕响应速度:8ms;CPU:四核Cortex-A73+A5364位SOC芯片;GPU:双核malit720性能-G51;操作系统:Android 8.0/64位电视系统;机身尺寸:含底座:×253mm;不含底座:×50mm;能效等级:三级能效;功耗:129W;
  • 特色分类:智能电视,4K电视,HDR电视;屏幕尺寸:65英寸;观看距离:5.0米或以上;面板类型:AAA级;屏幕刷新频率:60Hz;屏幕响应速度:8ms;CPU:四核Cortex-A73+A5364位SOC芯片;GPU:双核malit720性能-G51;操作系统:Android 8.0/64位电视系统;机身尺寸:含底座:×318.5mm;不含底座:×50mm;能效等级:三级能效;功耗:159W;
  • 华为智慧屏X65采用了4K HDR超高清OLED超薄铨面屏2400万超广角AI摄像头,14喇叭全屏声墙并搭载鸿蒙HarmonyOS 1.1操作系统。
  • AI;机身尺寸:含底座:×416mm
    不含底座:×84mm;能效等级:二级能效;功耗:300W;

  • 750MHz;操作系统:Patchwall智能交互系统;机身尺寸:含底座:8.8×903.4mm,不含底座:.2×850.9mm;能效等级:三级能效;功耗:180W;产品简介:小米科技在美国拉斯维加斯CES 2017中召開了2017年来;

  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:75英寸;观看距离:3.5米以上;机身尺寸:含底座:×335mm 不含底座:×86mm;能效等级:三级能效;功耗:290W;
  • 特色分类:LED电视,智能电视,4K电视,HDR电视;屏幕尺寸:65英寸;观看距离:3.5米以上;机身尺寸:含底座:×338mm 不含底座:×70mm;能效等级:②级能效;功耗:214W;

《》一文中我们把2012年的移动处理器的厂商做了一番介绍并依照各自的属性给划分了门派。既然把他们称为江湖门派那么每一个门派总要有自己的绝活。移动处理器厂商中CPU基本都是源自ARM同架构下各家厂商的表现都几乎相同。能成为镇派之宝的绝学都是在GPU上近日奉上续作。对五大移动GPU厂商进行了逐一點评——

做能移动处理器的厂商能够洋洋洒洒列出几十家我们精挑细选了近年出过风头的依旧有13家,可是说到设计GPU核心这个名单就短哆了,基本的厂商甚至不到5家


2012年的移动GPU份额调查

作为移动处理器的兴许篇章,今天我们就来介绍一下移动处理器中GPU厂商的情况我们仅僅选了5家我们平时接触到相关产品的厂商——Imagination、高通、ARM、NVIDIA、Vivante

DMP和Takumi尽管份额不比ARM低可是我们身边还真没多少处理器使用他们的GPU方案。

机是┅样的机GPU上见高低。

移动GPU的影响实例:不同机型画质大不同

在水果与机器人的战争中iOS阵营的应用软件及游戏表现的非常统一。特别是茬游戏方面iPad mini这样的规格精简版表现普遍都会好于Android版,Android阵营中高帅富机型与DS机型齐飞同一个游戏在不同机型上的表现环肥燕瘦,各不相哃


《史诗城堡》benchmark中不同机型画质不一

以之前測过的一款名为《史诗城堡》的benchmark为例,它在高通、NVIDIA、PowerVR、malit720性能等GPU上的画质表现差异非常大有嘚地面纹理非常清晰,有的就直接非常模糊锯齿严重。

这个问题既不是第一次被发现也不是第一次有解释。非常多玩家都已经知道了造成这样的画质区别的主要原因是游戏的纹理数据不一样,再深入一点就是游戏开发商针对每一个处理器平台的特点使用了不一样的纹悝压缩格式那些重点照应的GPU的游戏画面会非常美丽,之外的GPU有可能会存在各种问题

由于移动GPU的性能弱、带宽低(下文还有解释)。游戏模型的纹理不可能非常精细至少不能跟桌面GPU相比(手机的小屏幕、高PPI已经帮着遮羞不少了),在带宽有限的情况下哪种纹理压缩格式压缩比更高、画质损失最小就成了关键游戏开发商选择支持哪种纹理压缩格式就带来了画质上的不同。

眼下五大GPU厂商中每家的移动GPU产品至少都会支持一种通用的纹理压缩格式有的还支持自己的独家纹理压缩技术。简单来看一下

OpenGL ES 3.0中还引入了ETC2、EAC纹理压缩格式,二者基本一致仅仅呮是EAC主要用于1-2通道数据的情况。

眼下ECT2还在改进中除了高通的Adreno 320之外还没有移动GPU支持,Tgera 4也不行

说到S3TC,之前苹果和HTC大打专利战的时候就涉及箌了这个标准S3已经归为VIA威盛旗下,HTC和威盛又有同一个老板——王雪红为了支援HTC打专利战,威盛去年就把S3部门出售给了HTC算是左手倒右掱吧。

眼下来说我们能经常使用到的纹理压缩主要是ETC、PVRTC、S3TC、ATITC这四种种

主流紋理压缩格式优缺点

先来看压缩比。假设无失真的PNG容量是5.4MB那麼S3TC和ETC都能压缩到1.1MB,PVRTC压缩最高可压缩到528KB,只是PVRTC的问题在于它仅仅支持PowerVR系列GPU有排他性,高通的Adreno支持的ATITC相同有排他性其它厂商并不支持。

ETC昰最通用的纹理压缩格式只是ETC并不招厂商待见。由于ETC纹理压缩不支持Alpha通道仅仅能用于压缩不透明的材质。只是ETC也有自己的长处差点兒全部的安卓设备都能够支持ETC压缩的GPU加速。

S3TC不管压缩速度还是压缩比都不错也支持GPU加速,并且是桌面显卡通用的压缩格式看起来是最唍美的选择,可惜的是移动市场跟PC不一样大家各自为王。NVIDIA如今还没强大到让其它GPU厂商低头採用S3TC标准的程度由于S3TC说究竟还是一种私有的標准。有专利上的麻烦

ETC2压缩标准补全了ETC1不支持Alpha通道的缺陷,支持更高质量的RGBA(RGB+Alpha)压缩而ARM提出的ASTC标准在压缩速度和质量上比S3TC要好,可是这两種压缩格式都是新出的支持的厂商实在太少了。

移动GPU相对桌面级的GPU仅仅能算是未长大的小孩子

尽管小孩子在某些场合也能比成人更有優势(比方杂技、柔术之类的表演),但在力量上还是有先天的区别主要表如今理论性能和带宽上。

与桌面GPU动辄256-bit甚至384-bit的位宽、1.2-1.5GHz的高频显存相仳移动GPU不仅要和CPU共享内存带宽,并且普遍使用的是双32-bit位宽、LPDDR2-800或1066左右的内存系统总带宽普遍在10GB/s以内。悲催的Tegra 3使用的还是单通道内存模式搭配DDR3L的带宽只是6.4GB/s。

移动处理器中内存带宽最高的是iPad 3/4由于他们使用Retina屏幕,的高分辨率对GPU带宽要求更高只是就算是这两款产品,17GB/s的带宽與PC显卡上动辄200GB/s以上的带宽相比还是小儿科了

没有高带宽就没有大容量纹理数据。也就不会有高画质尽管带宽不是制约移动GPU发展的唯一洇素。可是在眼下的限制下移动GPU厂商关心的头等大事就是怎样在尽可能小的带宽需求下提升GPU性能及画质。

前面介绍的纹理压缩是一个方法另一种就是使用不同的渲染方式,主要有IMR、TBR及TBDR等

伤不起的“马上渲染模式”——IMR

IMR(Immediate Mode Rendering)就如字面意思一样——提交的每一个渲染要求都会馬上開始。这是一种简单而又粗暴的思路长处缺点都非常明显。假设不用为性能担忧这样的方式会非常省事,可是IMR的渲染实行的是无區别对待那些遮蔽处理的部分依旧会被渲染处理器,这也导致无意义的读写操作很多其它浪费了大量性能和带宽。

总之IMR这样的渲染方式在移动GPU上的评价仅仅能是“负分,滚粗!

变聪明了的“贴图渲染”——TBR

IMR傻大粗的做法不可取那就来一个聪明点的方式——TBR(Tile Based Rendering。贴图渲染)它将须要渲染的画面分成一个个的区块(tile)。每一个区块的坐标通过中间缓冲器以列表形式保存在系统内存中

这样的渲染方式的长处就昰相对IMR降低了不必要的渲染任务,缺点就是遮蔽碎片依旧会少量存在并且须要中间缓冲器。


TBR渲染将游戏画面分为不同的区块

再次进化的渲染方式登场——TBDR

它跟TBR原理类似可是使用的是延迟渲染(Deferred Rendering)。合并了完美像素通过HSR(Hidden Surface Removal,隐藏面消除)等进一步降低了不须要渲染的过程降低叻带宽需求。

实际上这些改变和PC上的渲染有些类似


TBDR渲染的一个关键是延迟渲染

TBDR主要是Imagination在使用。这是他们最大的筹码之中的一个其它几镓厂商用的都是TBR技术。

在微软的DX11.1升级中也有提到支持TBDR由于Windows 8系统还专门为平板和触控优化,对TBDR这样的移动平台经常使用的技术加以优化也昰必定的

Imagination技术公司并不介入ARM处理器生产。他们专注于是移动GPU技术授权

由于专业所以强大,Imagination绝对是移动平台GPU授权的老大即便是Intel的Atom处理器及桌面的GMA 500也使用了PwerVR系列GPU核心。他们的触角伸得非常广并不局限于ARM阵营。

Imagination也是一家英国公司早前还有个部门VideoLogic。在3D加速卡方兴未艾的那個年代VideoLogic也曾參与了Voodoo、NVIDIA、ATI等公司激战3D加速卡的战役,可惜终于存活的仅仅有NVIDIA和ATI(AMD)只是失之东隅收之桑榆,Imagination的移动GPU技术部门PwerVR反倒有所收获茬移动市场上他们又能够鸟瞰NVIDIA了。

Imagination公司的授权伙伴主要有Intel、苹果、联发科、LG、高通、瑞萨、三星、海思、Marvell、索尼等等差点儿都是大腕,當中Intel和苹果还是Imagination公司的大股东之中的一个

近年来Imagination公司也不再满足于移动GPU技术授权了。

去年底以1亿美元的代价收购了MIPS公司的专利和资产巳经把MIPS架构融入到自家Mtera处理器中了。CES展会上Caustic公司展出了Caustic 光线追踪加速卡,而这家公司也被Imagination收购了看来他们的业务范围还在扩大。

图形規范方面PowerVR SGX 5XT依旧支持OpenGL ES 2.0/1.1、DX9。只是该系列依旧添加了新元素自SGX 544開始支持PVRTC2纹理压缩格式。全系列引入了部分OpenGL ES 3.0中才有的技术比方MRT多目标渲染、遮蔽查询、无缝立方体映射、浮点纹理等新功能。

当然这么高的性能仅仅有PowerVR 6系列的的旗舰型号能够达到,从高到低总计有G6630、G6400、G6430、G6200、G6230、G6100等型号当中G6100、G系列专为核心面积优化,适合组成单核、双核或者四核设计

Imagination能成为移动GPU的老大显然会有非常多独特优势和技术。他们的GPU不昰性能最强的也不是核心面积最小的,只是单位功耗性能、单位面积性能表现都非常强多核集成、配套的开发工具、纹理压缩格式、TBDR渲染技术都是他们冲锋陷阵的利器。综合起来PowerVR就是表现最棒的移动GPU授权之中的一个

堆砌大篇PowerVR详细架构的文字也没什么意思,当中一个让囚感兴趣的问题是PowerVR 5及5XT是否使用了统一渲染架构

从找到的资料来看。PowerVR的USSE引擎中第一个U代表的意思在眼下的官网上是指Universal通用可是早期的公咘新闻上这个U代表的是Unified,也就是统一渲染的意思

再考虑到PowerVR 5是在2005年宣布的。桌面级的统一渲染架构是2006年公布的这就能够说明Imagination的技术实力昰多么强大。

点评与展望:PowerVR 6啥时候上市

对一个占领了绝大多数市场份额的公司也没有继续赞扬的必要了苹果、联发科等大客户的销量就能说明一切。尽管公布了好几年了PowerVR 5/5XT依旧是眼下追求极致游戏性能的最佳选择之中的一个。

问题是PowerVR 6架构公布及PPT宣传都快一年半了,如今連影子都没

PowerVR 6的性能提升非常夸张。制程工艺及实际应用都要跟得上才行前几天正好有新闻说Imagination联合台积电宣布将使用后者的16nm FinFET工艺制造,這一下子就给支到至少2014年了

公布时PowerVR 6已经有6家厂商买了的授权,当中三家是德州仪器、联发科和ST-Ecricsson(意法-爱立信)还有三家没宣布。只是结合の后的消息来看三家没公布名称的厂商至少有海思而LG也在今年的CES展会上首次公布了PowerVR 6平台,说明他们也在授权内瑞萨也展示过PowerVR 6平台,算起来几乎相同就是这三家了苹果是否愿意获得PowerVR的授权就不得而知了。

仅仅是时过境迁TI眼下退出了消费级嵌入式处理器市场,意法-爱立信也关闭了即便是公开展出的PowerVR 6也全都是大块头,集成到智能手机和平板所用的超低功耗处理器中还非常远

江湖富二代——ARM公司的malit720性能

ARM公司不仅提供ARM处理器授权。他们也有一整套GPU授权方案——malit720性能由于亲生的血缘关系,malit720性能在好爸爸ARM的帮助下也攻城掠地非常多不具备獨立开发GPU技术的芯片供应商都直接使用了ARM处理器+malit720性能 GPU的设计,比方三星、瑞芯微、展讯、意法半导体、全志等当中三星和全志还是出货量大户,所以malit720性能 GPU的份额和出货量可不低

ARM官网显示malit720性能 GPU在智能电视和Android平板中占有率第一,智能手机市场占有率超过20%2012年出货量高达1亿(一說是1.5亿),使用malit720性能 GPU的终端超过200多种

说到malit720性能的历史。ARM原本也是没有GPU授权的此前他们也是使用Imagination的GPU核心。malit720性能事实上是源于2006年收购的一家挪威特隆赫姆地区的移动GPU芯片厂商Falanx

ARM公司的malit720性能 GPU开发中心也就落户在哪里,如今malit720性能已经变成了ARM的亲儿子了

malit720性能-400 MP在malit720性能-30初级上做了改进。制程和频率不变只是L2缓存可配置8-256KB,而MP后缀的添加意味着malit720性能-400可配置多个GPU核心每一个核心包含内存系统在内核心面积为4.7mm2,最多可配置4個核心三星Galaxy S3中使用的Exynos 4412就是malit720性能-400 MP4的配置,由于32nm

malit720性能-T600系列是去年才開始露面的新一代产品支持OpenGL 3.0和DX11规范,使用了统一渲染架构支持OpenCL和DirectCompute加速,T600系列实际上也发展了两代了露面最早的malit720性能-T604是第一代,malit720性能-T624/628/678等兴许产品则是第二代架构了

ARM没有公布malit720性能-T604的详细频率及核心面积、性能,仅仅说是前代产品的5倍性能

malit720性能-T624的规格參数基本与T604一致,只是核心升级到了第二代MidgardT628最多能支持8核配置。

昙花一现的malit720性能-658还是第一玳Midgard架构如今已经被二代Midgard架构的T678代替,之前的资料显示T658的性能是malit720性能-400 MP的10倍计算性能是后者的4倍,malit720性能-678仅仅会比这个指标更强

malit720性能-T600还支歭ARM开发的ASTC纹理压缩格式,如今已经成为OpenGL ES规范中的一个可选纹理标准其压缩率更高,内存带宽要求更低

ARM的malit720性能 GPU给人的感觉更像是PC中的公蝂显卡一样,积极支持各种最新标准注重性能功耗比。以malit720性能-400 MP4为例整合256KB L2缓存及内存之后核心面积也仅仅有6.8mm2。40nm LP工艺及250MHz频率下像素填充率僦有1000MPix/s28nm工艺的Tegra 4的GPU核心面积10.5mm2。像素填充率为2688MPix/s可是它的频率高达672MHz。malit720性能-400 MP4假设使用相同的工艺和频率的话性能不会比它差malit720性能-T600系列号称相同核心面积下IPC性能提高了50%。

可是malit720性能 GPU的问题在于眼下授权使用的大部分还是malit720性能-400 MP下面的malit720性能-450 MP都没有多少厂商集成。malit720性能-T604除了在三星的Exynos 5250中有過应用公布过一年多以来未见其它处理器集成。

即便是三星这个老朋友新一代的Exynos 5 Octa也改用PowerVR的GPU核心了。malit720性能又少了一个可靠的合作伙伴

盡管三星的换门会给malit720性能带来一些短暂的麻烦,只是ARM的CPU+GPU一条龙方案对非常多实力不足的厂商还是有非常强的吸引力在中低端市场malit720性能 GPU依舊有自己的一席之地。份额不可小视

未来的和尚会念经——高通的Adreno

作为屈指可数(不是唯一一个)能够自己改进ARM指令的移动处理器厂商。说高通是安卓阵营移动处理器一哥估计没人会反对再加上高通的3G技术及基带上的优势。高通处理器绝对是近年来最热门的选择之中的一个顺带着也把高通的Adreno图形核心带火了。

跟ARM亲生的儿子malit720性能几乎相同高通的Adreno事实上也是领养的。

Adreno原本是ATI旗下的移动GPU部门当时叫做Imageon,主要為当时的掌上平台提供图形核心

2006年AMD收购了ATI。Imageon部分也进入了AMD公司收购ATI之后AMD就进行了改组,Imageon部分非常不幸地成为多余资产终于在2008年末被高通以区区6500万美元的代价买走,如今就是高通的Adreno图形部门了(不知道AMD看到如今的情况是否会懊悔?)

高通与AMD的纠葛还没有完去年2月份AMD当时嘚CTO Eric Demers也低调离职,他没有添加NVIDIA或者Intel终于去了高通公司去负责移动GPU的发展,AMD后来则挖到前苹果副总Mark Papermaster做新任CTO这也算是AMD对2009年时任CTO加盟苹果的报複吧。

220系列的资料也非常少眼下仅仅知道二者的架构基本是一致的,使用了统一渲染架构(高通原话)都是8组渲染管线,每组渲染管线中囿4个矢量ALU单元和1个标量ALU单元组成矢量单元可执行4个MAD指令操作。只是标量单元不能执行MAD指令因此每组渲染管线依旧是每周期执行4个MAD指令嘚能力。

随着四核APQ8064处理器的上市高通处理器的GPU眼下已经转向了Adreno 320了。骁龙S4的升级版骁龙600集成的也是Adreno 320不论架构还是性能都比之前的Adreno 22x系列都囿明显优势。

尽管前面的220/225中高通也说是统一渲染架构可是Adreno 320才是高通第一款真正意义上的统一渲染架构的移动GPU。支持最新的OpenGL ES 3.0规范加强了GPGPU通用计算的比重。性能比前代Adreno高了3-4倍

即便是眼下来说,已上市的四核处理器中APQ8064的图形性能也是拔尖的除了华为的Ascend D2之外,其它5寸1080P手机基夲都使用了APQ8064处理器


CPU和GPU都能够加速游戏性能提升

今年初高通又公布骁龙800处理器,与骁龙600继续使用Adreno 320(尽管也会有所改进)不同骁龙800将使用更新嘚Adreno 330。高通表示Adreno 330的性能是Adreno 320的1.5倍计算性能则是它的3倍。并且会支持Ultra HD标准的4K视频听着非常诱人,只是实际体验还得等相关产品上市再说也偠到下半年了。

不管从哪方面看高通用6500万美元收购AMD旗下的移动图形部门都是一笔超划算的买卖。Adreno带给高通的收益恐怕是一百个收购额也仳不了的

对高通来说。就算不考虑Adreno图形核心的性能怎样仅凭着高通在CPU和基带上的优势,Adreno都能在整个市场上保留一席之地更何况眼下嘚Adreno 320依旧是图形性能最高的移动GPU之中的一个,大者恒大还是有道理的

在移动处理器这个江湖里NVIDIA算是后起之秀,前一篇的移动处理器门派划汾中我们将其归为“峨嵋派”尽管开宗立派时间短。可是后来居上再加上NVIDIA在PC市场的影响力。他们尽管是资历最浅的外来户但在GPU技术仩实力雄厚,前途无量

第一代的Tegra尽管也曾被微软的Zune HD青睐。只是眼下来说已经是古董级产品了NVIDIA官网也将其除名,介绍的仅仅有Tegra 2、Tegra 3和Tegra 4我們也从他们说起吧。

NVIDIA的移动处理器往往是公布最早的Tegra 2是世界首款双核Cortex-A9架构处理器,Tegra 3是首款四核Cortex-A9处理器Tgera 4则是公布最早的世界首款四核Cortex-A15处悝器,这也算是Tegra系列的一个前期长处吧

Tegra 3是我们的老朋友了,也是NVIDIA眼下的绝对主力四核Coretx-A9架构,GPU中有12个图形单元分为4个顶点单元。8个像素单元执行频率有416MHz及520MHz两种,当中微软Surface RT、Google Nexus 7使用的就是416MHz版本号高端手机和平板中使用的则是520MHz版本号。

Tegra 4如今已经公布只是还没有详细产品仩市。仅仅能说是今年下半场的主力与Tegra 3相比,它的架构、工艺都有升级制程升级到28nm HPL工艺,CPU核心升级为四核Cortex-A15GPU单元数量则从前代的12个跃升到了72个,实际执行频率约为672MHz

另外另一个精简版的Tegra 4i。制程工艺也是28nmCPU核心为四核Cortex-A9 r4p1改进版。GPU单元降低到60个只是它整合了LTE基带,功耗和发熱更适合手机使用

架构设计:源自NV4x

Tegra的核心依旧是传统的顶点和像素单元分离设计,即便是新一代的Tegra 4也不例外并没有使用统一渲染架构。

Tegra 2有一组顶点和一组像素单元每组各有4个ALU运算单元。Tegra 3的顶点单元不变添加了一组像素单元,变成4+8形式Tegra 4的顶点单元有6组。24个ALU单元像素单元则由4组,每组包含12个ALU单元24+48的形式组成了72个图形单元。

Tegra 4i则在Tegra 4的基础上砍掉了三组顶点单元还剩下12个定点单元。48个像素单元不变總结是60个图形单元。只是砍掉了一半的顶点单元意味着其三角形生成率会大幅下降

NVIDIA这几代的Tegra处理器的GPU核心架构事实上没什么变化,都源於早期的NV4x架构每一个ALU单元每周期可执行4个MAD指令,Tegra 4的顶点单元规模是Tegra 3的6倍像素单元管线是Tegra 3的2倍,只是每组管线的规模又是Tegra 3的3倍像素单え的规模总体还是Tegra 3的6倍。

只是Tegra 4的GPU核心也在效能方面做了改进添加了L2纹理缓存,提升了像素渲染的最大寄存器(从16提高到24)等等

另外,Tegra 4的672MHz的執行频率也比Tegra 3的520MHz要高因此理论性能方面的提升例如以下:

最后,Tegra 4尽管不能完整支持OpenGL ES 3.0规范只是当中的大部分技术都是支持的。比方多目标渲染、遮蔽查询等新增技术都有支持

1、坚持小核心战略。单位面积性能取胜

与桌面/专业卡中更追求性能的战略不同NVIDIA在Tegra处理器上反倒慎偅了很多,非常注重控制芯片的核心面积Tegra 4在规格大幅提升的同一时候依旧将核心面积控制在了80mm2左右,当中GPU核心面积仅仅有10.5mm2与竞争对手楿比小了很多。


GPU核心面积都被换算到了等效28nm工艺下

这就给NVIDIA带来一个宣传上的优势——单位面积性能足以秒杀眼下的竞争对手不论是高通嘚APQ8064还是苹果的A5X、A6X,在这个指标上都被斩落马下

当然了。Tegra 4的绝对性能也不差此前官方公布及现场演示都表明其安兔兔得分高达3.6万左右。仳眼下的跑分天王APQ8064最高2.1万分的成绩高了50%

2、游戏优化不错,THD专属给力

尽管NVIDIA在PC平台的游戏优化被AMD的Gaming Evolved慢慢超越可是移动平台是他们的心头肉。跟厂商合作的优化还会继续深入Tegra系列还有专属的THD游戏,专门为NVIDIA的处理器优化

此前的一个样例就是EPIC的《史诗城堡》demo。尽管Tegra 3的理论性能被高通APQ064打个落花流水只是在这个demo測试中Tegra 3的成绩普遍好于APQ8064,更大幅率先三星的Exynos 4412等处理器


没有Tegra 4。你游戏中的妹子都不够靓

Tegra处理器事实上另┅个最大的长处那就是相关设备价格比較廉价。以四核Tegra 3为例它已经在两千甚至一千元内的四核手机中有过应用。北斗小辣椒、中兴V985、忝语大黄蜂等等当中的代表影驰的999元四核平板使用的也Tegra 3处理器,看来黄总为了出货量也在价格上拼了

说到Tegra处理器的不足。那就是公布早上市晚的惯性了非常easy让后来者超越。Tegra 3是最早的四核Cortex-A9可是等到上市铺货的时候别的厂商的28nm四核都来了,Tegra 3性能上不再有优势了40nm制程的功耗也比别人高。Tegra 4如今也是几乎相同的情况1月份公布的,平板和手机要想用上Tegra 4恐怕得到下半年甚至年底了

另外一个让人揪心的就是功耗了。Tegra 4迟迟不能应用就多少受到了这方面的影响据分析Tegra 4的TDP功耗高达5W,用在手机和平板中还有非常大的难度公平地说,功耗升高是全部㈣核Cortex-A15处理器都要面对的问题可是谁让Tegra 4最早公布呢。它必定第一个承受这个非议

Tegra 4还没有上市。NVIDIA又在前不久的GTC 2013大会上规划好了Tegra 5以及Tegra 6了与眼下的架构相比,后两者的变化可谓革命性的

Tegra 5代号Logan,它将会进入统一渲染时代使用Kepler核心,OpenGL ES规范上一跃升级为OpenGL 4.3同一时候还支持CUDA on ARM,意味著移动处理器上也能用上CUDA加速了再加上OpengGL 4.3支持,Tegra 5明年有可能成为最先进的移动GPU之中的一个

回头来看。随着GPU在移动处理器中分量越来越重偠在GPU技术上有先天优势的NVIDIA未来还是值得看好的,眼下的Tegra 3和Tegra 4还是小改款可是明年的Tegra 5意义大不同了,超强的技术规范及GPU通用计算的添加有朢大幅提升GPU的应用范围这在ARM处理器阵营中可算是蝎子尾巴——独一份了。

性能出众的“小众”产品——Vivante的GCxx

与PowerVR、malit720性能、Adreno等明星相比Vivante公司嘚GC系列GPU核心就不太为人熟知了,就连市场份额比它少的Tegra系列都比Vivante知名去年让Vivante露一大脸的是华为旗下的海思K3V2,这颗号称“世界最快四核”嘚移动处理器在华为去年的Ascend D1四核、荣耀2四核以及今年初的Ascend

Vivante事实上还是挺有资本的创立于2004年,创始人好像还是个华裔他们专注于移动GPU市場。2010年的时候就有超过40家授权单位主要客户有Marvell、飞思卡尔等,非常多人不知道的是国内的瑞芯微电子的RK2918以及自主知识产权的国产明星“龍芯-2H”使用的也是Vivante的GPU核心

Vivante给人的感觉就是“小众”。好听点的说法是“Vivante尽管小众可是性能出众”。难听点的说法是“Vivante的GPU性能出众可昰市场小众”。仅仅只是从市场统计上看Vivante的GC系列在移动GPU的份额上仅次于PowerVR、Adreno以及malit720性能之后,2012年上半年的全球份额是9.8%比Tegra的2.5%份额要高得多。

說起来Tegra才是小众他们是大众产品呢。仅仅只是Vivante在消费级的智能手机和平板领域确实露面太少给人的印象是“小众”。

双核GC4000的理论性能鈳达96GFLOPS核心面积24.8mm2,单纯的数据指标不好理解我们拿它与苹果A5X做个对照。后者使用的PowerVR 554MP4核心理论性能为76.8GFLOPS,GPU核心面积约为36.6mm232nm工艺,这说明双核GC4000在制程工艺落后的情况下核心面积更小可是理论性能更强。

GC系列性能如此强劲的一个原因还在于它的高频率他们的GPU通常有AHB和AXI两个接ロ,AHB总线下执行频率为400MHzAXI总线下可达600MHz,这可比A5X的GPU 250MHz的频率高得多

至于未来的产品规划,2011年的路线图上就规划了性能更强的GC600和GC800原本估计在2012姩Q1季度亮相,使用的工艺甚至会升级到20nm只是眼下来看Vivante最成熟最高端的产品还是GC4000。后两者并未见到产品公布及上市

如今来汇总一下Vivante的GC系列GPU核心的一些特点。

1、支持业界标准兼容多种API规范

这一条本来是移动GPU厂商的基本工作。可是鱼龙混杂的市场Vivante对业界标准的支持还是非常恏的由于他们本身就是标准制定者Khronos中的成员,对OpenGL ES、OpenCL、OpenVG以DX等规范支持的比較好

当然了,Vivante的硬件还要继续升级眼下的GC4000还仅仅支持OpenGL ES 2.0,也没囿採用统一渲染架构制程工艺也应该升级。

2、最高的性能/面积比

前面的规格介绍中就能够看出GC系列GPU的长处是核心面积小理论性能高,②者集合在一起就是Vivante的GPU有着业界最高的单位面积性能

与ARM的malit720性能、Imagination的PowerVR相比,GC系列的单位面积三角生成率是其它厂商的3倍像素填充率是1.5倍,浮点性能是他们的2.5倍

3、高倍抗锯齿下的低带宽要求

移动GPU开启MSAA抗锯齿之后三角形生成率直线上升,对带宽的要求更高Vivante的GC系列对带宽的偠求就没有其它厂商那么高。性能损失也更小

GC系列依据GPU不同负载可分为活动、空暇、待机及睡眠多种状态,能够依据须要实现不同的性能配置整合了先进的频率/功耗门控电路,能够动态开关GPU电路独立的PLL电路还能够实现不同的频率调节。厂商还能够通过软件来调节GPU的功能

Vivante的GC系列GPU另一个优势前面也提到了,除了支持标准的纹理压缩格式外它还支持S3TC压缩格式。跟Tegra是通用的所以理论上THD游戏在Vivante的GPU上也会有楿同的特效。

说完了长处再来看看它的不足Vivante的GC系列GPU号称有着业界最高的单位面积性能,并且双核GC4000的配置在性能上已经秒了iPad4可是实际使鼡中并没有这么夸张。就算最常见的跑分測试中它的3D性能不仅没达到iPad4的高度高通的Adreno 320都要好非常多,再算上有些游戏还存在兼容性问题Vivante嘚GC4000有点名不副实。

造成这个现象的原因主要是GC4000核心在智能手机/平板上应用较少开发商优化不足。可是Vivante自己的因素也不可忽视其强大到逆天的理论性能是通过高频率实现的。可是实际使用中为了节能GPU核心频率通常非常非常低,游戏中由于功耗和发热的限制也不会全速执荇这就形成了强烈的对照——跑分强,游戏性能一般

详细的样例就是华为手机的作弊门。有人解析了华为手机的文件后发现荣耀2四核存在着对主要測试程序的优化跑測试时超频执行。如今看来加压超频的可能并不大更可能的情况是:測试时GPU执行在最高的600MHz频率下(GC4000可支歭的最高频率),可是实际使用中频率往往仅仅有200-300MHz左右这样的反差带给人的感觉好像是华为手机在超频执行,是在作弊

总之,Vivante的GC系列GPU核惢核心面积小理论性能强大。有着业界最高指标的单位面积性能比可是Vivante的主要客户并不在智能手机和平板市场上,所以实际应用中优囮不够给力跟理论性能有非常大差距,而缩小这个差距也不是一天两天就能完毕的Vivante及华为还得努力。

话说回来期待他们继续优化GPU和應用并不意味着华为及Vivante的产品不好。从华为近期公布的固件升级及用户的反馈来看主流的游戏中K3V2并没有什么问题。大型3D游戏相同玩得转

机是一样的机,GPU上比高低

移动处理器的核心架构有ARM罩着(Intel的X86架构另算)各家厂商在CPU部分基本没什么区别。即便是自行开发架构的高通也会與ARM保持兼容移动处理器从PC的小跟班一跃成为能跟PC抗衡的大产业也多少得益于这样的统一。

相比之下移动GPU就有点各自为政的感觉了。某個游戏在不同处理器上不仅有性能高低的区别画质、兼容性等方面还有三六九等之分,安卓阵营的碎片化不仅仅是Google的问题吧GPU也多多少尐做了几分“贡献”。

在列举的五家移动GPU厂商中Imagination眼下实力最强、份额最高,只是我们认为更有危机感的正是他们由于他们是专业的GPU IP授權厂商,自己不生产GPU产品产品应用与否全靠授权合作伙伴的选择,可是不论什么一个有远大目标的公司都不会任由自己的产品核心掌控茬别人手里Intel和苹果眼下已经是Iimagination的大股东了。说不定哪天有兴趣就把它给控股了

Imagination也不介入CPU部分,只是他们实际上也有自己的处理器架构——Meta SoC今年还重金收购了MIPS公司,MIPS架构也在融入Meta处理器中除此之外。Imagination还收购了光线追踪加速卡公司CausticR渲染卡都已经出货。他们也不会鸡蛋嘟放在PowerVR这一个篮子里

至于ARM和高通,他们的GPU份额不低ARM能提供CPU+GPU一整套方案,高通的CPU+Adreno GPU+基带的组合也是无往不利前途也是光明的。

IP授权公司份额则比后者少得多。我们认为华为还是出手收购了它吧就算十几亿美金的价格,华为也能承受得了并且Vivante不是AMD或者Intel、NVIDIA这样的公司,媄帝政府的阻力也不大不行就让报纸和央视整高通,理由就是高通的3G专利严重影响了我们的国家安全玩不死他们。

还有就是NVIDIA要说做GPU怹们的技术实力是这几家公司中最强的,可是包含眼下的Tegra 4在内的GPU架构事实上还是相对保守NVIDIA预定明年推出的Tegra 5才更有革命性。Tegra 5的架构会升级箌真正的统一渲染架构并且会选择主流的Kepler架构,支持的技术规范也跨代升级到了OpenGL 4.3这是OpenGL ES 3.0的超集,DX11之类的规范应该也能支持

面对照重越來越大的GPU加速。NVIDIA直接把专业市场的CUDA加速带到了ARM平台上这意味着曾经非常多须要CPU乃至单独的应用处理器才干进行的任务都能够让GPU来完毕,這是全部GPU发展的大趋势之中的一个也是NVIDIA准备的杀器。

假设你也被NVIDIA成功洗脑了那么下边这句话能够把你拉回现实:尽管移动GPU的性能和技術决定了未来。NVIDIA在这方面有优势可是市场成败的关键还要看厂商的功耗控制,在眼下电池技术龟速前进的情况下没有可靠续航的移动設备都是在耍流氓。

本周三紫光展锐推出了旗下首款5G SoC——虎贲T7520,与高通、三星、华为(海思)和联发科一道站在了5G山巅

那么,和我们熟悉的其他5G SoC相比虎贲T7520到底处在一个什么水平上?

作為后来者我们肯定不能指望虎贲T7520一上来就能跟骁龙865、麒麟990、Exyno 990和天玑1000这种定位顶级的前辈比拼,它的实际定位属于中端偏主流也就是和驍龙765、Exyno 980、天玑800等5G SoC掰一掰手腕。

首先咱们先来看看这一定位5G SoC的基本规格对比表:

和上述竞品相比,虎贲T7520最大的优势就是首发台积电最先进嘚6nm+EUV该工艺拥有多层极紫外光刻技术加持,工艺光源波长缩短到13.5nm接近X射线的精度,从而带来了极高的光刻分辨率成本、性能、功耗更加平衡,相比初代7nm晶体管密度提高18%芯片功耗则可降低8%。

换句话说哪怕虎贲T7520不是最强,但肯定是最省电的5G SoC根据官方的资料显示,在同樣搭配4500mAh电池的情况下虎贲T7520平台听音乐可续航长达180小时,看电影也能坚持32小时远远领先2个竞争对手。

可惜紫光展锐并没有公布这两个競争对手都是谁,如果是骁龙855+X50或麒麟980+巴龙5000这种第一代5G平台虎贲T7520的省电优势再正常不过,如果是第二代5G SoC那它的功耗表现就太厉害了。

虎賁T7520的GPU架构选用的是4个计算核心的malit720性能-G57MP4这是ARM在2019年10月底最新发布的GPU IP,它虽然隶属malit720性能-G5系但却采用了和最新malit720性能-G77相同的Valhall架构,相较上一代G52G57囿着1.3倍的性能,能效提升30%、性能密度提升30%、机器学习提升60%

我们熟悉的麒麟810就集成了6个计算核心的malit720性能-G52MP6,其性能比同期骁龙730G和联发科Helio G90T都要強考虑到malit720性能-G57架构层面的升级,在搭配4个核心的情况下性能应该不逊于6个核心的malit720性能-G52

基于已知的参数推测,虎贲T7520的整体性能应该介于忝玑800(5G SoC)和麒麟810(4G SoC)之间它的CPU架构与这两个SoC相同,性能强弱全看主频GPU架构落后天玑800集成的malit720性能-G77MP4,但略优于麒麟810集成的malit720性能-G52MP6胜负同样看紫光展锐赋予虎贲T7520的GPU主频了。

虎贲T7520采用了和麒麟990 5G一样的SoC单芯片设计在一颗芯片内整合了包括CPU、GPU、ISP、NPU和基带等单元。

虎贲T7520整合了号称是“全球首款全场景覆盖增强5G基带”支持6GHz以下频段(包括n79)、NSA/SA双模组网、2G至5G七模全网通、双卡双5G、EPS回落、VoNR高清语音视频通话等先进标准和技术,SA模式下行峰值速率可超过3.25Gbps上传则可达1.25Gbps。

同时春藤510还支持5G NR TDD+FDD载波聚合(平均下行峰值速率提升30%)、3.5GHz+2.1GHz频段上下行解耦(覆盖半径提升100%)、3.5+2.1GHz超级上行(近点峰值速率提升60%)、5G超级发射等,可解决增强型VR、4K/8K超高清视频直播等业务需要更大上行带宽的痛点

还是那句话,在国内运营商纷纷采取5G限速的策略下(最高1Gbps)5G SoC基带性能再强也发挥不出来。但是虎贲T7520得益于低功耗设计架构、基于AI的智能调节技术,再加上SoC多模融合、6nm EUV统一相比外挂5G方案能效全面胜出,部分数据业务场景下功耗降低多达35%

为了提升虎贲T7520的日常表现,紫光展锐大幅强化了它的多媒體性能首先,这颗SoC内集成了独立的NPU单元支持业界主流ML训练框架,算子库丰富完整支持Android NN,用户能够体验更加多样化的移动端AI应用相仳于某竞品旗舰,虎贲T7520 AI性能实测可超出80%到1.5倍

其次,虎贲T7520支持120Hz刷新率的屏幕拥有全通路全格式HDR标准渲染能力,多屏显示最高支持4K HDR 10+同時,该SoC还搭载了第六代影像引擎Vivimagic 6.0、第二代4K FDR技术具备专用AI加速处理器、全新升级的四核ISP架构,支持1亿像素超高分辨率、多摄像头处理能力可捕捉4K60fps、720p480fps,再结合安奇逻辑(ACUTElogic)领先的影像技术可为拍照和摄像提供出类拔萃的效果。

换句话说搭载虎贲T7520的手机,可以用上刷新率更高分辨率更高的屏幕,搭配1亿像素的摄像头矩阵在影音拍照方面不留遗憾。

值得一提的是虎贲T7520还将金融级iSE安全单元整合在SoC内部。相比於外置SE它更难攻击定位;运算能力提升100%,支持视频加密通话等高算力安全需求;支持国际主流算法扩展能力更出色;存储容量提升20倍,通信带宽提升10倍可同时支持数百个应用。

虎贲T7520值得期待吗

从各项指标来看虎贲T7520是一款很有竞争力的移动平台,它的综合指标领先包括麒麟810、Helio G90和骁龙730G在内的一众4G SoC前辈在5G SoC领域也能和天玑800打擂。

作为SoC领域的后起之秀紫光展锐此次提交的成绩单其实还是蛮不错的。

但是茬手机没有足够多的重量级朋友可是玩不转的。

Exyno和麒麟有三星和华为/荣耀自家兜底而且这两个品牌在全球手机销量分列No.1和No.2。高通则是八媔玲珑绝大多数手机品牌都是它的客户和拥簇。联发科也是SoC领域的资深玩家在中低端市场的声望极高,近期也正在试图以天玑撬开中高端市场的大门

相对而言,紫光展锐的朋友着实不多数来数去也仅有海信和TCL。根据紫光展锐官方消息称2020年会有数十款搭载紫光芯片嘚手机面世,将新增中兴和小米生态链企业以及国外的部分手机品牌

即使虎贲T7520足够优秀,没有知名品牌的爆品支持很难提升紫光展锐嘚品牌影响力。而没有足够的知名度再好的芯片也难以得到更多品牌的支持。

天玑1000L好吧其性能秒杀同级别的骁龙765系列和Exyno 980,但依旧被手機厂商抛弃(详见《》)

因此,虎贲T7520能否在5G SoC市场打出声望全靠紫光展锐的公关能力,以及该芯片最终的采购价格了要知道,随着高通新一代骁龙6系的问世5G SoC的成本将被进一步拉低,如果紫光展锐在此之前还不能打开市场将要面对的就是一众5nm 5G新旗舰和竞争力更强的第彡代中低端5G SoC的夹击了。

我要回帖

更多关于 malit720性能 的文章

 

随机推荐