Republican

  :: 首页 :: 新随笔 :: :: 订阅 :: 管理 ::

看完前线专业视角观点,虽然我做过SOC相关项目,但16位远远落后于当前64位和32位市场,处理器芯片市场1.2GHZ已经遭遇瓶颈,达到饱和,未来数字处理器的发展和前景何在,似乎已经完全成熟化,但核心思想,结构和算法,我相信一定不会没落。也就是说,最高精技术含量的DSP芯片,已经没有什么设计价值,但技术一定是值得借鉴的。

换言之,即使我知道高精技术芯片一出来就没有二次开发的必要,但高效结构和精密算法蕴含其中。也就是说,在自己能达到的范围内进行探索和挖掘,虽然并不能把它作为一项职业。

 

芯片是产业链上游重要的一个环节,一颗小小的芯片具有极高的技术含量和价值,半导体行业每年都会有一个各大厂商营业额的排名,除去2009年,常年盘踞在前三名位置的分别是英特尔,三星半导体和德州仪器,英特尔凭借的是桌面处理器,三星半导体凭借的是其全面的存储器产品线,德州仪器则是凭借模拟器件,嵌入式处理器和无线半导体这“三驾马车”。

终端是产业链中上游重要的一个环节,终端厂商用芯片设计出嵌入式硬件,并且基于该硬件开发相应的嵌入式软件,从而构成一个完整的嵌入式终端产品,形象的说就是一块电路板套一个外壳,这里面最重要的一个核心价值的产生就是附加在嵌入式可编程器件上的软件,成为嵌入式软件。

系统是产业链中下游重要的一个环节,系统厂商通过平台软件使得多个嵌入式终端通过互联网进行信息的传递,从而为最终用户提供产品和服务。

嵌入式产业系统 = 芯片 + 嵌入式终端 + 平台软件

达芬奇处理器最具革命性意义的就是它的全平台开放性,不同于用硬件直接做多媒体加速的应用处理器,达芬奇处理器提供的ARM,DSP和VICP是三个全部开放且可编程的内核。达芬奇技术的核心其实并不在于硅片本身,而是基于Linux的那套软件框架,它把一个基于多媒体应用的嵌入式软件抽象为应用软件和算法软件,采用CodecEngine框架组件规范了算法软件的开发标准(xDAIS)和统一接口(xDM),应用软件通过CodecEngine来调用算法软件,在这个层面上,应用软件只运行于Linux之上,并不关心Linux运行于何种处理器内核上,算法软件被CodecEngine统一管理,所以应用软件也无需关心算法软件运行于何种处理器内核上。

层出不穷的内核Bug和匮乏的独立开发DSP端算法的资源可是苦了做产品的企业,光是一个Audio OSS全双工的Bug就愣是N个月没有给出完全搞定的Patch,那个时候可真是一个内核升级的Patch都十分抢手,更别说拥有Linux下的cgtools和dspbios安装包可以笑傲江湖

遥想当年,华旗推出的基于DM6441的高端MP5产品也是名噪一时,后来,时代飞腾又基于DM6441推出了网络电视一体机的方案,但是DM6441的价格居高不下使得这个曾经是TI阵营王牌IDH的公司彻底转向Telechips的平台,笔者在时代飞腾的一个朋友抱怨到,TI一颗芯片都赶上别人的一个BOM了。那个时候我就在想,究竟怎样的附加值和商业模式才能击碎消费市场产业链的利润“微笑曲线”,还是终究在消费市场做IDH就是一个利润夹缝中苟延残喘但又创造着将冰冷的芯片变成有生命力产品奇迹的商业行为?

伴随着DM643x处理器出现的还有一个在技术上非常拉风的东西,那就是跑在DSP内核上的Linux虚拟机,这是一家叫做Virtuallogix的公司做的软件产品,它可以使得DSP支持Linux,这再一次证明了TI想在Linux下统一管理和开发它的全部嵌入式处理器的软件框架战略,在前面提到过DVSDK里的一个组件叫做CodecEngine,它可以使得应用软件通过RPC调用算法软件完成多媒体算法的调用

DM643x因为有着比DM642更先进的DSP内核架构和达芬奇响亮的名头走进了千家万户,在终于找到了CSL并且抛弃了虚拟机之后,工程师们又开始抱怨,为什么DM6437只有一个VPFE而并非像DM642有多个VPort呢,这对处理多路视频将是多么的复杂,于是DM643x被打入冷宫,直到DM3xx应用处理器的IPNC大行其道,才被重新定为视频分析协处理器,视频分析软件供应商ObjectVideo将DM643x做成独立的视频分析模块,但阻碍这颗达芬奇处理器涅磐的依然是ObjectVideo昂贵的软件入门费和版税。

DM648横空出世,这是一个至今已经可以跑到1.1GHz的DSP处理器,它集成了2个千兆以太网接口和5个VPort视频口,DM648才是真正的将DM642精神发扬光大的产品。在万众瞩目下,一个奇怪的事情又发生了,DM648的开发板居然不是TI御用的Spectrum公司设计的,相关的设计资料也是乏善可陈,至今仍然想不通为什么DM648为何落得如此下场,国内第三方做DM648开发板的跟DM6446简直不在一个数量级。

TI或许已经意识到了在中国这样一个神奇的土地上,有这样一个潜规则,那就是只有硬件是可以卖钱的,硬件上跑的所有东西你都要送我。于是TI开始做出这样一个决定,Linux内核维护从以MonvtaVista为主树转移到以自己维护的内核为主树,逐渐往Community Linux靠拢,彻底摆脱MontaVista;于是TI开始做出这样一个决定,自己做Codec,因为客户听到第三方Codec昂贵的入门费统统都吓跑,自己去做有中国特色的Codec去了,TI可郁闷了,这得做到猴年马月才能量产,于是N多项目胎死腹中。

Ateme还是转向FPGA平台,Ittiam传言准备自己做ASIC,Ingenient则被Sasken收购,而此时的时代飞腾,则彻底放弃了TI的平台,转向更加经济实惠的Telechips和Marvell,于是,TI的Codec阵营就在这一年土崩瓦解。

最后TI终于祭出大招,OMAP3530的BeagleBoard以一种社区开源模式面世,所有的硬件设计源文件以及驱动和操作系统都可以从网络社区下载

在2009年的TI开发商大会上,Cortex-A8内核确实是独领风骚,OMAP阵营的参展商一举压倒了DaVinci参展商,诸多的Android,WinCE独立软件供应商和无线模组供应商开始加入TI的阵营。

TI在DM355处理器内部集成了一个叫做ISP的硬件影像处理单元,可以直接支持RAW格式数据的处理,我们姑且管这一块叫做影像预处理,有了ISP,DM355处理器就可以无缝的对接各种图像传感器了。再来看看图像传感器供应商,Aptina的传感器一般叫做Sensor,可以直接输出RAW格式的数据,Ovt的传感器一般叫做SoC,内置了ISP,低分辨率的产品可以直接输出YUV的数据,高分辨率的产品也是输出RAW格式数据。不知是因为TI和Aptina高层的关系很好,还是为了彰显DM355处理器ISP的英明神武,在Appro的这个参考设计里选择了Aptina公司的MT9P031 5MP传感器,专门使用DM355的ISP开发了针对MT9P031 CMOS图像传感器的影像预处理算法。

TI认为自己的这番努力已经秒杀了掌握最先进ISP技术的日系厂商,成功的把DSC的成像技术移植到了IPNC,势必会引爆一个巨大的市场,高清视频,极低的成本,成熟的ISP技术,甚至连镜头和外壳连带完整的硬件参考设计都已经准备就绪

什么叫方案知道么?只要注入一笔钱,再找个工厂一量产,产品和利润就出来了,我们做方案的口号就是,不求最好,但求最快!是的,当时笔者还真是听说深圳有人直接拿Appro的这个参考设计去工厂生产,一个非常典型的深圳市客户,他们崇拜的是MTK式的神话,他们需要的是一个可以马上量产的方案,他们需要的是一个可以带动生产力和现金流的Turn-Key-Solution,他们的特点就是简单快速,薄利多销。

从技术角度看,DM355的功耗和性价比还是非常不错的,采用了0.65mm的点距,内建了ISP装置得以处理Aptina的5MP像素传感器的RAW格式数据,该传感器使用了2x2的binning模式来增强成像质量,可以输出720P30的MPEG-4视频流。但遭人诟病的是,DM355内部的ISP行缓存不够长,在做5MP抓拍的时候,需要2-Pass才能完成处理,2-Pass就是先把图像采集到内存,上半边通过ISP处理一下,下半边再通过ISP处理一下,也正巧了,赶上那年交通行业的相机都要5MP抓拍,惹得全国上下用DM355做相机的厂商怨声载道。

后来的DM365和DM368时代,Ambrella和MG3500已经可以在这个市场分到一杯羹,TI人无我有的战略优势丧失殆尽,顿时变成了人有我优。。。

相比于Ambrella的IPNC方案和海斯的DVR方案,TI的参考设计又明显缺乏成熟的“山寨化”软件;纵观跟进TI的烈士般的公司们,累的跳楼的心都有了,光是那一套套不一样的DVSDK,一堆堆形形色色的Patch,就已然头昏脑胀了。。。

DSP这种处理器架构还能保持多久的生命力是一个值得探讨的问题,嵌入式处理器市场的竞争本质还是架构之争。

首先在C64x和C64x+的DSP内核架构之后,又推出了C674x+内核架构,该架构统一了浮点DSP和定点DSP内核;其次在DM8168和OMAP4处理器上,TI则会统一硬件协处理器的架构,即OMAP4和DM8168都采用IVA-HD这种相同的硬件加速器;至此,TI在SoC上已经形成了C674x+Cortex+IVA-HD的统一架构SoC雏形。

ADI公司早在若干年前就关闭了以色列的TigerSharc设计中心,其理由是,该处理器已经登峰造极,没有再发展的必要;在桌面处理器市场,主频提升早已遭遇瓶颈,多核心时代正在到来,而ARM此时已经不声不响迈入双核2GHz的Cortex-A9时代。TI的DSP也是如此,C6000架构已经成熟多年,1.2GHz似乎已经是不可逾越之极限,于是2009年TI发布了3个1.2GHz核心的高性能多核DSP处理器TMS320C6474,这也是一颗从垂直行业市场拿到通用市场的处理器。

但恐怕由于功耗的原因,基于65nm工艺的C647x系列很难再有突破。多核心DSP未来的道路确实很艰难,因为它已经处于一个非主流的位置,虽然不排除在更先进的工艺节点上植入更多的DSP内核甚至是Cortex-A9内核完成统一处理器架构和软件框架的疯狂构想。

Xilinx在SoPC的战略上无疑是成功的,它选择了同样昂贵,功耗很高但同时性能也很高的PPC硬核,从Virtex-II一直到Virtex-5的产品中都可以看到集成PPC硬核的产品,但是这一切都将在28nm节点工艺改变,在28nm技术上,Xilinx选择了高性能低功耗的工艺,而Altera则选择了更高性能但高功耗的工艺。因为在28nm,Xilinx将植入Cortex-A9硬核处理器,创造真正的低成本,低功耗的SoPC产品,继续向嵌入式市场挺进,试想如果一颗集成了Cortex-A9的SoPC芯片售价15美金,你还会选择相同价位的SoC吗?

posted on 2012-08-27 22:59  Republist  阅读(261)  评论(0)    收藏  举报