I also re-posted them here:
Mission Critical系统设计--浅谈Mars Pathfinder 1997(1)
Mission Critical系统设计--浅谈Mars Pathfinder 1997(2)
Mission Critical系统设计--浅谈Mars Pathfinder 1997(1)
公元1997年7月4日 。地球 。天气晴朗 。地球人和往常一样,有人在做乐,有人在做爱。。。在遥远的Mars(火星),来了一个来自地球文明的客人。。。经过接近 7个月的飞行,来到了神秘的火星。。。她就是来自NASA的Pathfinder。
火星人不做乐,也不做爱。他们什么也不做。一切都静悄悄的。。。默默观察着这位来自地球的客人。
Pathfinder从去年(1996年)12月4日,就开始了飞行。7月4日的上午10点07分[Mars的早晨3点,太阳还没有出来],悄悄的 降落在火星。这一天是辽国独立日。大家都在后院烧烤,整点小啤酒,过点小生活。有一批人除外。谁?加州理工JPL(喷气式推进实验室)的工程师和科学家 们。JPL的创办人之一是谁?是,就是他,钱学森。
辽国整了个喷气式,是整天的;宋朝克隆过去,是整人的。这就是区别。还好,钱学森同学没有被喷气式整过,否则不知如何感想。。。
NASA在1990年代的口号是“”faster, better and cheaper”[FBC] 。这是NASA第9任头Daniel Goldin在1992年提出的口号。Mars Pathfinder是这个精神指导下的第一个航天器系统。
NASA Faster-Better-Cheaper Vision. In 1992, NASA’s chief administrator Dan Goldin proposed the FBC initiative to produce spacecraft that were inexpensive and yet reliable. FBC is defined as significantly reducing the development cost of a spacecraft on a compressed schedule and NASA designating a program as FBC. The average FBC program cost $145M with less than 3 years to develop versus an average of 7 years for a traditional spacecraft. The FBC philosophy is smaller and less expensive spacecraft are not inferior to larger spacecraft. In producing smaller and less complex spacecraft, costs would be reduced by reducing development cost, reducing weight and thus launch costs, reduce operational costs, and reducing risk by making them less complex. Mission loss due to catastrophic failure is reduced by being able to produce several spacecraft for different aspects of a mission. Mission failure is avoided since the entire mission is not encapsulated into one spacecraft and subject to total loss.
Pathfinder有多faster?这个faster不是指运转速度,而是指项目从立项,研发,发射的周期。不到3年!!!
Pathfinder有多better?能带到处跑的小车(rover)上去了。这是人类探索外星球的首次!
Pathfinder有多cheaper?这是NASA对Mars的第3次冲击。前面2次叫做viking。花费是:1974年9.3亿美金,相当与1997年的350亿美金。Pathfinder的研发费用:1.5亿。项目总花费2.8亿。确实很便宜。
97年7月4日,Mars Pathfinder顺利降落在经纬19.13°N 33.22°W。
Pathfinder的生命周期是:从1997年7月4日着陆,中间历经了4,5次主控系统重启,到1997年9月27日最后一次完整的数据通讯,到1997年10月7日最后发回的一个微弱信号。
火星上发生的一切,就象那远古的爱情。那么遥远,但又是那样的近。世界上的距离不是火星,而是爱恨情仇。。。。。。
要理解Pathfinder,要知道起组成。Pathfinder系统是两个大东东:Lander和Rover(小车)。Lander就是那个大的东西,小车是在Lander上面的。降落之后,小车到处跑。Lander是不动的,通过摄像头到处照像。
上面第一张图是96年JPL的科学家在组装。大家可以看到什么是Lander和小跑车(rover)。第二张图是到了Mars之后,Lander上的IMP照相机拍的照片,前方是小跑车,在一个石头旁边。
降落后,第一张发回给地球的照片是来自Lander,是7月4日的下午4:28。
但是在试图启动Lander和Rover的通讯的时候,出现了第一次的没有连接上。但后来不明原因的恢复了正常,小车被顺利释放。
小跑车离开Lander后,发出的第一张照片是7月5号的晚上10:59。JPL的弟兄们贼来劲er。。。
但是大家发现,在7月5日的3:20PM,Lander主机主控CPU之前被reset过!!!第一次reset是7月4日的晚上10:30PM。
是谁?是什么原因?乌云笼罩在JPL的上空。。。
[Lander发回给地球的第一张照片]
[Rover发回给地球的第一张照片:回望Lander]
精确的说JPL的工程师在7月4日晚上就发现Lander和Rover(小跑车)通讯不正常。开始以为是Rover的Modem通讯软件问题。但在 7月5日的3:20的一次调试让他们意识到主机出了问题。追查,亲,在7月4日第一天的晚上10:30PM就被神秘的重启过。 Pathfinder是在4日的10:07AM着陆的。
Pathfinder的动力系统来自太阳。所以Pathfinder在7月4日10:07AM降落后,必须等到Mars的太阳升起,才能利用其太阳能板,整个系统Power On。系统起来后,通过高频天线发回给地球的第一个信息应该是在下午2点07分。
在7月5日首次意识到7月4日10:30发生了主控CPU reset之后,Caltech JPL的科学家们在7月10号,11号,14号。又都发现了系统重启的现象。每次系统重启带来的后果是丢失了许多数据。[照片都是存放在Lander的主控CPU的内存中的]。
JPL的人很不理解。为什么系统reset?
新闻界基本上是在7月5日早晨就知道和报道了这个系统问题特别是开始小车与主控通讯不通[是天大的事情。(1)Pathfinder是人类第一次用 rover探测外星球。(2)来自地球遥控全是通过Lander主控通知rover小车]。CNN在7月5日下午的报道,说Lander和Rober通讯 问题解决了那个时候JPL其实还不明白rootcause。问题并没有真解决。
CNN的相关报道摘要:
“More significantly, mission managers reported that Soujourner and Pathfinder were having difficulty communicating via their radio link. NASA officials said at a press conference late Friday that transmissions between the two vehicles were garbled. Failure to solve the problem would render the mission’s centerpiece useless.Project officials, including rover manager Jake Matijevic, remained up beat in the face of their first real long-distance fix-it test.”
“We have every confidence that we’ll find a way to fix this problem,” Matijevic said.”
在那遥远的星球上,一切都是静悄悄的。没有利益的争夺,没有战争,没有哭泣。也没有爱情,没有诗篇。她吸纳着一切的流言和猜测。唯一的回答只是沉默。。。她似乎在诉说着亿万年前的文明,也好像在思考着曾经的沧海桑田。。。
爱情都会淡去;英雄都会凋零。Pathfinder在10月7日的上午7点21分发出了给地球的最后一个信号,就再没有醒来。。。这个信号被在西班 牙的天线捕捉到了。今天2012年的7月4日。15年前她带着人类的梦想,离开蔚蓝色的母亲,飞赴火星。15年了,她静静的躺在那片遥远的地方。。
永远没人知道发生了什么,所有的都是猜测。JPL的科学家们试图让Rover迅速的往回赶,回到主控Lander的身边。这一切都已经没有意义。就 像一个女人,如果不爱你了,挽留只是多余。Lander和Rover就这样在那寒冷的星球上,没有来得及做最后得拥抱,最后的亲吻,再也不可能了。
2006年12月,9年之后,地球文明通过卫星拍摄的照片。Rover在最后的时候,奋力想回到主控的怀抱。。。只差6米。。。
下面是Pathlander的结构立体图。要注意的是她的两个天线。一个LGA;一个HGA。
下面是Rover的立体结构图。小车是纯靠太阳power的。大家可以看见上面的solar panel(太阳能板)。这也是之前说的,在7月4日(地球时间)上午落地之后,必须等到地球时间晚上,Mars sunrise的时候,小车才能工作。小车晚上通常是不工作的。
在Lander立体结构图中,我们可以看到最上面的一些传感器,这是1997年火星科学考察计划中3个试验中的重要一个:关于火星大气层和气象的观 察。Atmospheric Structure Instrument/Meteorology Experiment (ASI/MET). 1997年的事故出就出这个上面!!
下面是Pathfinder的平面结构图。读者要注意的是1553Bus。这是Mars探测器,或者是NASA许多系统很重要的一环。1997年问题的本质就是和这个军工1553有关系。。。什么OS层面的Priority Inversion都是表象。。。
Pathfinder的电源系统大概是这样的。1. Lander自己带了一个可充电的电池。 2. Rover带了一个一般的,不可充电的电池。大家白天都靠太阳能支持。晚上或者在传图像的时候,电池也得上。晚上基本上是为了保持仪器的温度而开。 [Mars晚上的温度很底,很冷,零下120度]。
Pathfinder是一个复杂的计算机系统,CPU只是其中的一个环节。除此之外,还有多个ASCI芯片和FPGA芯片。大家靠Bus互连。请读者参阅相关的注释,并会逐步解释。。。
PathLander项目从研发到航天器升空只用了不到3年的时间。非常快!JPL的主要是研发那些ASIC和整机和科学试验装备。其中ASIC是在 Cassini项目上改造过来的,例如,直接加1553B的interface[类似于在数通ASIC的时候,加一个PCI interface]。Cassini是NASA最成功的项目之一。
Cassini倒是晚于Pathfinder去Mars。Cassini是1997年10月5日升空飞往Saturn土星[Pathfinder都已经死了:-)。10/7日最后的一个信号]。什么时候抵达土星轨道的?2004年7月1日。飞了nearly7年!!!
Mission Critical系统设计--浅谈Mars Pathfinder 1997(2)
Pathfinder系统是一个国家机械,电子,材料,通讯整体最高实力的结晶。非常复杂。我们从现在开始专注于其的数控系统。Pthfinder 是一个典型Backplane的Chasis结构。Backplane是采用的VME互联。上天的时候,八个槽位占满,两个是空着的。Of the 8,其中一个是CPU主控板。
下图是VME互连细节图. (1)MFC CPU card(2)两个EEPROM card[所有的软件,双备和来自地球的动态升级] (3)太阳能card (4)能源转换card(从3接能源,给VME设备提高Power)(5)Uplink card(1553B interface在这个card上)(6)Downlink card(连遥测)(7)IMP照相机
下图所示是另外一个角度描述的VME背板上的各个IEM(Integrated Electrics Module)卡。要注意的是两个电源系统。太阳能PPS卡是产生Power,但通过另外的接口给APCU。APCU是真正的给VME和其上的IEM提高 Power Distribution的。APCU是自己带了rechargeable电池的。
双EEPROM软件系统和控制序列命令的Active/Passive备份是一个非常好的设计。在Pathfinder快要进入Mars大气层的时候,JPL的控制中心其实还迅速的给过一个patch,做软件的update。
从现在开始,逐步围绕这VME interconnect下的IEM card开始阐述。首先是最重要的CPU卡。在Pathfinder系统里,CPU卡来自Lockheed Martin的基于IBM/BAE的RAD6000 CPU的Single Board Computer。什么意思,你就理解这个板子上啥都集成了。例如,chipset,rs232,vme等。
上图一是CPU卡的top view。图二是RAD6000 CPU。 RAD:Radiation Hardened,防辐射。在2008年之前,美国航天系统基本上都是用RAD6000.其中包括2003年发射的Mars Opportunity和Spirit号。Opportunity目前正在Mars上等待Curiosity的到来。。。
在CPU板子上,除了RAD6000 CPU之外,主要是VME Interface, Memory Interface和RS232 Interface。VME Interface是3个FPGA分别实现;Memory Controller一个。128M DRAM是两个HMC(Hermetic Memory Packages ) Packages。请参阅图解。
Hermetic Package其实就是密封封装(不知如何翻译了),例如通过陶瓷和金属。RAD6000上黄灿灿的都应该是金属封装。亲,Mars的晚上是零下120 度。DRAM要歇了,大家都歇了。3个VME interface的FPGA和Memory Controller也都是金属封装的。
下图所示是平面图。和后来的基于RAD6000的CPU板子相比,要记住的是:1997年的Pathfinder是绝对没有PCI Interface的。3个VME FPGA基本搞定Interconnect,和遥测和1553B的各种设备互联。RS232和Rover(小跑车)互联。图中各FPGA的标注和实际单板 的位置有出入。
图中的COP Interface是调试接口。要注意Clock。RAD6000 CPU工作在:2.5, 5, 10, and 20M赫兹下。为什么?省功耗。 Pathfinder 9月27日出事后JPL的人也是一通瞎猜,例如clock分频乱了套了,Clock出了问题,是,全完了。类似与:本来是9浅1深,现在是全浅了。玩个鸟 呀。
RAD6000-SC被NASA广泛的应用在各种航天器系统上,包括Mars Spirit和Opportunity。但单板结构interface有所变化例如PCI等。RAD6000-SC单板的价格多少?大概是20到30万美 金左右。不服的可以自己山寨一个到火星上玩玩。下图所示是采用了RAD6000-SC的航天系统的列表。
RAD6000起源于IBM后来被卖给了Lockheed Martin然后再落入BAE System的手里。在军控CPU方面目前认为是3代。8月6日要降落在Mars上的Curiosity(好奇者)是RAD750,CPU Core是PowerPC 603 结构IBM PPC750. Pathfinder的RAD6000的CPU core来自Power结构的Power1微结构。750等都是603演化而来的。这也是为什么603 Bus,到了7447或者G4芯片,MPX bus才上来。
如图所示是目前3代军控防辐射CPU的roadmap和相应的die图。750还不能支持多核系统。目前有不少研发讨论关于多核系统在AeroSpace系统的应用,但还没有得到真正的落地。
图示是RAD6000-SC的逻辑图。这张图是一个General的结构图,那些蓝色的模块就是相应的Interface(可以是各种实现,例如,FPGA or/and ASIC)。右边的CPU Core芯片微结构图。
1997年的Pathfinder的RAD6000-SC单板CPU Core来自IBM Power1的微结构。Power1或者叫做RS6000 CPU,有两个配置RIOS1,针对RS/6000 服务器:10个芯片互连。RS.9,针对RS/6000工作站,:8个芯片互连。如图所示分别为RIOS1和RS.9的微结构。请记住:是多芯片解决方 案。
RS/6000为了覆盖低端市场和无盘工作站市场,1992年,在Power1多芯片solution的基础上推出了一个单芯片方案,这就是所谓的 RSC(RISC Single Chip)。1997年的Mars Pathfinder的RAD6000就是基于这个RS/6000 RSC,然后加上航天所需要的防辐射和其他封装技术的产物。
No comments:
Post a Comment