panyong's profileZPY's LifePhotosBlogListsMore Tools Help
    8/2/2009

    <ICE Age 3> 3D

    还是一样的有意思
    3D也很爽,不过3D眼镜夹得脑袋有点疼
    4/20/2009

    Oracle收购Sun了

    shock中,
    一家具有创新精神的高端服务器公司,被一家软件公司给收购了,不得不佩服Oracle的牛B之处。
    3/15/2009

    黑天鹅

    看来黑天鹅事件的影响真的是巨大的
    2/21/2009

    养猪=潮流?

    丁磊要养猪(http://tech.sina.com.cn/i/2009-02-17/07542829834.shtml

    基层大学生也养猪(http://news.sina.com.cn/c/sd/2009-02-19/102017247054.shtml

    莫非现在养猪变成潮流了?不过现在猪肉好像的确降了不少的说(http://finance.sina.com.cn/china/dfjj/20090219/13425876659.shtml

    其实,俺也想养。。。。。。

    2/9/2009

    元宵节

    仍然要在实验室干活
    ps,明天北京就不能放鞭炮了
    1/21/2009

    火车票

    胡core都发话了,咋还这么难了?
     
    票贩子猖獗,实名制无用论,。。。。。。看来还是利益集团太多了
    1/8/2009

    起来看历史啦?!

    难道说我们已经变成历史了?或者我们根本没有机会成就历史?难以形容自己的心情


    中国诞生首台百万亿次超级计算机背后的故事

    发布时间:2009.01.07 08:41     来源:赛迪网    作者:赛迪网

    【赛迪网讯】在不久前公布的全球超级计算机500强排行榜中,安装了微软Windows HPC Server 2008操作系统的曙光5000A超级计算机实现了百万亿次的突破,以峰值速度233.47万亿次、Linpack值180.6万亿次的成绩,跻身世界超级计算机前十名。这是本次排名中在美国之外的唯一进入前十名的超级计算机。由此,中国成为世界上第二个可以研发生产百万亿次超级计算机的国家,中国高性能计算领域的历史也从此进入一个新的纪元。

    筚路蓝缕,以启山林

    对于微软公司和作为国内高性能计算领域翘楚的曙光公司来说,这样成绩的取得似乎完全在情理之中;然而任何惊人奇迹的创造,背后都往往蕴藏着开创者们不为人知的艰苦努力。其实,微软与曙光信息产业有限公司的携手可追溯到2007年。那一年,两家公司正式签署了合作备忘录,在集群系统开发、集群系统的软件和解决方案的开发、中国高性能计算人才的培养等方面展开了广泛的合作。2008年,在曙光5000A成为全球前十名的超级计算机的过程中,微软中国研发集团和曙光的工程师团队更是并肩战斗,为开创中国高性能计算领域的新纪元而殚精竭虑。在一系列紧张而有序的前期准备工作之后,2008年6月,在首台安装了Windows HPC Server 2008的服务器上进行的单节点测试中,运算效率达到了86%,为同期各类操作系统中最高,这令尚属高性能计算领域新兵的微软工程师们非常振奋,也令曙光团队对合作打造百万亿次超级计算机的前景充满信心。7月,微软工程师们在曙光天津产业基地进行的32节点测试中,运算效率达到84%,几乎实现了节点数目-运算能力的线形扩展,这在运算次数每次加倍,运算效率至少要损失1%到%2的通常经验预测下几乎是不可能完成的任务。微软中国研发集团战略合作部数据中心经理李铭清楚地记得,在离天津市区5公里之外的车间内完成此次测试后,他们拖着疲惫的步伐去找宾馆,却因天津正在举行夏季达沃斯会议而被多个客满的宾馆拒之门外,几个小时后才辗转住进了一家小旅馆。

    艰难困苦,玉汝于成

    2008年9月12日,微软中国研发集团和曙光信息产业有限公司的工程师团队正式进驻于中科院计算所临时搭建的数据中心,开始了对全部1920个节点构成的集成计算系统的大规模测试和优化。此前,微软HPC团队服务过的最大客户是美国国家超级计算应用中心(NCSA),当时构建的超级计算机由1200个双路四核的服务器节点构成,且负责这个项目的微软美国团队相关经验十分丰富。而此次曙光5000A由1920个四路四核的服务器节点构成,规模是作为高性能计算技术的全球领先者的NCSA拥有的超级计算机的四倍,这对年轻的微软中国HPC团队来说是个非同寻常的挑战。由于测试要求严格的无尘环境,占地达2000平方米的数据中心几乎完全不通风,只有一个很小的门可供出入。测试过程中50个机柜的散热风扇同时工作,环境噪音接近70分贝。兼之数据中心刚刚搭建,各方面情况尚较简陋,现场工作环境非常艰苦。就是在这样严酷的条件下,微软和曙光的工程师团队,夜以继日地与这台重50吨、身价2亿人民币的超级计算机“同吃同住同劳动”达7周半之久(从9月1日开始搭建计算机到10月28日完成最后测试结果)。团队中每人每天的平均工作时间达到14小时以上,在工作现场的机柜旁、停车场的角落里偶尔可见悄然入睡的疲惫身影。双方团队在这样艰苦的环境下,经过不懈的努力,令计算集群的性能和速度不断提高,并多次在最后的期限前奇迹般的实现既定目标。9月28日,曙光5000A的浮点运算能力达到87.6 T;仅仅一天之隔的9月29日,系统运算能力即突破百T大关达到116.3 T,得以赶在世界超级计算机大会的截止日期——10月1日之前顺利申报全球超级计算机的Top500;10月9日,在九个毫无突破、倍受煎熬的日日夜夜之后,工程师们在逆境中的坚韧不拔终于使曙光5000A的运算能力实现突破,达到了140.3 T的新高;10月13日凌晨两点左右,在双方工程师们的热烈欢呼中,这台超级计算机的运算能力达到167.4 T,突破了此前曙光方面预计的160 T。此举被称为“创造了中国高性能计算的历史”。在经历了10月25日174.9 T和10月26日的179.8 T之后,2008年10月28日,曙光5000A得到它提交给世界超级计算机大会的最终结果——180.6 T。当时一直守侯在工作现场的微软工程师李铭郑重地说:“我们当时都屏住了呼吸,生怕一丝稍重的气息都会影响到机器的运行。”自此,中国高性能计算的历史被正式改写。对于微软Windows HPC Server 2008在本次top500排名测试整个过程中的表现,曙光总裁历军显得十分激赏,“这是我们首次应用Windows HPC Server 2008在这样大规模的超级计算机上进行测试,本来抱着试试看的态度。但它在测试过程中表现了出极高的效率,最终得到的结果也十分优异,大大超出了我们的预期,这一切都让我们充分肯定了微软在这个领域的实力。”

    曙光风范:风驰电掣,蹑景追飞

    据此次在一线作战的工程师们介绍,像此次曙光5000A这样大规模的计算集群对于硬件的稳定性要求非常高,一台机器的一条内存出问题就会导致整个任务失败。因此整个过程中来自曙光的工程师们一直轮流值班,并在现场准备了大量备份硬件,一旦发现问题立刻上前更换,工作效率令人敬佩。而之前搭建数据中心的整个过程,包括电源和水管的焊接及连入整个大厦的系统,架钢梁、机柜和路线等,曙光公司仅用了十天左右的时间。其中让微软的工程师们印象尤为深刻的是,曙光公司调动了可以调动的全部人员,包括秘书、财务等行政人员,在一个晚上将现场共计七百条,总长达60公里的光纤全部部署完毕。“这是在其他任何国家都不可能实现的”,微软中国研发集团服务器与开发工具事业部HPC开发团队经理严治庆在与远在美国的团队交流时表示。

    微软语录:“起来看历史啦!”

    在数据中心现场,微软工程师们担负着对系统进行管理和优化,问题排查,不断推动运算速度提升的重任。项目推进过程中一旦出现问题,要迅速分析原因,如出在硬件方面则需要马上与曙光的工程师们进行沟通,软件方面的情况则需要HPC产品团队的工程师们及时贡献智慧,微软中国研发集团HPC开发团队在严治庆经理的亲自带领下,项目经理、软件开发工程师和软件开发测试工程师与数据中心团队共同战斗在工作现场,对项目的顺利完成起到了至关重要的作用。由于Windows HPC操作系统是第一次部署在如此大规模的集群上,需要对部署中和测试中出现的问题及时解决,必要时确保得到美国产品团队的实时支持, 工程师们日以继夜的工作,很多时候是凌晨或周末,把美国有经验的开发和测试工程师叫上一起开会诊断,力求在最短时间内解决问题。微软美国的工程师也以极大的热情把自己的经验和智慧毫无保留地贡献出来,因为他们清楚地知道这不但是在创造微软高性能计算的历史,也是在创造中国高性能计算的历史。

    在艰苦的历程中,工程师们一直以极大的热情投入工作,然而项目从前期准备、节点测试到入驻数据中心后的冲刺总共历时近一年的时间,其中经历过好几次非常困难的“瓶颈”阶段。每当大家已非常努力却一时看不到成果,出现焦躁情绪的时候,微软中国研发集团战略合作部的数据中心经理李铭总会以这样的话为大家打气:“请记住,我们现在的工作是在创造中国高性能计算的历史。”

    也许正是因为有了这样强烈的使命感,无论是在天津曙光产业基地,在生产车间里做测试,还是后来在临时搭建各方面条件尚很简陋的中科院计算所地下二层车库,微软工程师们对艰苦环境和繁重任务的适应能力让所有人惊叹。身在提倡工作与生活平衡的微软公司,从入驻车库开始的中秋节、国庆长假以及各个周末,工程师们没有休息过一天。其中尤其令人感慨的是被大家亲切地称为“老夏”的法国性能测试专家Xavier,受到大家的热情感染这次也成了拼命三郎,在项目中每天的工作量是在法国的两到三倍。

    2008年10月13日,对于微软的工程师们来说是一个格外值得纪念的时刻。这一天凌晨,守候在数据中心现场的工程师们亲眼见证了167.4 T运算纪录的诞生,历史性地突破了整个项目开展预计的160T。结果出来的那一刻,微软中国研发集团的工程师李浩然叫醒了正在角落里休息的伙伴们。“起来看历史啦!”他兴奋地说。

    这天晚上的庆祝活动中,每个人都喝了有生以来最多的酒,曙光的聂总还拿出了珍藏的茅台。令人在多日之后仍津津乐道的是老夏同志由于对茅台酒的后发劲力估计不足而喝了很多,后来两次跌进了饭馆中作装饰用的水池里。然而让人印象更为深刻的可能是他在席间的一番话。“我非常荣幸能参加这样一个项目,成为改变中国在高性能计算这个领域实力的一员”,他手持酒杯,发表了这番颇具国际主义精神的感言。“这个数字的出现后,中国的高性能计算产业就迈上了一个新的台阶,能为此出一份力我感到非常自豪!”

    12/29/2008

    天下第一城

    红色资本家就是牛B
    12/15/2008

    滑雪

    周六小组活动,全天军都山滑雪场,尝试了中级道,很爽
    结果胸肌拉伤,全身酸疼,现在笑都疼,sigh
    9/9/2008

    跑步还是很管用啊

    昨天体检,微量脂肪肝,吓了一跳,后来想想也正常
    看来是这几个月被养的太好了,吃红烧肉太多的缘故,基本没有运动,所以也不奇怪
    昨晚跑了一次,照例清华东门,不过明显感觉不行了,回来以后感觉五脏六腑都翻了一个个,感觉很爽
     
    正好北马,跑一次吧,不知道能够跑多远,什么时候试一下,能跑多远报多远吧,
    9.15号之前报名,别又错过了,恩
    8/3/2008

    苏浙汇

    托晓铭的福,第一次进苏浙汇
    想想也是国内IT巨头大聚会,Intel,IBM,SUN,Microsoft,就差google了,
    吃的很爽,聚会
    7/17/2008

    意料之外

    下午寄快递,顺丰快递,刚打完电话不到10分钟,快递的取件员就在楼下了,真是迅雷不及掩耳,意料之外
     
    以前知道一些关于“山寨机”的东西,但是中午看到一个关于“山寨机”的PPT,还是被shock到了,没想到这么牛B
    创意啊创意,“没有做不到,只有想不到”
    什么时候曙光的高性能计算机能够做到这种程度,估计也就会独步天下,无所不能吧,
    大笑
    6/28/2008

    曙光学生毕业吃饭

    昨天晚上,08届的硕士毕业,一起吃饭,
    见到了历老师,聂总,见到了诸位师弟师妹们,见到了刚进来的小师弟,大家都是老样子
    谈论的仍然是曙光,
    以前自己在曙光的景象历历在目,不知道是什么感觉
    于是只能猛灌啤酒,晕晕的感觉真好
    6/26/2008

    ISCA08观后感

    从21日-25日,连续听了五天,感觉非常的shock
    总体感觉,workshop比正会的水平差很远。
    第一天的IWVT,总体上没有体现出来,最开始的VMware的一个Chief Tech guy做的演讲还是很有意思,说出来了vmware对虚拟机的一些观点,但是对于虚拟机在高性能计算中间的应用他们也没有一个很好的解决办法,提到了用虚拟机做高性能计算应用的调试,
    重点还是在于虚拟机对系统的资源整合(service consolidation),性能隔离,调试(debugging),Migration,snapshot,record/replay.
    其他的文章没有什么可以称道的地方,国内的文章的水平果真有够烂的
    第二天的WIOSCA,重点在异构多核上的调度,强调了异构的特性,来做一些研究,印象最深的就是他们的工作的出发点,都是新的领域,文章的评价和完整性还是不够深入。
    晚上欢迎晚宴,吃的一般,但是看到了一堆牛人,大胡子Yale Patt等,不过对于我们来说,问题就在于,满屋子体系结构的牛人,我真正知道他们的工作的很少,而且没有人能够引荐,不知道该怎么去聊,同时自己做的方向和体系结构还是差很远,也许要是去开SC, ICS, cluster, IPDPS就会好很多吧,但是随便聊了一会,感觉还是很厉害

    正会的时候,感觉非常的强烈
    第一天上午的keynotes没有赶上,很可惜,中间提到了一个9年的研究和工业界的滞后期,后面的讨论中间多次提到。
    好歹我也是做互联的,下午重点听了一个
    Session 2b: Interconnect Networks - Part I
    第一篇是Dally的学生Kim做的DragonFly网络,主要是根据技术的驱动,认为短线比长线会便宜很多,做High Radix Router,使用一堆router做Virutal Radix Router,中间的Global Adaptive Routing感觉应该还是很复杂的,跳那么多跳,才到目的地,延迟的效果会很差的。最后始终没有看到Dally
    后面一篇使用全局同步Frame来做片上互联网络的QoS保证,没有什么太深刻的印象
    第三篇比较有意思,做了一个非常全面的测试,认为现在的互联网络不能够满足不同的Traffic Pattern,然后提出了一种自适应的硬件结构,动态改变结构达到不同网络的目的
    中间Break的时候,一帮人突然围上去了,原来是Patterson到了,心目中的神。大家纷纷去合影,签名的,Fans的确很多,呵呵
    后面听了一个TM的Session,没有什么太深刻的印象
    Session 3a: Transactional Memory
    最后的Panel,非常的shock,题目是“Computer Architecture Research and ISCA: Have we lost our Compass”感觉这个是这次会议中间最高潮的地方
    几个老头,Yale Patt,白色的络腮胡,
    Arvind, MIT,
    James Goodman, University of Auckland,
    Trevor Mudge, University of Michigan,
    Ann Arbor, Guri Sohi, University of Wisconsin-Madison包着标志性的蓝色的头巾,很酷
    几个老头的意见综合起来说就是现在的学术界的研究太偏向工业界了,工业界的人都希望学术界帮他们做产品中间的技术的研究。学术界需要更加关注有创新性的技术,更加脱离现在的工业界的现状,学术成果到真正的商业应用一般有9年的滞后期,
    现在的研究都是SimpleScalar Generation,都做模拟,很少有人真正做出一些原型
    他们应该算学术界中间的old man,很激进,希望学术界能够更加的做一些真正的Future Research。
    参加讨论的人很多,有的人问道了如果真正做研究的话,时间这么长,CSArch的PHD怎么办?
    Patterson也提到了自己的观点,他认为和工业界联系紧密一点不是坏事情,可以更加了解真正的需求,后面的就没有听懂,最后Sohi搞了一个投票来反驳patterson的观点,Patterson只有摇头而去。
    感觉自己的听力太烂了,根本听不太懂这些人的讨论

    第二天
    Nvidia的chief Scientist做了keynotes,主体宣扬他们提出的TLP,并行模型,CUDA,观点一般,没有什么特别新的东西。
    中间一个专门的为中国开的Panel “Computer Industry in China - Where is it going?”
    提到的几个问题包括中国导师带的学生太多的问题,学术研究的问题,
    映像深刻的是马颂德的英语相当的好,
    然后是颁奖
    David patterson的获奖演讲,也很厉害,中间提到了他对未来技术的看法,PPT在这里http://www.cs.berkeley.edu/~pattrsn/talks/keynote.html,后面提到了Team的重要性,列举了他的几个成功的项目的Team, 包括RISC,RAID,Now,
    中间还附上一张昨天Panel的几个人,标题是“These Old Man”,很有意思
    不过牛人就是牛人啊,干什么事情都早。和他的老婆Met at 12 years old,Stated dating at 16,Married at 19,Kids at 21,看来我们已经是不行了
    下午重点听了
    Session 4b: Interconnect Networks - Part II
    第一篇是 Li-Shiuan Peh的学生讲片上网络多播的,没有什么新东西,包括多播网络的创建,系统的,看到真人的,比照片上要更瘦,更PP,呵呵
    MIRA: A Multi-layer On Chip Interconnect Router Architecture,重点关注了3D技术对片上网络的影响和支持,会后和一个作者,PP的印度MM聊了一会他们的系统,感觉实验系统关注的东西和我们关注的东西很不一样,而且他们做研究的方式也不太一样。我们做的东西一定是要实现出来的。
    Session 5b: System Architecture and I/O
    磁盘内部的并行,使用了多arm,多磁头的方式来降低旋转带来的功耗和寻道开销,有点意思
    一篇讲warehouse-computing server设计的文章,使用各种方式来降低系统的整体设计的开销,如功耗,内存性能,磁盘性能,Package的影响
    一篇使用NAND Flash来做Disk Cache,考虑到了NAND Flash的特性,便宜,密度高,慢,不可靠,做了一些体系结构的设计,
    晚上人民大会堂的国宴,音乐会很赞,小姑娘们的演奏非常的好,包括前面的古典乐(Vavaldi的四季......),以及后面的民族乐曲,都很熟悉,,不过吃的的确一般,没有什么菜印象深刻

    周三上午没有赶上老胡在ISCA上的演讲,据说老胡英语不好,不过讲得还行,中间Patterson还提问了,不知道老胡有没有提到毛泽东思想,呵呵
    后面重点听了两个Session
    没有什么太大印象
    Session 6b: Application Acceleration
    VEAL
    Fudan的Haibo Chen讲了一下他们使用Intatium的Delay Exception做的安全相关的一些东西
    Session 7a: Performance Evaluation
    中间印象非常深刻的就是Power5的评测
    以及从用户体验的角度来做功耗,频率,角度非常的新颖,使用PAPI来做性能的度量,最后找到了用户体验和性能之间的一些关系,很有意思
     
    下午爬嘉峪关的长城,
    上去的时候很陡,很急,都汗流浃背的,有人开玩笑说“ISCA is a really hard conference”,长城上面还有人开玩笑“Great Memory Wall”,呵呵
    中间见到Yale Patt,标志的牛仔裤和棒球帽,不过很energetic,

    听完一个牛会,发现自己现在的功力还是有长进,至少看到像模像样的文章,可以化繁去简的,看到中间真正关键的地方,知道他们的工作做到了一个什么程度。
    几点感受:
    • 研究的主体还是PHD,会上面的东西绝大部分都是PHD们做的
    • 工作一定要非常的完全(complete)和不可置疑,这样才能够算是一个好的研究。所以现在还是需要自己更加的hardwork,把自己的东西做到一个不可质疑的程度,Solid work的确很难啊,
    • 自己对自己的工作Passion,这个是最关键的,要Enjoy your Research
    6/21/2008

    KongFu Panda

    周五晚上在电影院看的,很好,非常的可爱
    里面的山水,动物,功夫都做得非常的地道,中国化,如果不是动物们说英语都看不出来是Dreamwork的老外拍的
    尤其是Po,太搞了
     
    强烈推荐
    6/20/2008

    可以去听ISCA啦

    ISCA08在北京开,计算所是协办单位,
    我们这帮博士沾光,可以去听ISCA啦,
    顺便粘粘牛人的仙气
    6/4/2008

    多难兴邦

    感慨一下
    6/2/2008

    冲击

    周六科大USTC北京校友会50周年校庆,
    故地重游,感慨万千,
    唱校歌,听西区的区长讲述当年的故事,也听到了张亚勤,邓中翰这些超级牛人的故事
    尤其是看到那些58,59,78的老校友们,非常感慨
     
    以后要洗心革面,重新做人

    5/12/2008

    地震了

    还以为是自己没睡好头晕,结果是普遍"头晕"
    反应过来地震了,就停了
    大地都在抖太恐怖了
     
    幸好北京不在地震带中 

    后续, 汶川地震导致的死亡人数已经超过12000, Bless灾区的人们

    5/11/2008

    身体健康最重要

    师姐病了,还病的不轻,
    感慨中,身体真的是革命的本钱
    自己既要拿命换钱,也要拿时间换健康
     
    是时候多花时间锻炼了