浪潮“天梭K1”让关键数据跑在自主平台上

2015-01-09 16:33:00    作者:李兆辉   来源:大众网  我要评论

关键词: 容错计算机 电力调度系统 superdome 内存数据 K-UNIX
[提要]中国国家互联网应急中心的数据显示,2013年3月3月19日至5月18日,来自美国的网络攻击直接控制了我国境内约118万台主机和1754个网站,造成的攻击约1.7万次。浪潮首席科学家王恩东介绍获得国家科技进步奖一等奖的“天梭K1”系统。

  大众网记者 李兆辉

  中国国家互联网应急中心的数据显示,2013年3月3月19日至5月18日,来自美国的网络攻击直接控制了我国境内约118万台主机和1754个网站,造成的攻击约1.7万次。而目前,我国银行业务数据库、大型证券交易系统、电信综合计费与运营支持系统、民航进出港系统完全依赖国外主机,我国的机密数据,将面临随时被窃取的可能,核心系统面临随时被摧毁的可能。只有有了自主的主机,国家信息系统核心命脉才能握在自己的手中。

  2008年12月,为破解我国关键性应用主机缺位的困局,国家将其列为战略必争的重大项目,科技部“十一五”“863计划”正是一项高端容错计算机项目,选择浪潮来承担。460人、45个月、7.5亿元投入、100多项技术创新和改造,2011年8月终于研发成功,中国成为继美日之后第3个有能力研制32路高端容错计算机的国家。目前,天梭K1已经在12个行业全部实现了应用,占据了12%的市场份额。

  浪潮首席科学家王恩东介绍获得国家科技进步奖一等奖的“天梭K1”系统。大众网记者 李兆辉 摄

  “天梭K1”系统研制成功共获得100多项国家专利。大众网记者 李兆辉 摄

  1月9日,2014年国家科学技术奖励大会在人民大会堂举行,国家主席习近平、国务院总理李克强等领导同志出席大会并为获奖代表颁奖。大会宣布了国家科技进步奖等5个科技类最高荣誉的奖项归属,超深层生物礁大气田勘探、高端容错计算机、H1N1大流行防控技术等一批对国家长期科技发展和社会经济全局具有重要意义的创新成果分别被授予国家科技进步一等奖。

  浪潮首席科学家王恩东上台领奖,并在接受大众网记者采访时介绍,“高端容错计算机系统关键技术与应用”项目由浪潮集团完成,项目成果为天梭K1系统,这是近年来计算机领域获得第一个国家科技大奖。天梭K1系统是中国第一台高端容错计算机,最大可扩展32颗处理器,每分钟能够完成几百万次联机事务处理,可用性达到99.9994%。它可以实现对我国既有软硬件设备的兼容,制定周密的“迁移”解决方案,实现对国外信息系统的替代或迁移。

  为何最高奖是“天梭K1”高端主机?

  浪潮第一台天梭K1系统至今已不间断运行了4年

  高端容错计算机是专门承担关键应用系统的系统平台,一旦出现停机事故,将会严重伤害客户业务,甚至在社会经济层面造成影响。所以,高端容错计算机的最基本的应用需求是:能够提供99.999%的高可用性,可以7*24小时不间断运行。

  王恩东说,天梭K1也必须对各类故障、隐患以及外部不利因素都要做充分的考虑,从可用性的角度看,研制高端容错计算机就像用积木来搭一个摩天大厦,必须开发一套完整的容错技术来消除每个可能出现的问题,保证系统运行的连续性。

  “破解核心技术是浪潮遇到的第一个难题,那就是如何让天梭K1系统处理器数量超过8颗。关键应用主机不仅可以通过处理器升级来获得性能提升,还可以通过增加处理器数量来提高性能,但是当处理器数量超过8颗,就会碰到“内存墙”的问题。“浪潮集团首席科学家王恩东介绍,随着处理器数量的增加,处理器间的通讯强度会呈指数形式增加,甚至是失控。此外,通讯对处理器的消耗是十分惊人的,如果采用一般的处理器协同技术,当处理器数量超过8颗以后,大量的处理器资源都被通讯占用,继续增加处理器数量时,性能提高就会十分有限,其直接的技术表现就是处理器读取内存数据延时过长。

  而“天梭K1”有32颗处理器、256个内存插槽,已经远远超过了初始的技术瓶颈,破解“天梭k1”面临的“内存墙”问题,这是业界几十年来一直难以破解的难题,全球具有该项技术开发能力的公司不到5家。

  此外,操作系统是硬件资源的管理者,是实现高端容错计算机系统功能、保证系统性能和可用性的关键子系统。高端容错计算机需要专配的操作系统,无论是性能、可靠性还是安全性,普通操作系统不能满足高端容错计算机的技术需求。

  王恩东告诉大众网记者,浪潮还研制成功中国第一款Unix 操作系统K-UX,在研制过程中浪潮开发3200 余项Unix 特性,成功通过The Open Group Unix 03 国际标准认证60000余项测试,并对该标准提出七项修改,全部被纳入新的测试标准。通过UNIX 03认证,意味着K-UNIX进入了关键应用软件俱乐部。

  浪潮最终创建了多层次冗余与故障管理容错系统模型,天梭K1在芯片、模块、固件、操作系统、业务应用层面全面采用冗余设计以杜绝单点故障,采用故障诊断、隔离和恢复的全流程自动处理技术,系统可自我修复,整体可用度超过99.9994%,而且天梭K1的容错技术经受住了实际应用的检验,第一台应用的天梭K1系统迄今为止已经连续运行了1500多天,十分稳定。

  “天梭K1”离我们有多远?

  “天梭K1”已应用到12个民生和国家关键行业,占据12%市场份额

  “天梭K1”高端主机主要应用于金融、电信、电力、交通等国家关键行业信息系统。而在中国,大型商业银行每天处理5亿笔交易,人们在ATM机、柜台、网上银行的每个操作都会经过终端、区域数据中心、全国数据中心,逐层汇聚到主机,进行数据抽取、查询、修改和保存等实时处理。每一天,144亿个电话和短信,2400万笔证券交易、87万旅客进出港、137亿千瓦时的电力输送、海量数据和实时信息服务的背后,主机系统正担负着国家关键性基础设施信息系统的心脏。

  王恩东介绍,虽然高端容错计算机的研发十分困难,但是后期的应用推广会更困难,高端容错计算机需要与相应的软硬件配套才能实现应用。主流的配套软硬件厂商以及垄断中国市场的高端容错计算机厂商均为美国企业,他们结成了稳固的利益联盟,对于国产企业十分抵制。另一方面,高端容错计算机技术都是封闭的,高端容错计算机都承担着关键业务,更换的风险很大,所以用户应用的积极性也不会很高。

  “一定要让用户从研发阶段就参与进来,而且要请最典型的用户。”王恩东说,浪潮“天梭K1”的市场应用首选的是中国建设银行,因为金融是高端容错计算机最大的市场,也是应用需求最苛刻的行业,用户的全程参与会让天梭K1系统与用户的应用更贴合。

  据了解,新疆建设银行有300多台套服务器及存储设备,管理类软件、基本系统类软件近20款,浪潮和新疆建行双方的专家进行了大量的测试验证工作,来实现天梭K1对既有软硬件设备的兼容,制定了周密的“迁移”解决方案和后备应急方案。终于在2011年8月,中间业务系统迁移完成,取代了IBM进口小型机。3年多以来,天梭K1运行稳定,承担的新疆建行生产业务系统,已覆盖全省14个二级分行、近200个营业网点、3300多个柜员、2万多台自助和电子设备,包括网上银行、电话银行等电子银行业务。

  据统计,“天梭K1”目前已经在12个行业全部实现了应用,占据了12%的市场份额。

  “国外厂商都是利益导向,如果没有话语权,他们根本不会同浪潮合作。”王恩东回忆说,在产品研发之初,浪潮就不断去找国外厂商谈合作,都吃了闭门羹,对方要么提出浪潮不可能接受的条件,例如要浪潮先行支付几千万的软件开发费用,要么来一个“拖”字诀,表示可以支持,但是软件开发测试需要时间,最长3年。

  2014年,浪潮逐步打破了多个行业市场的应用门槛,掌握了相当的市场份额,这时,同国外厂商的合作谈判就容易多了,IBM、SAP等企业相继向浪潮主动示好,现在天梭K1得到了全球产业链的承认。浪潮将继续自主创新,未来的“天梭K1”有望占有30-50%的市场份额。浪潮正在开发性能更高、可靠性更强的64路系统高端容错计算机系统,预计2016年可以推向市场,为规模更大、可靠性要求更高的系统的自主化替代提供技术方案。

  为何巨额投资研发高端主机?

  我国118万台主机曾在60天内被攻击5.7万次

  中国国家互联网应急中心数据显示,2014年3月19日至5月18日,来自美国的网络攻击直接控制了我国境内约118万台主机,对1754个网站植入后门造成攻击约5.7万次。2013年6月13日根据斯诺登揭露,“棱镜”监听计划只是冰山一角。美国在这15年时间通过“巧言计划”,掌握了我国关键信息设备部署信息,进而绘制出中国信息系统布防图,再通过“定制入口”,利用后门、漏洞等手段,控制我们的信息设备、窃取核心数据、瘫痪业务系统。

  “银行、电信、证券、保险、电力等在国民经济和社会运行中具有基础性作用的关键行业,已经高度依赖行业的信息化系统,从银行存取款、打电话、乘坐飞机火车,到电力调度、公共安全保障等一切个人和经济社会活动都不开行业信息化系统的支持。”王恩东介绍,目前,信息化已经对社会生产生各领域高度渗透,这种趋势不仅体现在微信、门户、搜索等人们日常生活中接触最多的互联网服务,更体现在行业信息化领域。

  为此,国家“863计划”设立了“十一五”期间投资最大的专项“高端容错计算机系统关键技术与应用”,并列入“战略必争”项目。浪潮经过4年多时间的科技攻关,研制成功天梭K1高端容错计算机系统,为中国关键数据和系统运行在自主平台上提供了技术方案,也为实现国家信息安全战略的全面自主可控奠定了基础。

  王恩东说,高端容错计算机是现代计算机产业皇冠上的宝石,产业技术门槛远高于PC、手机和一般服务器,耗资巨大,风险大,周期长。例如,IBM 针对中低端高端容错计算机的eX5架构,研制费用就高达8亿美元,研制周期长达5年,超出了一般企业、甚至政府的承受范围,这是中国主机产业空白的重要客观原因。

  而且,高端容错计算机是市场利润的主体,也是整个软硬件产业的核心,中国信息企业要实现转型升级,没有高端容错计算机技术的支持几乎是不可能的。IT产业巨头都有完善的高端容错计算机技术,例如IBM的power,HP的superdome等,并且以此为基础形成了封闭而成熟的技术系统,持续获得高额利润。根据IBM公布的财报,其高端容错计算机在2010年-2011年营收分别增长16.4%和8.4%,IBM硬件业务在产业利润日趋摊薄的大形势下,仍然取得了高达38.5%利润率。

  为何高端主机要实现自主?

  中国核心系统和机密数据长期在国外平台上运行

  王恩东说,欧美日等发达国家一直将高端容错计算机相关技术作为国防战略技术,对中国实行严格的技术封锁,这使得中国很难通过技术交换、商业收购等手段获得该技术。美国相关法律法规从不同角度严格规定了技术控制的细节,还主导成立了瓦森纳组织来对中国、俄罗斯等进行技术禁运,“瓦森纳禁运名单”在计算机类别的第三个条目明确列出了“Control units which directly interconnect the buses or channels of central processing units”,也就是处理器协同芯片组技术,高端容错计算机的核心技术。

  信息战争较量的背后,主机系统成为争夺的核心。每一天,144亿个电话和短信、240万笔证券交易、87万旅客进出港、137亿千瓦时的电力输送,海量数据和实时信息服务的背后,主机系统正担负着国家关键性基础设施信息系统的“心脏”。

  据了解,2013年6月23日,中国工商银行数据中心主机系统故障,导致全国多地工行柜台、ATM、网银业务暂停几个小时,波及北京、上海、广东、武汉、哈尔滨等多个大中型城市,2.92亿个人客户、400多万个公司客户受其影响。

  “中国一直没有自主的高端容错计算机技术,这一问题导致中国信息安全在核心层面面临不可控的后门隐患。”作为高效能服务器和存储技术国家重点实验室主任、浪潮首席科学家王恩东在接受大众网记者采访时介绍,目前,中国高端容错计算机面临国外的技术垄断和国际厂商的市场垄断,中国的核心系统和机密数据长期以来运行在国外的平台上。

  而各个行业信息化系统中关键模块和核心数据处理模块都运行在“高端容错计算机”上,比如银行的储蓄业务系统、证券的交易系统和报价系统,电信领域的计费系统,能源领域里的电力调度系统,民航领域的机场进出港系统等,高端容错计算机一旦出现问题,往往会严重伤害用户的实际业务,甚至会给社会造成严重影响。

  在“天梭K1高端容错计算机”研制成功之前,我国银行业务数据库、大型证券交易系统、电信综合计费与运营支持系统、民航进出港系统完全依赖国外主机,我国的机密数据,面临随时被窃取的可能,核心系统面临随时被摧毁的可能。只有有自主的主机,国家信息系统核心命脉才能握在自己的手中。

初审编辑:曹亮
责任编辑:王盈盈

大众网版权与免责声明

1、大众网所有内容的版权均属于作者或页面内声明的版权人。未经大众网的书面许可,任何其他个人或组织均不得以任何形式将大众网的各项资源转载、复制、编辑或发布使用于其他任何场合;不得把其中任何形式的资讯散发给其他方,不可把这些信息在其他的服务器或文档中作镜像复制或保存;不得修改或再使用大众网的任何资源。若有意转载本站信息资料,必需取得大众网书面授权。
2、已经本网授权使用作品的,应在授权范围内使用,并注明"来源:大众网"。违反上述声明者,本网将追究其相关法律责任。
3、凡本网注明"来源:XXX(非大众网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。
4、如因作品内容、版权和其它问题需要同本网联系的,请30日内进行。