数据中心

数据时代的未来 互联网+数据中心

    数据中心是全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。

    数据中心是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。谷歌在其发布的《The Datacenter as a Computer》一书中,将数据中心解释为“多功能的建筑物,能容纳多个服务器 以及通信设备。这些设备被放置在一起是因为它们具有相同的对环境的要求以及物理安全上的需求,并且这样放置便于维护”,而“并不仅仅是一些服务器的集合”。

    采用internet接入时,只需要一台能上网的PC加数据中心软件即可。文中路由器指的是一般公司上网时是通过路由器上网的,此时须在路由器上做一些设置。也可直接把宽带接入线接至PC中来实现。不需要ISP开通服务。但在根据获取的外网IP地址及方式选择采用合适的动态域名软件。

    关于gre两端地址,radius server地址,企业路由器端口地址都由无线设备拨号时自动获取。无线设备与运营商通信设备之间自动协商,不需要设置。

    数据中心如果需要采用无线方式,也可采用H7920 移动路由器实现。但要注意带宽。

    采用运营商提供的专线接入时,一般到用户端已是RJ25接口,数据中心不需要任何硬件。有PC机即可。也不需要开通任何服务。但一般使用专线接入时,都会采用APN或VPDN方式组网内部私网,从而能分配固定IP地址,方便管理。

    具体组网结构如下

    无线DDN系统分为监测点和数据中心两部分,监测点采用GPRS DTU,可提供RS-232、RS485、以及以太网接口,数据中采用宽带ADSL或专线方式接入Internet,具体接入方式如下:

    监测点接入方式: 监测点通过RS-232、RS485或以太网接口与GPRS DTU传输模块连接,然后设置DTU相关参数,每一个GPRS DTU传输模块装入一个中国移动的数据SIM卡即可。b) 数据中心接入方式:数据中心接入主要分两大类:

    1)采用Internet接入 数据中心采用宽带ADSL接入方式,此种方式优点是带宽大、费用经济。缺点是安全性较差、延时比专线接入稍大。采用局域网共享上网方式,此种方式基本同ADSL接入类似,但注意接入时需做端口映射。采用电话线拨号上网方式。此种方式接入带宽较窄。所以只适合于点数较少,且数据量小的组网方式。网络拓朴图如下:

    2)移动公司接入 数据中心采用无线网络运营商(指中国移动)提供信道接入,此种方式实际中有以下几种连接方式:采用移动公司机房专线接入方式,此种方式带宽大(一般为2M),对延时、安全性都非常好,但租用此专线价格较贵。特别适合银行、POS机组网等需安全系数较高的用户,对子站非常多的情况下也推荐采用此种方式。采用GPRS无线接入方式,此种方式在数据中心接一台GPRS MODEM,通过数据中心的PC机拨号上网。优点是组网讯速,费用经济。缺点是带宽窄(GPRS上行10Kbps,下行40Kbps),延时大。这种方式在测试时用的比较多。如果准备在实际工程中使用需注意SIM卡需申请APN。

    新型的网络拓扑结构

    新的网络拓扑设计是一种专用通道的拓扑结构,具体的应用走专用的网络通道,这种拓扑设计理论上考虑到网络内的设备可以自由移动物理位置,并继承了传统网络拓扑结构的交换机转发数据的特点。虽然目前的主流网络好像用不上这些技术,但新兴技术的成熟总需要时间来验证,也许不是现在,但作为次世代的技术,在未来有很大的发展空间。包括:多层的leaf-spine网络拓扑结构、Hypercube立方体网络拓扑结构、Toroidal环形网络拓扑结构 、Jellyfish水母型网络拓扑结构 、DCell网络拓扑结构 、FiConn网络拓扑结构、BCube网络拓扑结构 、CamCube网络拓扑结构 、Butterfly蝴蝶型网络拓扑结构。

    互联网

    DCCI互联网数据中心(DATA CENTER OF THE CHINA INTERNET,简称DCCI),是中国互联网独立的第三方市场监测、受众测量平台,专业数据采集与研究平台。通过线下、线上等不同渠道,采用专业研究人员与技术相结合的手段,面向产业市场、用户受众两个方向,进行动态、精确的监测、测量、统计、分析、研究、预测。

    采用统一的方法、统一的样本、统一的定义、超大的样本量、精确有效的样本结构、动态持续的深度监测,DCCI通过中国互联网领域最大规模市场用户调查等工作,首次实现了对中国互联网各类市场领域、各个企业服务、互联网用户/受众的统一测量,由此实现了不同细分市场、不同企业服务、不同用户受众群体的统一研究,实现了横向、纵向、点对点进行统计、分析以及不同网络媒介之间真正意义上的可比较性。对于此前各类研究机构小样本量、项目零散、时间空间区间完全不同、研究框架和定义差异较大,因此无法进行数据对应、持续性研究,以及无法实现的在同一个维度、体系下对于互联网各个层次主要要素进行关联、比较、交叉分析的状况而言,可谓是互联网研究监测领域最重大的突破。相关成果,对于互联网系统研究、网站从业者研究自身业务结构、把握竞争对手市场状况,以及在对不同媒介受众价值进行深入比较的基础上实现网络广告的精确投放、网络营销的精确互动,有着突破性的现实意义和价值。

    世界数据中心(World Data Center)是国际科学联合会下设的科学数据组织,有40多个学科数据中心,分属四个数据中心群:WDC-A 美国、WDC-B 前苏联、WDC-C 欧洲和日本、WDC-D 中国。

    1988年,中国加入WDC,并建立世界数据中心中国中心(World Data Center D)。WDC-D组织机构包括:中国国家协调委员会、科学委员会、中国中心协调办公室、科学委员会秘书处及九个学科数据中心。

    中国有九个分中心

    海洋学科数据中心     国家海洋信息中心

    地震学科数据中心     中国地震局分析预报中心

    地质学科数据中心     中国地质科学院信息中心

    空间学科数据中心     中科院空间中心

    天文学科数据中心     中科院国家天文台

    气象学科数据中心     国家气象中心

    冰川学科数据中心     中科院寒旱所

    资源环境学科数据中心 中科院地理所

    地球物理学科数据中心 中科院地质地球所

    虚拟化

    企业级的数据中心的发展趋势是具备高度的灵活性和适应性,比如能根据外部需求做出快速变化,如何实现这些技术,虚拟化技术,或是模块化数据中心的创建等,都是比较好的解决方法。

    快速变化的商业需求和有着大规模能耗和制冷需求的最新技术都在催生数据中心的改变,而这些则意味着企业需要花费巨额资金,举例来说,刀片服务器的问世彻底改变了每平米的能耗和制冷需求,因为刀片意味着需要耗费更大的能源及散发更多的热量。

    市场咨询公司Gartner预计,刀片会在未来被更加灵活的服务器类型所代替,这类服务器的计算架构会把内存、处理器、输入输出设备一起作为共享资源池看待,然后根据使用者的需求把这些资源进行分配和再分配。用户不用依赖硬件厂商来决定每台服务器的硬件配置,而是根据企业的需求,来购买资源,从而实现更高效的资源和利用。IT部门可以把32片刀片服务器和部分内存模块合并在一个大型服务器内,作为一个固定的计算单元来使用,这样的做法是通过减少资源的浪费来提高服务器的利用率,但是,刀片服务器是无法根据IT部门运行的应用软件来进行优化配置的。

    Gartner认为"数据中心的设计原理是很简单的,就是计算出当前的需求,再把未来15到20年的增长需求估算在内,就可以建设配套设施了。最新建造的数据中心开放时通常会有大量的空置空间,整个数据中心都要依靠UPS,供水,供电和制冷系统的支持,但多数空间却是闲置的。这就导致了硬件设备和供电系统的费用居高不下,这种模式是低效的"。

    而分散建造数据中心的方法是价格每个区域都是独立配置的,但这并不会意味着数据中心会被分散,分析预测,企业数据中心作为私有云运行,这种灵活的计算网络通过谷歌和亚马逊这样的公共提供商进行模块化,然后在内部对企业自己的用户进行管理。

    私有云会需要后操作系统来把所有的企业分布式资源作为单独的计算池来管理,分析师预测,虚拟化的日益普及是源于X86服务器操作系统的故障,这从根本上限制了每台服务器的功效,从而导致了无数能源的浪费,并且,虚拟机的配置是非常容易的,因此,虚拟化发展非常迅速。

    当IT产业呼吁高效节能的服务器操作系统,并且能够根据应用软件的特殊类型进行自定义,从传统的功能型操作系统逐渐向整个数据中心的后操作系统时代过渡会成为必然。

    后操作系统仍然处于发展阶段,VMware公司最新的虚拟数据中心操作系统就是如此,有分析师把整个概念描述为"位于应用软件和分布式计算资源之间的虚拟化层,它能利用分布式计算资源来执行日程管理,负载,应用软件监管和错误处理"。

    所有这些最新的概念和技术诸如云计算,虚拟化,后操作系统,分散建造数据中心,更多自定义化服务器体系架构都在推动数据中心向未来迈进,IT部门能按照用户的个性化需求来提供按需定制的服务,而不必担心空间或者能源的浪费和过度配置,目标就是创建操作便捷,适宜发展的数据中心资源。所有的一切都是为了实现数据中心的灵活性,为了更好的适应需求的变化。 

    应用

    一个数据中心的主要目的是运行应用来处理商业和运作的组织的数据。这样的系统属于并由组织内部开发,或者从企业软件供应商那里买。像通用应用有ERP和CRM系统。一个数据中心也许只关注于操作体系结构或者也提供其他的服务。常常这些应用由多个主机构成,每个主机运行一个单一的构件。通常这种构件是数据库,文件服务器,应用服务器,中间件以及其他的各种各样的东西。数据中心也常常用于非工作站点的备份。公司也许预定被数据中心提供的服务。这常常联合备份磁带使用。备份能够将服务器本地的东西放在磁带上,然而,磁带存放场所也易受火灾和洪水的安全威胁。较大的公司也许发送他们的备份到非工作场所。这个通过回投而能够被数据中心完成。加密的备份能够通过Internet发送到另一个数据中心,安全保存起来。为了灾难恢复,各种大的硬件供应商开发了移动设备解决方案,能够安装并在短时间内可操作。供应商像思科系统,Sun微系统,IBM和HP开发的系统能够用于这个目的。

    中心作用

    可能各大IT新闻都会提到“数据中心”, 看起来是很庞大的家伙,IT巨头Google、MS等耗资巨头投入到数据中心建设中,那么什么是数据中心? 从字面意思,非IT人可能人认为是放数据的计算机中心,其实这只是表面,数据中心的建设在不同情况,它的作用是不完全一样的。

    在数据处理中,分为两大类。一是事务处理,二是数据查询和分析。数据处理或者分析,一般是在数据库中处理,而数据查询分为两大类,一是数据库查询,二是搜索技术。而随着各种技术的互相作用,搜索技术和数据分析也越来越有“合作”的意思。

    搜索技术还处于“模糊查询”阶段,也就是从数亿计互联网信息中模糊搜索出想要的信息,但由于是模糊查询,所以绝大多数信息都不是想要的,于是几大巨头都在把数据挖掘技术容入搜索技术中,缩小客户搜索到准确信息的时间。

但由于搜索技术其“模糊特点”,在企业内部的信息化中,暂时还不适合,因为企业查询的需要是准确的信息,老板可没那么多时间一个个排除。于是企业内部建设的数据中心基本是数据仓库,为准确查询和分析服务。

    那么何为数据仓库?前面提到的企业/单位投资信息化,他们不停上信息化系统,比如ERP、CRM、Call Center、OA或者计费等。但上了这些系统后,会产生大量数据,客户首先的需求是查询和报表。但很多报表和查询是需要跨系统的,而且复杂查询和报表很耗 资源,可能影响各个系统的正常运行。于是上世纪80年代人们专门建设一个数据库系统,把各个系统的数据拿到那里进行准确的查询和报表制作,这样既方便又准备,而 且不会影响业务系统。那么从这点说,数据仓库是全数据的集合。

    而后来查询和报表已不能满足人们的需求了,他们想知道这些数据里到底有哪些有价值的信息,会给决策者哪些有用的帮助。于是上世纪90年代人们把OLAP和数据挖掘 加入数据仓库应用之中。为了更好地分析,人们从数据仓库里还会按照业务需要提出N多数据集市为查询、分析服务,这样会更方便,因为不同部门的需求不同,业务定义也可能不同,所以把数据仓库的信息分到各个数据集市是很有必要的。

    但有一点要申明,数据仓库和OLAP、数据挖掘以及查询、报表没有必然关系,他们是不同的逻辑事物,但相互作用密切。正如前面提到,数据挖掘已经结合搜索技术,更方便地给人们提供互联网搜索服务。而数据挖掘在数据仓库的作用,就是更好地分析,比如著名的沃尔玛尿布和啤酒的案例就是数据挖掘的结果,它把数据中很多潜罪责找出一定联系的几率,这样来帮助企业决策。

    那么数据中心是何物?如果是针对具体的企业或者单位,其实就是业务系统数据存储技术+数据仓库,当然有的单位干脆只有数据仓库,比如科研单位,他们又不作 业务处理,只有分析需求。但如果是互联网公司,就和普通企业和单位的数据中心不同,因为互联网的信息实在庞大,不可能包罗所有信息到数据库,也处理不了那 么多信息,所以他们的数据中心的其中作用就是加强互联网数据的处理速度和效果;另一个作用也是数据仓库,但他们的数据仓库就不会包含所有互联网信息,而是企业本身关心的信息,当然数据量也非常大,一般十TB以上。

    中国信息化其实还在初级阶段,可能很多人认为有了PC,可以上网,有很多软件用,信息化程度就上去了?其实不然。信息化的高级阶段应该包括准确快速处理、查询、分析数据等。当前美国几乎所有国家级政府部门、科研机构都配有数据仓库系统,而中国很多部门的普通业务系统还不够完善,更不要说建设数据仓库了。

    其实最有意义的一个项目,应该是中国农业部数据仓库的建设。数据中心/数据仓库建设后,全国各乡镇级以上都可以作为其用户,查询具体信息和分析信息,还会出现农作物卖不出去,老百姓买不起的现象吗?不会!因为各个地方适合种什么,当年各种作物的市场需求等都看在眼里。然而信息化不是万能的,还要 有相应的配套措施,比如农业技术指导、专门的采购、物流、销售公司等。

    架构展望

    以Web为中心的计算技术的兴起意味着关注IT资产的角度从物理转向了逻辑。

    德国哲学家尼采说过:“那些未能摧毁我的,使我更强大。”是的,如果你能在这一度繁荣又一度萧条的IT轮回中活下来而不会感到焦头烂额,那么你一定觉得自己真的很强大。不过且慢,还不到松一口气的时候,现在你需要利用已经积聚起的每一分力量,去和面前那些动摇IT业的变革做一番争斗。

    主要的技术供应商和向前看的网络及IT经理人都认为,一个以Web为中心的崭新计算模型正在孕育成形,但是对于这个计算模型最终的形态以及该如何命名,他们却莫衷一是。会象IBM鼓吹的那样成为按需计算吗?会是Oracle、Sun和其他厂商力推的网格技术热吗?还是完全朝着公用计算、自动计算、虚拟化或其它方向前进呢?

    服务器

    新数据中心演变的核心是计算平台的战略选择。哪一种平台能够最好地支持ERP和CRM等传统应用以及崭露头角的面向服务的Web应用?你必须在标准Intel服务器、专有硬件和刀片服务器之间做出选择,并且为64位系统以及网格和虚拟计算技术的到来做好准备,或者你也可以选择本质上把流程外包的按需计算产品。

    基础架构软件

    然后,你就得为各种相互竞争的操作系统(Unix、Linux和Windows)决定它们的最佳作用,每一种操作系统都经历着不同的成功道路。在Windows领域,你正在关注操作系统和微软其它核心软件组件的多种升级技术,以便支持更强有力的合作和应用集成。

    另外,你还要为新一代的Web应用挑选开发平台。如果你对围绕这些新应用的各种标准、安全和管理问题尚不了解,那么很快你就会变得内行。

    网络和Web基础架构

    你的网络基础架构必须能够满足合作新需求以及Web应用的爆炸性增长。为VoIP和新兴的会话初始化协议(Session Initiation Protocol)应用提供高质量支持做好准备,这有可能意味着将中枢和数据中心交换机升级至10Gb/秒以太网,以及将配线室升级至1G。

    许多公司还部署了一大批新设备,以解决具体的高容量、高交易量Web站点和Web新应用的问题--比方说,第4层至第7层交换机、安全套接字层加速和负载平衡等。在整个Web基础架构生态系统中,各厂商相互竞争的领域不仅在产品性能上,也在将更多功能合并至一台设备的能力上。不过最终你希望构建一个单一的网络基础架构,而不必继续为每一次网络新挑战急急惶惶。这将导致Web和传统基础架构厂商之间在控制能够支持现有和分布式新应用的统一网络时发生冲突。

    存储

    存储市场将继续经历飞速的变革,这些变革由现正进行的存储资源网络化以及存储虚拟化进程所推动。存储区域网络(SAN)、网络连接存储(NAS)和IP存储将在你的战略计划中起到什么作用?很多重要的业务问题同样在重塑存储业。企业需要采用新方式从所存储的信息中收集业务情报,新的服从和报告法规的******也表明存储需求正在迅速增长。

    安全

    牢固的安全措施是新数据中心所必需的,但目前仍然很难描述。各种威胁不断变化而且攻击越来越密集,但是各公司却想方设法让应用更加分散、信息更容易访问,这两者结合是很危险的。

    在未来几年,你必须选择如何以最佳方式在整个新数据中心部署安全技术:应该安装什么硬件、软件和网络基础架构安全工具?管理化安全服务应该起到什么作用(如果能起作用的话)?你如何使用越来越多的安全工具管理数据大潮?还有令人头疼的是,不断打补丁的软件和无线技术安全难题,这些可真够你受的。

    网络和系统管理

    随新数据中心而来的是系统和网络管理的新需求。主要厂商必须超越设备管理层面,让用户对应用性能有清晰了解--然后提供各种工具确保这些性能的发挥。还有,你需要更好地支持移动设备、网络和安全管理集成,并且了解和热衷于IBM、HP和微软等主要厂商的自动化(即自我恢复)管理战略。

    数据中心的可再生能源

    数据中心内的能源消耗,总体而言是非常有效的。随着虚拟化和云计算的增长,数据中心的整体能源使用效率才会有所改善。能源浪费最严重的阶段其实是制造能源的时候。

    无论是煤、煤气或燃油为数据中心提供能源,大量能源损失都发生在其产生阶段。大多数化石燃料系统也都位于远离市区的地方。更先进点,更小型的能源制造设备可以改善这种情况。高温燃料电池采用一系列碳氢化合物燃料,将其分解为氢,然后从空气中获取氧,用于创造电能,并产生热量与水分。

    关键在于尽可能多的捕捉输出。燃料电池产生的热能可以被用于为寒冷的空间提供供暖,甚至为水加热。手机燃料电池所产生的纯净水有助于缓解位于缺水地区数据中心的用水紧张。可再生资源如太阳能与风能同样可以用来进行电解水,为燃料电池制造氢。然后可能建立一个真正可再生的连续数据中心主电源系统。这种方法不一定是制造电能的最便宜方式,和那些交钱就能获得能源的方法相比,但它确实一个为数据中心长期供电的有效手段。

中华人民共和国工业和信息化部主管  |  中国电子商务协会主办  |  中国智慧城市大数据运营中心承办   ©2012—2018  版权所有  京ICP备16036385