数据中心基础设施层包括哪些 罗霆:如何定位数据中心基础设施管理

罗霆:如何定位数据中心基础设施管理
罗霆:如何定位数据中心基础设施管理
罗霆:今天很高兴有这样机会跟大家交流一下,我们公司的一些想法和经验,今天的主要内容是关于如何定位数据中心基础设施的管理。传统意义上的数据中心通常会和IT隔离出来,在云计算时代,我们会认为数据中心所有服务的东西都应该作为一个基础设施来看待,就像微软的集装箱,这里面已经拥有了IT技术的中心,在这个层面上就可以展开了,我们IT只能拿到我们的网络,我们的服务器。因此意味着我们把跟IT架构的环境和整个环境作为一个统一的对象来考虑,并且考虑到之间的相互管理,这点对我们传统意义上的数据中心是不太一样的。
在数据中心的生命周期角度来讲,从设计开始,会经过实施运营持续的勾画,我们会发现这是一个数据的管理,在设计阶段,我们可以看到作为基础设施来说,IT部门不是具体到服务器的一个数量,这个时候我们需要考虑的是运算的能力,就是数据中心到底能够支撑多少运算的能力,从能力这个层面上考虑的,因此数据中心的要有这样的能力,这个能力不能一估就10年,但是我们通常是10年、20年来预估的。整个IT预估的过程起码是1一3年。在设计完整以后,我们进行实施,实施其实是部署的一个过程,部署完成了以后,就接着是一个运营,运营过程要解决一个很大的问题,解决实际运行的情况及跟我们当初设计的情况是否吻合,如果不吻合我们就进行调整,包括做更大动作的调整整改,假设一下,如果现在的实际情况和预想的情况是一致的,在运营层面就不用做太多的工作,现在IT的情况越来越复杂,从IT来说,投入的成本大于我们当初预算的成本,最后一个阶段是优化阶段,我们不断的调整,需求在不断的变化,我们需要进行优化,优化的结果是下一个数据中心的模式的设计,这就变成一个循环。从数据中心的基础设施来讲,IT有五个物理需求,包括攻坚、制冷、空间、安防、布线。我们采购IT设备的标准也必须是统一的,如果这些标准主要反映到我们刚才提炼的五个物理需求上,所以在设计的阶段,我们要注意这五个方面,但是现在的数据中心来说,用户往往会考虑得很周到,更多的是考虑供电和制冷,因为这有一个计算能力的需求,所有的服务器用电90%的用电量会进行排放,所以制冷是一个很重要的因素。在管理的层面上有三个非常重要的地方,第一,保证IT的可控性,我们一般把IT分为三个层面,对底层的是基础设施,上去是IT,IT上去是业务应用,比如说IT层面像业务层面提供服务的,如果业务层面不可用的话,说明IT存在的必要性会受到一个挑战,因此,保证可用性是第一位的,再满足第一位的情况下,我们可以降低运营的成本。对于数据中心的运营来说,我们可以拆散为几个阶段,第一个阶段是部署,也就是支撑IT运营的过程,第二个是IT业务系统的上线,业务开始运作了,我们各种OA都可以运用,第三是对监控系统,发现问题后,我们可以采取相应的行动,确保业务系统的正常运作。第四,确保业务可用的情况下,我们可以用一些技术或者是云的技术新一代的技术实现绿色的优化,降低运行的成本。在数据中心,基础设施目前面临的挑战可以有五点。第一点是可用性,这也是我们存在必要性一个很重要的地方,后面两点是我们在云时代继续生存的要素,包括在生命周期内的可适应性和可扩展性。最后两点的可管理性和可维护性/服务型做到,这五点他们是相互依托的。
回到最初的设计阶段,看上去跟IT没有很大的关系,因为在我们公司的设计阶段,IT基本上是不存在的,只是一个概要的需求,当数据中心运行起来以后,我们可以通过这个图展示数据运行的情况,发现机位是不是过热,供电是不是足够的情况,因为我们设想跟实际情况是有差异的,所以我们要对这个数据进行管理。我们尽可能的缩小实际跟设计之间巨大的差距,当然缩小是不可能最小化的,不然的话,我们的业务就没有发展,到了差距没有办法缩小的时候,我们应该增加一个模块实现扩充,这也是数据中心模块化的定义,当前可以从两个方面缩小差异,一是构建支持硬的基础设施,包括通过可调整模块化的基础设施,比如说,模块化的UPS,模块化的供电,模块化的空调实现基础设施的设计,另外我们可以通过配电和容量管理系统帮助我们掌握基础设施的消化的趋势,我们可以通过了解未来IT的发展趋势,包括云计算这些新的技术,便于我们在数据中心采取更好的技术,使这个数据中心有更强的生命力。
第二块,通过优化基础设施的使用,做一些全面、细致和精准地了解,通过规划地使用基础设施,通过这些延长数据中心的使用,实时检测基础设施,排除异常的情况,从而使基础设施能够得到很好的使用。
假设我们现在是维护一个好的数据中心,其实非常重要的一点是在于挖掘,我们经常说我们的网络是不可管理的,目前大多数的基础设施是可以管的,我们面对新的数据中心的时候,或者是对数据中心进行调整的时候,第一步是对原有投资过的一些功能给挖掘出来,比如说以前的制冷的UPS,把可管理的功能挖掘出来了以后,可以整合到新的平台里面,这是非常重要的一步,这里面涉及到局限性,主要是在于数据的兼容性和管理的细化,可以这样讲,对于一个管理接口,管理的力度决定了可以管理的深度,因此在设计阶段,我们决定自己管理的深度和可管理的光度,在这个层面上决定我们需要购买哪些设备,如果我们投资很多的钱买一个功能丰富的设备,但是发现我们管理上是达不到这个水平的,实际上这也是一种浪费。在基础设施的管理方面,我们很少说管理这个词,大多的时候是使用监控这两个字,在中国的词汇里面,监控有两个方面的含义,检是代表检测、采集和收集大量的数据,控是做一些反馈,调整运行状态,怎么根据收集上来的运行数据决定策略对于大多数的用户来讲,绝大多数都放在检测上,对于监控是一个自化性的,或者是本能执行的手段。如果这是一个云的数据中心,我们就可能在依据手动的方式进行调整,而是根据收集上来的数据进行判断,再根据业务进行混合决定如何控。这个控的过程也是自动的,这样的话,响应的速度才能足够的快,才能满足云计算的要求,同时,这也意味着检测的时候,我们决定着设备采集的信息量的大小。在整个过程里面,我们需要消费我们收集上来的检测数据,加上我们本身对这个数据的知识库,最后形成了一个控制的结果,这也是管理里面最核心的地方。
DCIM已经出来有几年的历史了,他一是某一个概念,它是整个IT圈子的共识,也就是说,数据中心基础设施的管理核心是帮助IT形成一个业务决策,无论购买哪个厂家的解决方案,很多客户这样讲,花了很多的钱买了职能PPU,里面收集很多的能耗、供电的信息,但是这些数据有没有用,可以说,如果这些数据没有帮助我们形成一个决策,这些数据都是零,只是数据,只是信息,除非我们依据这些数据把它做成业务调整和一个块的策略,把这些策略付诸实施,才能形成一个循环起来的价值链。我们既使购买了大量的智能设备,没有相应的操作起来也是没有意义的。
回到前面说的数据,数据是非常重要的,很多用户说,我有决策,但是如果这是决策没有来源于数据的话,决策是等于零的,所以从前端到后端,这两端是不可缺少的,所以DCIM来说,数据是一个基础。在基础架构管理这块的数据来源于哪,我们总结有来源于三大类,一是技能的基础设施,第二大类是IT设备,我们现在可以看自己的服务器,基本上90%服务器都有一个内设的芯片,这个芯片是可以独立的运作的。第三类是我们的传感器,包括温度、风量不同的传感器,我们把所有的数据收集上来。有了这些数据以后,我们需要做一个统一的数据格式,很多时候我们都觉得数据在那里就行了,格式并不是很重要的,但是如果我们对这个数据进行格式的时候,如果没有一个统一的格式就很难处理。数据的格式必须统一起来,否则每个数据集中在自己管理的范畴,当我们对数据中心运营时,我们会采集到多方面的数据,比如说来自传感器的数据,包括空调配电的数据,我们把这些数据关联起来,否则的话,并没有办法做到统一的管理。这样就影响到服务器的正常工作,这样会直接影响到服务器的机箱的温度,如果没有统一的格式,我们没有办法把这些数据做一个统一的管理,所以统一数据是非常重要的。
在管理过程中,我们也可以参考很多的经验,其中非常重要的一条,有很多种管理的流程可以通过我们的管理平台交织在一起帮助我们解决很多的问题,比如说配置管理,这是管理的基础,因为提供的是梦想信息平台,或者说安全管理也是始终贯穿在所有的流程里面。安全管理不是一个单一的流程,包括各种各样的流程都渗透了安全管理的元素,其实在这里有一个概念,我们在DCIM投入的工作量很大,我们需要各种各样的投入,他们之间是相互交织在一起的。另外一个问题,很多购买了DCIM的企业希望把实际和设计联合在一起,所以,每个用户有自己的架构和管理的流程,当用户挑选一个解决方案的时候必须了解这一点。
这是一张投资回报图,里面讲到DCIM有很多管理雅俗,这意味着我们要到一种平衡,我们必须在安全配置、问题、变更上达到平衡,才能发挥各自价值的优势,比如说,我们有一个很大的配置管理系统,面面俱到,任何东西都考虑到,但是没有人用它,它的价值就是零,因为配置管理本身是解决不到任何问题,投入也需要达到一种平衡,这样才有效果。
我们公司是为大家做设计的业务部门,能够提供设计中心的一个解决方案,因此有能力为一个数据中心的模型建立解决方案,能够提供一系列管理解决方案,帮助用户,用户建立从设计到实施到运营到将来的优化形成完整解决方案的公司。刚才我们提到数据采集的形成,包括我们提到很多的流程的管理,包括配置、变更容量等,这些都是埃莫森目前能够在数据中心帮助用户提供一站式解决方案的服务。
个人介绍:
罗霆先生现任Avocent(中国)技术顾问,主要负责Avocent在华南/西南的技术服务和支持工作。是Avocent中国区技术中坚力量。罗霆先生加入Avocent之前,曾服务于戴尔、惠普等著名IT厂商,负责数据中心的核心解决方案的技术支持工作。罗霆先生具备近十五年IT从业经验,具备丰富的IT技术集成和支持的经验。近年来一直从事数据中心架构与管理的售前技术工作,致力帮助用户提供高效、可靠和安全的整体解决方案。
由于不同客户的DCIM管理实践的发展历程不同,在DCIM各子领域的投入权重会有很大不同。实时监控、访问控制、配置管理、运行管理、变更管理、容量管理、问题管理、性能优化。在同一子领域中,不同客户的管理实践也会导致其需求复杂度的不同。
如何优化数据中心基础设施
今天很高兴有这样机会跟大家交流一下,我们公司的一些想法和经验,今天的主要内容是关于如何定位数据中心基础设施的管理。传统意义上的数据中心通常会和IT隔离出来,在云计算时代,我们会认为数据中心所有服务的东西都应该作为一个基础设施来看待,就像微软的集装箱,这里面已经拥有了IT技术的中心,在这个层面上就可以展开了,我们IT只能拿到我们的网络,我们的服务器。因此意味着我们把跟IT架构的环境和整个环境作为一个统一的对象来考虑,并且考虑到之间的相互管理,这点对我们传统意义上的数据中心是不太一样的。
在数据中心的生命周期角度来讲,从设计开始,会经过实施运营持续的勾画,我们会发现这是一个数据的管理,在设计阶段,我们可以看到作为基础设施来说,IT部门不是具体到服务器的一个数量,这个时候我们需要考虑的是运算的能力,就是数据中心到底能够支撑多少运算的能力,从能力这个层面上考虑的,因此数据中心的要有这样的能力,这个能力不能一估就10年,但是我们通常是10年、20年来预估的。整个IT预估的过程起码是1一3年。在设计完整以后,我们进行实施,实施其实是部署的一个过程,部署完成了以后,就接着是一个运营,运营过程要解决一个很大的问题,解决实际运行的情况及跟我们当初设计的情况是否吻合,如果不吻合我们就进行调整,包括做更大动作的调整整改,假设一下,如果现在的实际情况和预想的情况是一致的,在运营层面就不用做太多的工作,现在IT的情况越来越复杂,从IT来说,投入的成本大于我们当初预算的成本,最后一个阶段是优化阶段,我们不断的调整,需求在不断的变化,我们需要进行优化,优化的结果是下一个数据中心的模式的设计,这就变成一个循环。从数据中心的基础设施来讲,IT有五个物理需求,包括攻坚、制冷、空间、安防、布线。我们采购IT设备的标准也必须是统一的,如果这些标准主要反映到我们刚才提炼的五个物理需求上,所以在设计的阶段,我们要注意这五个方面,但是现在的数据中心来说,用户往往会考虑得很周到,更多的是考虑供电和制冷,因为这有一个计算能力的需求,所有的服务器用电90%的用电量会进行排放,所以制冷是一个很重要的因素。在管理的层面上有三个非常重要的地方,第一,保证IT的可控性,我们一般把IT分为三个层面,对底层的是基础设施,上去是IT,IT上去是业务应用,比如说IT层面像业务层面提供服务的,如果业务层面不可用的话,说明IT存在的必要性会受到一个挑战,因此,保证可用性是第一位的,再满足第一位的情况下,我们可以降低运营的成本。对于数据中心的运营来说,我们可以拆散为几个阶段,第一个阶段是部署,也就是支撑IT运营的过程,第二个是IT业务系统的上线,业务开始运作了,我们各种OA都可以运用,第三是对监控系统,发现问题后,我们可以采取相应的行动,确保业务系统的正常运作。第四,确保业务可用的情况下,我们可以用一些技术或者是云的技术新一代的技术实现绿色的优化,降低运行的成本。在数据中心,基础设施目前面临的挑战可以有五点。第一点是可用性,这也是我们存在必要性一个很重要的地方,后面两点是我们在云时代继续生存的要素,包括在生命周期内的可适应性和可扩展性。最后两点的可管理性和可维护性/服务型做到,这五点他们是相互依托的。
回到最初的设计阶段,看上去跟IT没有很大的关系,因为在我们公司的设计阶段,IT基本上是不存在的,只是一个概要的需求,当数据中心运行起来以后,我们可以通过这个图展示数据运行的情况,发现机位是不是过热,供电是不是足够的情况,因为我们设想跟实际情况是有差异的,所以我们要对这个数据进行管理。我们尽可能的缩小实际跟设计之间巨大的差距,当然缩小是不可能最小化的,不然的话,我们的业务就没有发展,到了差距没有办法缩小的时候,我们应该增加一个模块实现扩充,这也是数据中心模块化的定义,当前可以从两个方面缩小差异,一是构建支持硬的基础设施,包括通过可调整模块化的基础设施,比如说,模块化的UPS,模块化的供电,模块化的空调实现基础设施的设计,另外我们可以通过配电和容量管理系统帮助我们掌握基础设施的消化的趋势,我们可以通过了解未来IT的发展趋势,包括云计算这些新的技术,便于我们在数据中心采取更好的技术,使这个数据中心有更强的生命力。
第二块,通过优化基础设施的使用,做一些全面、细致和精准地了解,通过规划地使用基础设施,通过这些延长数据中心的使用,实时检测基础设施,排除异常的情况,从而使基础设施能够得到很好的使用。
假设我们现在是维护一个好的数据中心,其实非常重要的一点是在于挖掘,我们经常说我们的网络是不可管理的,目前大多数的基础设施是可以管的,我们面对新的数据中心的时候,或者是对数据中心进行调整的时候,第一步是对原有投资过的一些功能给挖掘出来,比如说以前的制冷的UPS,把可管理的功能挖掘出来了以后,可以整合到新的平台里面,这是非常重要的一步,这里面涉及到局限性,主要是在于数据的兼容性和管理的细化,可以这样讲,对于一个管理接口,管理的力度决定了可以管理的深度,因此在设计阶段,我们决定自己管理的深度和可管理的光度,在这个层面上决定我们需要购买哪些设备,如果我们投资很多的钱买一个功能丰富的设备,但是发现我们管理上是达不到这个水平的,实际上这也是一种浪费。在基础设施的管理方面,我们很少说管理这个词,大多的时候是使用监控这两个字,在中国的词汇里面,监控有两个方面的含义,检是代表检测、采集和收集大量的数据,控是做一些反馈,调整运行状态,怎么根据收集上来的运行数据决定策略对于大多数的用户来讲,绝大多数都放在检测上,对于监控是一个自化性的,或者是本能执行的手段。如果这是一个云的数据中心,我们就可能在依据手动的方式进行调整,而是根据收集上来的数据进行判断,再根据业务进行混合决定如何控。这个控的过程也是自动的,这样的话,响应的速度才能足够的快,才能满足云计算的要求,同时,这也意味着检测的时候,我们决定着设备采集的信息量的大小。在整个过程里面,我们需要消费我们收集上来的检测数据,加上我们本身对这个数据的知识库,最后形成了一个控制的结果,这也是管理里面最核心的地方。
DCIM已经出来有几年的历史了,他一是某一个概念,它是整个IT圈子的共识,也就是说,数据中心基础设施的管理核心是帮助IT形成一个业务决策,无论购买哪个厂家的解决方案,很多客户这样讲,花了很多的钱买了职能PPU,里面收集很多的能耗、供电的信息,但是这些数据有没有用,可以说,如果这些数据没有帮助我们形成一个决策,这些数据都是零,只是数据,只是信息,除非我们依据这些数据把它做成业务调整和一个块的策略,把这些策略付诸实施,才能形成一个循环起来的价值链。我们既使购买了大量的智能设备,没有相应的操作起来也是没有意义的。
回到前面说的数据,数据是非常重要的,很多用户说,我有决策,但是如果这是决策没有来源于数据的话,决策是等于零的,所以从前端到后端,这两端是不可缺少的,所以DCIM来说,数据是一个基础。在基础架构管理这块的数据来源于哪,我们总结有来源于三大类,一是技能的基础设施,第二大类是IT设备,我们现在可以看自己的服务器,基本上90%服务器都有一个内设的芯片,这个芯片是可以独立的运作的。第三类是我们的传感器,包括温度、风量不同的传感器,我们把所有的数据收集上来。有了这些数据以后,我们需要做一个统一的数据格式,很多时候我们都觉得数据在那里就行了,格式并不是很重要的,但是如果我们对这个数据进行格式的时候,如果没有一个统一的格式就很难处理。数据的格式必须统一起来,否则每个数据集中在自己管理的范畴,当我们对数据中心运营时,我们会采集到多方面的数据,比如说来自传感器的数据,包括空调配电的数据,我们把这些数据关联起来,否则的话,并没有办法做到统一的管理。这样就影响到服务器的正常工作,这样会直接影响到服务器的机箱的温度,如果没有统一的格式,我们没有办法把这些数据做一个统一的管理,所以统一数据是非常重要的。
数据中心基础设施管理日常维护设备有哪些
维护内容:
1、机房主机设备维护管理:计算机服务器(包括PC服务器及存储服务器);网络设备(交换路由设备等)。
2、机房监控设备维护管理:供配电监测系统、温度环境检测系统、门禁设备系统、保安监控设备。
3、机房空调与配电设备维护管理:空调设备、新风设备、UPS电池、主配电箱。
4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。
5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。
6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。
为什么数据中心基础设施管理在中国不给力
一方面是技术问题,但技术问题从来不是根本问题,主要是技术问题总有解决问题的手段,与之相比,市场问题才是更大的问题。
DCIM没有办法得到更多推广,主要障碍还是认知水平问题,一些无法见光的事情,阻碍着技术进步。DCIM本身非常技术的概念,从很大程度上会
让CEO敬而远之。CIO会不会拥抱DCIM,如果没有CEO的命令,CIO通常不会冒险采用DCIM,因为改变是非常难的。另外,DCIM会让问题变得
透明,如此也断了一些CIO的财路。
有专业人士透露:偷偷安排一些机器,是数据中心一些人的生财之路。如果信息不透明,这些事情很难被发现,主要不是捅出大篓子,基本上没有太多风险。DCIM让信息变得透明了,让设备、资源变动变得可以追溯,这些有些CIO不愿意的事情,DCIM自然是雷声大,雨点小。
DCIM专业的技术,但实际上是“一把手”工程,没有CEO的决心,DCIM只能是水中花,镜中月。
针对DCIM,业内专业人士也指出了一些障碍,例如技术人员的跨专业水平能力;PDU供电监控还停留机柜,没有到IT设备;DCIM节能表现,没有类似封闭通道/空调管理作用明显,亮点不突出;以及DCIM还没有迈向云计算服务等,但我认为,这些都不是问题的关键,“一把手”工程才是重中之重。
并不是所有的问题,非“一把手”不可。但DCIM是一个值得“一把手”的工程。这不仅仅是弥补漏洞的事情,这是一个管理境界的问题。DCIM从
数据中心高度,对所有相关环节统筹规划、控制和管理,当所有因素协调可控时,就不是一个简单的效率问题,也不是省几个钱的问题。DCIM所代表的是数据中
心的水平,以及服务能力。DCIM搞好了,谁还会为数据中心故障这样的小问题担心呢?DCIM,有这样的水平,但DCIM确实也有一个逐步成熟提高的过
程,DCIM在路上。
数据中心基础设施哪家的好?
可以看看这篇文章:《数据中心基础设施管理在云时代的应用》
行业分析公司Gartner预计,DCIM市场规模到2016年将会达到17亿美金。在DCIM市场,以艾默生网络能源旗下Avocent为代表的厂商已经推出了Trellis这样成熟的DCIM产品,为云时代的数据中心管理勾勒出了清晰的发展轨迹。
DCIM:整合IT和关键基础设施管理
在数据中心业务和设施快速发展的同时,相关的运维方式和工具却没有跟上步伐,导致诸多问题的产生,其中最常见的是IT和Facility分开管理。根据IDC 的报告,有58%的数据中心将IT设备和Facility设备的管理分成了不同的部门。这种现象在国内的三大电信运营商身上更加普遍。这种人为的组织架构划分虽然在一定程度上有利于人员管理和权责划分,但是却增加了部门之间的沟通成本,降低了数据中心运维的效率,甚至提高了数据中心发生事故的风险。
另外一个常见的问题是数据中心使用离散的管理工具。比如采用Excel进行资产和连接关系的管理,利用Visio或者AutoCAD进行数据中心的可视化建模,了解设备的存放位置,等等。这种管理方式虽然相对简单、成本低廉,但是却带来了多方面的问题:1)对数据中心管理者而言,没有一个统一的视图获得所需要的信息,维护多个离散的工具也提高了管理和拥有成本;2)不同系统之间的数据难以关联和共享,在制作报表和业务预测的时候尤其困难;3)工具的不专业造成对数据中心数据的维护非常痛苦,需要花费大量的时间去更新数据,保持同步,甚至新老数据彼此发生冲突。
相对于传统的数据中心,云时代的数据中心在架构设计上更加弹性化。为了满足业务可持续发展的要求,降低TCO,提高业务灵活性,云时代的数据中心采用了更多如虚拟化、模块化等技术,使得UPS和空调等基础设施和服务器、存储、网络等IT基础架构之间的匹配更加的困难。因此对数据中心管理者而言,更需要有一个统一的DCIM平台同时管理IT和基础设施,实时监控设备的容量、功耗、空间、承重等信息,从而防患于未然,提高数据中心的可靠性。
DCIM带给客户的价值
目前市场上大部分的DCIM解决方案如Avocent的Trellis平台在功能上均采用模块化的设计,客户可以根据自己的需求选择适合自己软件功能模块。除了模块化的设计,一个好的DCIM解决方案要能够在OPEX、 CAPEX以及人员和流程管理方面给客户带来价值。我们以Avocent的Trellis平台进行分析。
1)OPEX
首先,Trellis平台能够监控数据中心的PUE等关键能耗指标,同时能够实时查看IT设备和基础设施设备的能耗,从而使管理人员及时掌握能耗状况,实现科学决策。
其次,Trellis平台能够通过IPMI等接口读取到服务器的CPU占用等信息,可以发现在数据中心空跑和低负载的服务器,从而对这部分服务器进行整合或者下架,提高设备利用率,降低数据中心功耗。同时通过结合IT设备的生命周期和服务器的能耗信息,可以淘汰一些旧的、计算能力弱却又能耗较高的服务器,进一步节能增效。
最后,Trellis平台继承并增强了传统动力环境监控系统的功能,能够实时监控IT设备和基础设施设备,比如在夜晚或者虚拟化迁移的过程中,对一些能耗降低的区域,可以考虑对该区域的模块化UPS进行休眠,以及对空调系统的风机进行调速,甚至关闭部分空调终端,从而节约能源。
2)CAPEX
对于云业务的数据中心而言,每1U位都是宝贵的资源。尽可能提高设备的利用率,延长数据中心的寿命,就能提高投资回报率,增加营收。
Trellis平台的资产管理功能可以对数据中心进行可视化建模,对数据中心的电量、制冷、空间、承重等容量进行追踪,并对供电和网络等连接关系进行管理。 由于数据中心在设计时都层层考虑余量以提高可靠性,再加上服务器运行并不能达到它设计的铭牌功耗,因此往往每个机架的容量并不能够被充分的利用。Trellis平台提供的这种实时的精细化管理功能可使得用户摆脱过去手摸、用眼看等粗放的判断方式,实时了解每个机架和整个数据中心的资源消耗情况,提高资产的利用率,延长数据中心的寿命,节约投资。
3)人员及流程
人员和流程也是数据中心运维过程中需要考虑的重要因素之一,UPTIME的调查显示,在数据中心的安全事故中,有70%都属于人为因素。Trellis平台提供了对数据中心变更和流程管理的平台,在实施数据中心变更时,客户可以在Trellis工具中对变更中涉及到的每一步人员和流程进行管理和审批。比如在上架服务器时,Trellis可以利用其自身采集到的数据对供电、制冷、空间、网络、承重等资源进行步步验证和审批,并在实施前进行模拟操作,从而提高变更的可靠性,减少数据中心的实施错误。另外,Trellis平台还能同时对API和ITSM的人员和流程进行管理,最大程度提升数据中心管理的效率。
从长远来看,为了提高人员和流程的效率。DCIM平台将会和KVM、SP以及串口管理等数据中心远程管控的平台相结合。比如当DCIM平台监测到某台服务器存在异常,可以直接在DCIM平台打开KVM的session,从而对该服务器进行操作。这样会大幅减少人员在不同平台之间切换,以及设备定位的时间,进一步提高人员和流程的效率。
选择DCIM解决方案需注意事项
目前,随着人们逐渐认识到DCIM重要性,越来越多的厂商也开始提供DCIM的解决方案。客户在选择DCIM解决方案时除了要考察前面提到的功能价值之外,还要考虑厂商提供的是不是真正的平台化的DCIM解决方案。如果是通过集成不同的软件来达到所谓的DCIM功能,甚至不同功能软件之间还采用不同的数据库,这样的DCIM并不能为客户带来真正的价值。
另外,DCIM解决方案的成功很大程度上依靠于厂商的工程实施能力以及后期的服务能力,客户应该尽量选择一些大的知名的DCIM厂商。同时,客户还要随时关注DCIM的市场动态,了解DCIM发展趋势,比如在今年3月,艾默生宣布和IBM达成战略合作关系,将旗下DCIM解决方案Trellis和IBM的ITSM解决方案Tivoli进行深度整合,这预示着下一代数据中心管理系统中ITSM和DCIM将会更好地融合,甚至采用同一个CMDB (Configuration Management Database,配置管理数据库),从而最大程度提升客户价值。通过了解这样的前沿动态,客户能够做出更加科学的决策,从而选择适合于自身的DCIM方案。
数据中心基础设施层有哪些标准 uptime
Uptime Institute成立于1993年,是全球公认的数据中心标准组织和第三方认证机构。下列两项标准是数据中心基础设施可用性、可靠性及运维管理服务能力认证的重要标准依据:
《Data Center Site Infrastructure TierStandard: Topology》和
《Data Center Site Infrastructure TierStandard: Operational Sustainability》
Uptime TIER等级认证基于以上两个标准,是数据中心业界最知名、权威的认证,在全球范围得到了高度的认可。Uptime TIER数据中心等级认证体系分为Tier I—Tier IV四个等级的最高等级,Tier IV最高。
Uptime TIER等级认证针对数据中心的电气参数、冗余、地板承载、电源、冷却装备,甚至造价等等都制定了标准。作为用户最为关心的无故障时间,我们可以看到最低级的Tier I平均每年有总和超过一天的故障时间,而最高等级的Tier IV只能允许平均每年48分钟故障时间。
目前国内XDC+旗下的三座数据中心都在按照最高标准Tier IV的标准建造,国内来说,是个大趋势。
融合基础设施是数据中心的未来吗?
然而,在企业数据中心里,变化却不太大,IT管理员还是需要费时间去管理“孤岛式”的IT系统,IT基础设施的部署和配置依旧比较费劲,而且能耗还在不断上涨。这导致融合基础设施(Converged Infrastructure,CI)日益受重视。
融合基础设施,共享资源、部署迅速
融合基础设施这个词其实是惠普三年前所创造的。Gartner称之为整合系统,而思科称之为统一计算系统(unified puting system,UCS)。虽然各种叫法不同,但是其内在理念是一样的——将服务器、存储和网络整合在一起,成为一个共享资源池,以预配置系统的方式提供给最终用户。这种方式下,IT系统建设时间从数周或数月缩减成几天甚至几小时。
这些融合基础架构提供一个单一的管理平台,并且针对SAP、Siebel、甲骨文和微软等常见应用提供参考架构(例如惠普Cloud Maps和思科Flexpod就是实现此功能)。
在过去三年半里,这种增长将思科推到北美第二大刀片供应商(仅次于惠普)的地位。思科数据中心集团的副总裁Satinder Sethi表示,在推出UCS之前,思科甚至没销售过刀片。而今,该公司声称已经拥有2万个刀片用户,这代表着16亿美元收入和23.5%的刀片市场份额。
打破IT孤岛厂商一直明白要帮助用户让IT加速满足业务需求,虚拟化和云计算曾被寄予厚望。虚拟化也的确提升了利用率并节约了IT运营支出,但它还不足够。虚拟机蔓延,以及各种各样的hypervisor迅速成为IT管理员新的头痛点。同时,私有云往往成为数据中心里的一个新的“孤岛”。
那么融合基础架构有何不同?根据厂商们的说法,融合基础架构的能力在于通过实施数据中心架构扁平化(主要是将计算、存储、网络从CPU、机架、线缆、控制器等抽离出来)而打破数据中心里的“孤岛”。例如,惠普企业集团解决方案案和市场战略副总裁Duncan Campbell解释说,将操作系统与CPU解耦,增加一个单一的管理点,你就踏上了通往软件定义网络(SDN)的第一步。
Campbell声称,它象一个针对工作负载(而不是服务器)的虚拟化2.0技术。“人们厌倦了凡事DIY,他们喜欢整合好了的系统。” Campbell说。
如果融合基础架构让你觉得有点象效用计算、网格计算、共享服务器、SOA或云计算,那么你的感觉是对的。
今天的融合基础架构不同之处在于它是无边界、预配置、预优化的,而且通常提前装载了用户需要的应用,从而让用户几乎实现“开箱即用”。
例如,IBM PureData和甲骨文的Exadata都是面向大数据应用。思科的产品支持用户自由选择VCE联盟成员的产品来搭建适合自己的基础架构,惠普的产品支持多种hypervisor,以及多种存储、网络产品的组合。
融合基础架构的核心在于消除服务器、SAN、LAN和上层应用的配置工作,改为向人们一个即插即用的“盒子”。
Neff表示,用户最终关心的还是TCO(总体拥有成本),如果融合基础架构能够在降低TCO的同时满足ROI(投资回报率)的要求,那么一定是切中用户需求的。
另一方面,在购买融合基础架构类系统时用户也面临着挑战。在一个大规模扩展环境里,只是买一些整合的机架不会有太多帮助。
数据中心基础设施运维有哪些书籍
龚伟华、王刚编著的《银行数据中心基础设施建设与运维管理》
数据中心机房基础设施中,如何设计和实施消防系统?
找专业得消防公司做,要不验收不了
所有装饰材料需有防火实验报告
根据机房空间设置气体灭火钢瓶
机房需要全密封,并设置泄压装置
一般采用七氟丙烷等惰性气体
谷歌数据中心的安全基础设施什么样?
谷歌将其基础设施安全架构划分了六层 ——硬件架构层(包括物理基础安全)、服务调度层、用户识别层、存储服务层、网络通信层和安全运营层。