白皮书:确保成功的数据中心整合

该数据中心整合的业务实例十分引人注目,不仅对大型的跨国企业如此。中小型企业也有潜在的数据中心整合需求。若干因素造成了对整合的需求突然增大。网络结构、应用程序和服务的复杂性继续增大。用户流动性更大,要求更苛刻;他们希望无论在何处执行何种任务,都能有更高水平的性能以提升生产效率。国际经济环境也要求公司在保证质量的前提下找出新方法,以减少资本和运营花销。

    目录
  • 执行摘要
  • 为什么要进行数据中心整合项目?
  • 需要客服的困难。
  • 性能管理工具重点
  • TruView™ 应用程序,真正的统一平台
  • 基础设施数据监控。
  • 取得并测量数据中心整合成功情况。

执行摘要

尽管数据中心整合的前景和收益都很吸引人,企业却不能不顾前后地一头扎进去。有许多挑战和障碍,都会在其达到预期目的之前干扰整合项目。而且,公司必须制定策略性的长期的计划来应对整合。否则,短期收益不会维持长久。要放眼长远,就需要深入理解当前的网络、应用程序和服务性能;计划事务或将其在新的操作环境中执行;大胆地监控和管理更新的体系,以确保其持续达到基准和指标,实现当下和未来的成功。

高效持续地管理整合的数据中心是解锁并优化对其投资回报的关键。但是这也是过程中最困难的步骤,因为传统性能管理工具,诸如应用程序流监控、事务查看、数据包分析、SNMP 轮询和 stream-to-disc (S2D) 存档要求多个平台,所以就降低了整合优势的可用性。业务需要的解决方案必须可扩展、空间获取、整合和保留,同时还能提供能够在整合的数据中心从操作、IT和终端用户视角真实反映网络、应用程序和服务执行的性能的信息。

成本

公司数据中心整合带来的成本节约是从资本花销和运营花销两个方面考量的。在等式的资本一侧,整合的环境意味着更小的网络和应用程序设施。因此,业务需要更少的硬件,包括更少的服务器、开关、路由器和其他设备。减少服务器很可能导致更少的软件应用程序需求,允许公司进一步削减资本支出。

随着基于云的 Saas 选项的普及,数据中心整合体现出了一系列可以大规模削减运营花销的机遇。远程设施可以消除或精简为原始规模,就可以节省租赁成本。与这些设施的连接也可以精简,最小化传输成本同时可以准备改善服务供应商关系和性能的监督。整合的设施供电需求降低,冷却更容易,减少了设施使用费用,也为越来越受欢迎的“绿色”举措铺平了道路。大概最显著的是,整合减小了 IT 和运营人员的负担。在远程地点减少活动,这些站点的管理和通信要求就大大降低了。这样,IT 和运营人员就可以更快更便宜地隔离并解决问题,节省这些资源以处理更高优先级的关键业务任务。

优化

鉴于网络、应用程序和服务变得越来越复杂,用户需要在不牺牲功能或性能的前提下进行标准化的通信,而公司分配的原有设备很难承担这样的压力。偶然的公司并购或合并会使企业扩大,但也会加大网络和应用程序的不一致,这样的情况很难处理。


图 1:有必要进行数据中心整合,不仅为了精简设施,也需要优化设施,使服务质量可以保持并最终提升

整合可以优化若干项收入。一项是上述的传输。使用更中心化的方法,需要监控的管道就减少了,构架就更直接、更容易控制,且流量模式和流量可见性更高、定义更清晰。该环境提供了实施更多先进协议和管理策略的选择,可以最大化带宽利用率和总体网络及其应用程序性能。

数据中心整合也与应用程序虚拟化同步。应用程序虚拟化的目标是将应用程序从服务器中分离出来。不需要在物理服务器上本地运行,应用程序可以在虚拟服务器上执行,而虚拟服务器可以设在企业的任何地方,比如整合的数据中心。这样,需要的服务器数量就减少了,因为每个服务器的处理量增大了,如同服务器专门处理一个应用程序。如果得到适当计划和维护,采用共享服务器对应用程序的终端用户是透明的,还可以使服务质量可控性更高。应用程序虚拟化的好处显而易见,据咨询公司 EMA 的一项调查估计,近四分之三的企业至少对他们的一些产品应用程序采用虚拟化。

由于数据中心整合,关键业务流程和系统的自动化是一个现实的选择。例如,数据中心的自动化解决方案可重新启动失败的应用程序,动态指定新的服务器,进行定期备份并执行操作环境的配置管理。自动化带来了许多优点,包括过程一致性和公司规章制度的实施,加速执行过程和最小化人为错误。它还能更有效地适应不断变化的环境,提高 IT 和操作团队的生产力,从而使自动化过程和系统不再需要人工输入和支持。


安全性

网络、应用程序和服务占用的内存分布越广泛,安全漏洞就越敏感和越易受到攻击。数据中心整合可提供直接防御,并为实施更加复杂的持续的风险缓解策略奠定基础。

整合意味着一些位置将被取消,而其他位置的大小和范围将被缩小。由于管理较少的站点和资产,对企业进行物理保护的任务变得更加容易、成本更低并需要更少的资源。同样,更加紧凑的企业架构需要更少的设施连接。简化传输层连通性可强化对信息安全的关注和效率。提高传输的电子安全至关重要,这是因为技术发展正在改变传输的作用,如多协议标签交换和对语音、数据和视频的聚合。它不再仅仅是传输信息的一对点之间的连接;而已成为集成的应用识别基础设施,这对于在不损害安全性的情况下实现提高服务品质的承诺至关重要。

在当今高度竞争的全球经济中,公司的成功与网络、应用程序和服务的可用性和响应时间直接相关。当这些中的任何一个由于安全漏洞或其他事件而被损害时,无论问题是否造成严重影响,都必须尽快恢复性能。因此,灾难恢复成为企业的当务之急。由于数据中心整合,灾难恢复解决方案的规划、实施和执行任务变得不那么艰巨,这是因为所有关键组件都放置在同一位置,可轻松进行复制和故障转移。

合规性

无论公司的经营行业如何,合规性变得越来越重要。业务单位和员工需要证明它们遵守公司的政策和程序。公司必须证明他们符合政府的法规,如 Sarbanes-Oxley;他们还必须遵守私人部门规定,如支付卡行业 (PSI-DSS),以赢得新的合同,从而有资格利用服务或敞开其服务大门。IT 人员必须出示满足行业标准(如 ITIL)的内部购买或开发的硬件和软件组件。IT 和操作人员必须能够跟踪服务水平协议的合规性,包括内部与业务单位利益相关者达成的协议及外部与合作伙伴和客户达成的协议。

数据中心整合在至少两个方面促进合规性。首先,它促进过程和系统自动化,以使人力脱离环路并压缩必须执行的程序和功能,从而保持与相关政策、法规、标准和服务质量指标的步伐一致。第二,它鼓励实施全面的审计功能,以允许瞬时或长时间的操作合规性结论示范。

合规性类别 定义 示例 整合的影响/好处
政府部门 联邦、州和地方法规公司必须遵守合规性以获得和保持业务 Sarbanes-Oxley,代表和认证 减少硬件/软件占用内存可简化综合审计和库存管理
行业 纵向市场部门内部和之间发布的规章影响服务的访问和交付   减少硬件/软件占用内存可提供更强的物理和信息安全,同时改进审计和性能跟踪
公司 公司发布的政策和程序提升效率并发扬商业道德 网站访问;电子邮件使用 应用程序虚拟化为监控企业间的所有事务铺平了道路
技术 硬件和软件的实施、部署和性能 最佳实践和标准 ITIL 集中化的硬件/软件基础设施和操作授权 IT 采用和遵守标准
服务品质协议 第三方合作伙伴和供应商发布的性能和服务质量保证 带宽可用性,VoIP 平均意见得分 传输占用的内存减少可促进实时和超时性能跟踪
服务品质指标 发布给业务单位的面向内部的性能和服务质量保证 应用程序可用性,应用程序响应时间 应用程序虚拟化可促进收集事务取证,以进行性能监控和使用评估

表 1 突出显示关键合规性类别和数据中心整合的影响。


需要克服的障碍

数据中心整合的优点清晰而引人注目。然而,在承诺作出整合努力之前,公司必须明白这样的过渡并非易事。根据 Forrester 调查,整合项目通常需要 18-24 个月才能完成。在此期间,公司将不得不投入资源和预算,为员工提供评估当前操作环境、规划迁移和带来新的在线架构所需的硬件和软件组件。同时,即使在部署之后,企业也必须做好准备应对各种会威胁到整合成功的障碍。这些挑战一般可分为以下三个方面:人员、报告和工具。

人员

数据中心整合的关键点之一是把尽可能多的网络、应用程序和服务基础设施整合到一起。因此,之前分布的在各自领域运行的 IT 和操作团队现在可能共同工作。在这种情况下,跨领域策略需要在最低限度上确保额定条件下的平稳运行和出现异常情况时有效的问题解决方案。要充分获得整合的好处,仅有策略是不够的。跨领域能力允许企业通过使团队利用通用件进行整合,从而在各种条件下优化操作和员工的生产效率。由于这些传统架构的限制,跨领域的专业技术将近乎缺乏,且必须作为迁移工作的一部分进行培养。

数据中心整合还意味着数据中心经理的角色将会改变,企业必须在规划过渡时考虑这一事实。在大多数分布式企业中,数据中心的局限性要求一位注重技术的经理。整合后,数据中心的权限范围将更广,涉及更多业务。数据中心经理需要拥有与这一现实相符合的能力。为使各部分有效实施,经理不但必须拥有超凡的技术能力,还要有市场、金融管理和操作规划的能力。找到具备这些能力的个人很重要但也很困难,因为很少人有这样广泛的技能。

报告

采用数据中心整合,企业曾拥有的资源将被集中到公共资源中。因此,自己管理和维护网络、应用程序和服务业的务单位可能将无法再这么做。作为放弃控制的交换,除整合所带来的一般益处,这些团队要求获得更多。他们期望获得整合数据中心操作的深层可见性,这就要求经常缺乏的报告稳健性。

实质上,业务单位是整合数据中心的内部客户。业务单位所有者可继续支持该操作,他们必须确保关键应用程序在业务单位进行控制时以一定或更高的品质得以执行。换句话说,面向内部的服务品质协议或服务品质指标必须在整合数据中心和业务单位之间进行定义和建立。这些指标,如应用程序可用性和桌面和数据中心之间事务的最终用户响应时间,在进行编译、跟踪和定期报告时,会提供必要的证据以留住业务单位的所有者。

服务品质指标是报告的重要方面。另外还有使用和记账。业务单位所有者将只会支付他们实际使用的资源;他们不会通过支付平均分配的整合数据中心成本来资助其他业务单位的活动。因此必须加强报告功能,包括每个业务单位的所有网络、应用程序和服务所消费的使用评估和相应的退款/退回账单。

工具

数据中心整合和伴随它的应用程序虚拟化可简化企业架构,同时还可引入管理复杂性。随着越来越多服务的虚拟化,提供从数据输入到桌面的应用程序使用的单一视图变得越来越困难,因为单个物理服务器可支持多个虚拟机。由于数据库服务器、应用程序服务器、电子邮件服务器、打印机服务器和文件服务器都可能共享相同的硬件,这使跟踪网络、应用程序和服务性能成为苛求。应用程序虚拟化固有的附加抽象层增加了难度,因为可用的有形展示通常比服务器和应用程序紧密耦合的传统环境中的少。


在整合的虚拟化世界中,在有效监控和管理网络、应用程序和服务性能方面,公司面临着超出与架构直接相关的其他障碍。大多数传统性能管理工具的功能在筒仓中操作时达到最佳,专注于特定的应用程序、服务或网络的地理或逻辑片。这种方法在分布式架构中可以接受,但只是解决整合数据中心问题的一种方法,筒仓的数量会因应用程序虚拟化管理工具内容未集成到传统性能管理工具而增长。

结果是场景操作人员必须执行“转椅”管理,通过采用各自拥有独特功能和用户界面的分散工具及他们的集体经验和专业知识手动关联信息,以识别、隔离和解决问题。最好的情况是,性能管理可像在分布式环境中一样执行,绕过利用同一位置的信息和人员的机会。最坏的情况是,各种操作和 IT 团队无法和平共存于整合数据中心,提高控诉指责的频率和强度,同时降低异常分辨的效率,从而造成令人懊恼的内部和外部的组成和企业管理。

性能管理工具重点

显然,如果公司启用所有潜在的数据中心整合并收回所有成本、优化、安全与合规性益处,性能管理工具的现状将无法维持。传统性能管理工具并非为整合环境而设计,且没有考虑其所伴随的细微差别和复杂性,如应用程序虚拟化。公司所需要的是下一代性能管理解决方案,不仅能解决其“前辈”的缺点,还能帮助抵消其他所有整合挑战,包括人员和报告问题。下一代工具必须考虑以下三个关键特征:范围、视角和计时。

范围

传统的性能管理工具属于涉及功能和权限的两个阵营之一。一类工具需要一个高级且范围更广泛的涉及数据收集和评估的策略,目的在于提供可与高级管理共享的执行仪表板,以跟踪整体性能。另一套工具需要范围更窄且更加深入的探究,以聚焦于企业的特定网段,捕获数据包、检查个人事务和提供详细而实时的分析。

理想情况下,IT 团队需要对完整视图有多维视角。流量、事务和 SNMP 数据可检查整体体验,同时,数据包分析和 S2D 功能可协助故障排除和合规。IT 组织需要分析的广度和深度,但无法负担与脱节点产品相关的时间和精力。

视角

传统性能管理工具在提供和呈现可用信息方面都很有限。确定问题的根本原因并解决问题需要网络和应用程序观点,但这并不总是足够的,特别是在业务单位所有者密切关注服务品质指标的整合数据中心。不幸地是,传统工具通常不提供额外的观点选择,并且妨碍了识别/隔离/解决过程的速度和精确度。

例如,当内部业务用户或外部客户报告应用程序的响应时间慢得不可接受时,确认情况和诊断问题的理想方法是分享经验。下一代性能管理解决方案必须允许操作和 IT 人员从最终用户的角度看待世界,由于上述扩展范围的要求,此功能变得可行。

定时

在完美状态中,性能管理非常简单。当问题出现时,他们很容易被检测到,由于异常情况的来源显而易见,这些问题可得到迅速纠正且不会再出现。然而,整合数据中心并不是空想,监控和管理网络、应用程序和服务性能也不是这么简单。在许多情况下,性能会随着时间的推移缓慢下降,或问题会反复出现。

从整个企业的所有数据源收集性能信息并从终端用户的角度呈现这些信息为成功解决更复杂的异常情况做好了准备,但只有当所有信息可在延长时间段中分析时可用。传统性能管理工具不能获得所有的必要信息,或丢弃信息太快。


下一代性能管理解决方案必须能够获取和存储最详细的信息,以实现有意义的扩展持续时间。这样做可使操作和 IT 进行实时分析并及时返回离散点,以评估和重新关联与间歇问题报告相关的环境。它还可促进了短期、中期和长期的额定性能基准的发展,因此可在指标通过一系列严重增长的退化阈值时识别并尽早处理偏差

TruView – 一个真正统一的平台

对于已完成或正在进行的公司来说的一个好消息是,规划数据中心整合项目使下一代性能管理解决方案并不只是一个白日梦。如今有一个最先进的答案:来自于 NETSCOUT 的 TruView。TruView 是 100% 基于网络、可充分控制 URL 的平台,可集成和自定义其组件、显示和报告来满足组织严格的要求。


图 2:借助 TruView 的应用性能显示板,您不必点击鼠标也能快速查看运行性能最差的应用、服务器和站点

集成的 TruView 服务器是统一平台的核心。服务器主机有一个共同的平台,可使服务和数据模型的定义合理化。该平台由一个分析引擎和基准、报警、通知和配置元素组成,是解决方案的基础。采用此服务器架构,任何来源的功能、信息和显示都可以无缝地交织在一起,以促进跨领域交互和快速数据关联问题的识别、隔离和解决。

只需点击几下鼠标,专利工作流 IntelliTrace 即可通过提供容易识别的问题领域和根本原因分析,从而加强分析和故障排除。TruView 可提供一个单一的、具有最强大的数据收集、分析和演示引擎的平台。


常用和/或自定义访问、控制和视图层建立于平台之上。TruView 的架构层负责与产品组件进行连接,以在整个企业内前所未有的广度和深度上收集和保持性能数据。四种本地组件的解决方案:网络流量设备,启用网络性能和使用视图;应用程序性能设备,提供应用程序性能视图输入;分析服务设备 (ASE) 探头,支持 Internet 协议视图的广域网和语音和 S2D 硬件,可捕获 100% 的 10Gbps 线速数据包。由于 TruView 基于网络的设计,公司还可以选择将一些或所有传统工具集成到架构中,以利用其之前的投资。

基础设施数据监控

图 3:TruView 的实时和历史报告


TruView 网络流量设备功能可与现有基础设施的路由器和交换机进行交互,以获得基于流量的任何格式的信息,包括但不限于 IPFIX 和 Cisco 的 NetFlow。这些基于流量的功能可获得所有时间所有流量的所有信息,使实时数据保持在无限的毫秒分辨率上。因为解决方案不采用数据平均或丢弃,它不受仅注重最高统计数据评估的限制,这可能不会提供必要的粒度以支持重要功能,如恶意用户发现、多播可见性和对等分析。

操作和 IT 人员可调整设备的数据保留和粒度变量,以最好地适合其特定需求。采用综合流量覆盖网络流量设备的交付,这使得 TruView 用户可从高级摘要视图直接完全清扫至个别流视角。这些实时或超时的全流量取证、显示和报告允许运营处和 IT 团队来处理和计划与场景相关的整合数据中心,包括路径和会话优化、带宽要求确认和服务级别及 MPLS 网络性能管理。

应用性能管理

图 4:借助每分钟一次的信息搜集间隔,可以显示最终用户响应时间以及应用、网络和服务器组件,因此基础设施团队可以快速确定问题域,消除各组之间的互相指责


利用镜像端口或点击物理或虚拟服务器界面,TruView 的应用程序性能设备可以访问每个基于应用的事务相关的在线或侦听数据,甚至是已被虚拟化的应用程序数据。应用程序性能设备配备了专用的专利技术,允许所有信息捕获、过滤(丢弃重复或无关紧要的数据包)和存储。摘要信息每 60 秒被转发到 TruView Manager 服务器,以支持高级应用程序性能视图。根据需求,当解决方案用户开始诊断活动时,设备将越来越详细的数据直接发送到个人事务,以及时获取之前发生的实时事件和事务。

可选专用硬件收集器

图 5:TruView 的网络性能摘要

TruView 的分析服务设备 (ASE) 可放置在整合数据中心或企业网络范围内的任何远程位置,以提供所需的广泛信息。个人分析服务设备旨在用来捕捉并返回到 TruView 服务器的信息深度,跨网络模型的 1-7 层(从物理层到应用层)。

分析服务设备完全符合当前的更严格的可见性和性能标准,如与网络、服务器或应用程序的可用性相关的物理层错误检测和服务品质协议。他们也非常适合环境,如整合数据中心,企业想要在不损害性能的同时最大限度地利用语音聚合以及数据和视频通过相同渠道传输来输降低成本和优化带宽。例如,成功的 Internet 协议语音部署需要对流量类型和从传统的电路交换语音过渡之前、期间和之后的服务分配有彻底的了解和规划。分析服务设备转发馈入视图和报告信息,支持 Internet 协议评估语音、激活或恢复性能监控、每个电话的质量测量及实时或回溯式的故障排除


稳健的数据流到磁盘

TruView 服务器提供的线速额定数据包收集高达 10 Gbps,这使得 IT 团队永远不会错过发生的重要事件。由于有限的或缺失的数据,太过频繁的间歇性问题更加难以解决,但 TruView 的 S2D 确保你所需要的一切都唾手可得。通过捕获所有线速的数据,信息间不再有空白。

不作假设或存储数据花絮,TruView 的 S2D 功能可存储所有流量、事务和数据包而无限制或修剪。S2D 在较快地排除问题故障和减少审计与合规要求所需的时间方面非常有价值。当问题发生时,无论 IT 团队是否正在排除实时故障问题或试图确定几小时或几天前发生的间歇性问题的起因,相关的 TruView 平台都可轻松获得正确信息。

实现和测量数据中心整合成功

判断数据中心整合项目的成功或失败不应当基于个人利益相关者的短期、主观或定性评估。相反,公司必须依靠长期的定量统计和指标计算,这可能对所有对象,如业务单位所有者、IT 和操作人员、公司管理层和客户造成影响。

美国企业 147 的 Forrester Research 调查已完成或正在积极的执行数据中心整合工作,要求这些公司确定他们最常使用的衡量整合成功与否的五大指标。52% 的受访者将运营成本列为五大指标之一,44% 选择所有权总成本,38% 选择 IT 预算比例,应用程序性能和基础设施成本占 35%,CPU 核心性能则占 34%。3

部署性能管理工具不仅可帮助收集这些数据,还能直接影响它们的值。适当的绩效管理解决方案使小型、中型和大型企业最大限度地实现数据中心整合带来的成本、优化、安全与合规的益处。同时,这样的解决方案保护公司免受整合常带来的挑战,包括人员、报告和与工具相关的问题。

传统的绩效管理工具无法完成这项任务,因为他们缺少在整合环境中进行交付的必要的范围、视角和时间。过多地依赖于数据中心整合,而忽视性能管理功能或将其交给不适当的各种迥异的工具,而这些工具完全无法满足所有网络、应用程序和服务性能的需求。企业需要含有架构、宽度、深度、可伸缩性、功能性和常见数据模型的下一代性能管理解决方案来推动整合项目当前和未来的成功。仅一种产品可提供下一代性能管理要素:来自于 NETSCOUT 的 TruView。

1 成本分析和测量有助于确保整合成功, Forrester Research, 2009 年 1 月。

2 成本分析和测量有助于确保整合成功,Forrester Research, 2009 年 1 月。

3 成本分析和测量有助于确保整合成功,Forrester Research, 2009 年 1 月。

 
 
Powered By OneLink