应用说明:VoLTE 故障诊断最佳实践

简介

对于部署 LTE 的服务提供商来说,Voice over LTE (VoLTE) 的成功是区分其 HD 音频/视频服务与其他众多语音应用程序/服务(如 iTalkBB、Phonepower、Skype 和 Viper)的里程碑。正确地获得 VoLTE 服务非常重要,因为它是用户所期望的最基本的服务。如果发生故障,它也是最值得注意的服务。第一次部署时要正确完成是绝对至关重要的。

本白皮书为部署和维护 VoLTE 的工程师和技术人员提供了一份概述。其中介绍了关键的网络单元和它们在 VoLTE 呼叫中的作用,以及会在 VoLTE 的部署中发现的典型问题。它还对在实时 LTE 网络中解决 VoLTE 问题时应将重点集中在何处提供最佳范例。


VoLTE 关键组件

分组核心演进 (EPC):eNodeB、SGW、MME、PGW

当用户设备在整个移动网络中移动时,这些组件协同合作,以建立和维持用户与数据网络之间的连接。进行 VoLTE 呼叫时,需要通过 IMS APN 创建一个或更多载体,并且应给 UE 指定一个专用的 IP 地址。

IP 多媒体子系统 (IMS)

它包含了应用服务器、呼叫会话控制器和媒体控制功能,支持跨网呼叫和短信、AAA 和路由。SIP 流量将在离开 EPC 后路由至 IMS。由 IMS 确定为了路由 SIP 和 RTP 流量被叫方在 3G/PSTN/EPC 的位置。

会话边界管理

会话边界管理是 IMS 的一部分,执行 EPC/IMS 到如 PSTN 和 2/3G 之类的其他网络之间的安全、服务质量和管理/路由控制。它管理不同类型的网络媒体交换中心/媒体网关 (MSC/MGW)之间发起、进行和终止的 VoIP 会话。它使用媒体网关提供跨网络支持,并有效媒体编解码器和 LTE 与 2G/3G/PSTN 之间的信令流量。执行 LTE 和 3G/PSTN 之间语音编解码器转码的媒体资源功能处理器 (MRFP) 是 EPC 和 2G/3G/PSTN 之间的关键单元。

了解基本 VoLTE 呼叫过程

  1. 连接 LTE

    UE 需要由 MME 进行验证和授权,所以它也可以连接到网络。
  2. 连接 IMS 服务并注册

    (a) UE 向 IMS 请求数据服务以建立默认载体。(将给 UE 分配一个新的 IPv4 和/或 IPv6 地址。) (b) 然后,UE 在 IMS 中“注册”以获得“配置”,这样呼叫可以通过 IMS 直接导向其他的 VoLTE、3G/2G 或 PSTN 用户。
  3. 进行呼叫

    当 UE 发起呼叫时,会越过默认载体发送 SIP“邀请”消息,建立与被叫方的连接。IMS 接收该 SIP 消息,定位被叫方 (LTE/3G/PSTN) 并建立连接。如果被叫方处于 PSTN 或某个服务提供商的网络中,将通过 SBC 执行对 SIP 和媒体的路由,由 MRF 执行编解码器的转码。
  4. 建立媒体载体

    IMS 指示 PGW/APN 发起设立专用载体,以传输通过 RTP 和 RTCP 协议流的语音包。根据 3GPP 标准,应给语音载体指定质量控制指数 (QCI) 级别 1。最后,通过专用载体传输 RTP(语音通话)。专用载体将在语音呼叫后删除。

QCI 资源类型 优先级 数据包时延预算 丢包率 示例服务
1 GBR 2 100ms 10-2 会话语音
2 4 150ms 10-3 会话视频(实时流)
3 3 50ms 10-3 实时游戏
4 5 300ms 10-6 非会话视频(缓冲流)
5 非 GBR 1 100ms 10-6 IMS 信令
6 6 300ms 10-6 视频(缓冲流)、基于 TCP 的业务(例如 www、e-mail、chat、ftp、p2p 文件共享、逐行扫描视频等。)
7 7 100ms 10-3 语音、视频(实时流)、互动游戏
8 8 300ms 10-6 视频(缓冲流)、基于 TCP 的业务(例如 www、e-mail、chat、ftp、p2p 文件共享、逐行扫描视频等。)
9 9

载体

这些是为传输用户在 EPC 中的数据流量而创建的 GTP-U 通道。当一个用户的设备被连接到网络并通过 PDN -网关 (PGWs) 建立与数据服务的连接时,会创建默认载体以传输数据服务的基础通信协议。可以创建两种类型的载体:保证比特率 (GBR) 或非保证比特率 (nGBR)。会给 GBR 载体分配保证带宽,以传输抖动和丢包敏感流量,如 RTP 语音。语音传输 GBR 很消耗资源,会在一个 VoLTE 呼叫成功时创建,并在呼叫结束时立即删除。nGBR 通常是为正常的数据流量创建的,如进行基本业务的互联网流量。大多数默认载体(如用于 SIP 流量通过的 VoLTE 或非关键互联网服务)是 nGBR。

质量控制标识符 (QCI):

它表示 QoS 参数(数据包延迟和丢包预算)以及每个载体的优先级。QCI 的指定以 HSS 中用户的个人资料和服务提供商配置的数据服务为基础。虽然 3GPP 提供 9 建议 QCI 值作为参考,服务提供商可以给数据服务指定其自己的 QCI。

VoLTE 挑战

  1. 高流量

    所有 VoLTE 流量都基于 IP。呼叫信令以 TCP/SIP 为基础,音频是通过 UDP/RTP 以 AMR-WB 音频编解码器传输的。这些 VoLTE IP 流量将被隐藏在 LTE 核心中所有其他 IP 数据流量中,包括流媒体视频和互联网流量。

  2. 不同的路径

    进行 VoLTE 呼叫时,建立数据载体的控制信号通过与媒体流量不同的数据路径。此外,SIP 信令和媒体流在离开了 EPC 后通过不同的路径和网络单元。对 VoLTE 呼叫建立和质量问题进行故障排除,需要控制信号与创建的用户载体之间的可视性和相关性。

  3. 网段到网段可视性

    通过在 EPC 的多个接口动态地创建专用载体,可以保证音频的 QoS。音频质量问题的端到端根本原因分析需要控制跨越多个网段建立的 QCI 参数的相关性和可视性。

  4. 不对称的媒体流可视性

    可能给 EPC 之中或周围的 RTP 流的各个方向分配不同的 VLAN。尽管有这种不对称性,工程师也必须能够关联 SIP 和 RTP 流并提取数据包以获得对所有 RTP 数据包的可视性。对异常 VoLTE 呼叫丢失进行故障排除时,工程师需要提取数据包对 RTP 有效载荷的定时和行为进行分析。

VoLTE 故障诊断最佳实践

  1. 首先,连接并捕捉流量以获得通过控制面和用户面接口的流量的可视性。通常,一个汇聚型开关,例如 VSS Monitoring 或 Brocade 产品,可以以非常低的延迟率过滤、汇聚和负载平衡流量至工具。

  2. 从捕获的流量,分析 VoLTE 的相关载体建立和配置的 QoS 参数。

  3. 分析通过 EPC 向 IMS 和 SBC 传输以呼叫 2G/3G/PSTN 的 SIP 流量。

  4. 追踪与通过 EPC 中的端口进行的呼叫和通过 MRFP 和 SBC 呼叫 CDMA/PSTN 相关的 RTP 流量。

Network Time Machine 提供高达 20 Gbps 的高性能数据包捕获能力,执行的捕获后分析可将控制面到用户面和 SIP 到 RTP 相关联,因此用户可以时间回溯以执行 VoLTE 问题的端到端根本原因分析。

时间同步考虑事项

如果流量不是在所有流量的时间戳已同步的同一设备上捕获的,所有分析、控制面到用户面和 SIP 到 RTP 的关联可能会很难。如果使用多个捕获设备,捕获设备的时间戳机制必须使用外部 NTP 或 PTP / GPS 时钟源进行同步。作为一种替代方法,先进的汇聚型开关(例如 VSS Monitoring 的产品)接受外部时钟源,可以将时间戳添加到数据包的尾部。使用提供的时间戳重构要导出以进行相关分析的数据包的捕获设备,会使工程师的工作变得更为轻松。

场景 1

用户根本不能进行呼叫。

  • 没有设置默认载体
  • 用户没有在 IMS 注册(验证问题、IMS 超载)

对于这些问题,连接至 S1 和 S11 接口,以检查 UE 的初始连接和载体设置进程,以及是否有来自 UE 的 SIP 流量。Network Time Machine 这样的分析仪可捕获到 S1 和 S11 的所有流量,最高可达 20Gbps,选择感兴趣的 UE,并显示 IMS 的默认载体和专用承载设置步骤。

场景 2

为什么用户不能呼叫 PSTN 用户?

有了 IMS 的支持,VoLTE 用户的呼叫可以被路由至 PSTN。如果失败,需要捕获每个网段的 SIP 流量(端到端)并进行检查,以确定呼叫设置过程是否失败,以及问题根源。对于负责 EPC 的工程师,捕捉到 IMS 和 Regional Core 之间分界点周围的信令流量非常重要,即在 PGW 和 IMS 之间,围绕 SBC,并跨越 MRFP 进行媒体转换。应注意到呼叫建立时的错误和延迟,并从故障起源通过根本原因分析检查数据包的有效载荷。

在排除故障过程中,查找表现出故障的 SIP 流量。SIP 原因代码将提示呼叫为何失败,如 503 服务不可用;这可以意味着是服务因为超载不可用或服务配置不正确。

Network Time Machine 可以分析捕获的 SIP 流量,并提供 SIP 错误的统计和触发错误的呼叫。

 
 
Powered By OneLink