白皮书

Wi-Fi 故障诊断:连接问题

简介

作为 IT 专业人员,我们都遇到过,可怕的 Wi-Fi 不正常投诉。您正在办公室悠闲地工作,然后突然有个人进来并开始投诉无法连接无线网络,或者无线网络慢、总是从无线网络断开、无法连接因特网等。这些都是常见的投诉,而且它们都非常恼人,因为要找出这些常见无线网络问题的根本原因可能会非常耗时,而且有时候会很困难。真的是这样吗?有没有可能,解决这些常见的无线问题并不是真的这么困难呢?现实是,它确实不难。只要有正确的工具和一点点知识,就可以又快又简单地找到大部分常见无线网络问题的根本原因。

我们的 Wi-Fi 故障排除白皮书第一条将重点告诉您如何快速而有效地解决“连接问题”,或者更准确地说,连接 Wi-Fi 网络的问题,请不要将其与连接具体网站或 IP 地址的问题混淆。大部分用户不知道其中的差异,都会投诉说“无线不正常。我无法连接到因特网。”

所以在本文中,我们将先说明连接 Wi-Fi 问题和访问网络资源问题之间的差异。然后我们将为您介绍如何识别 Wi-Fi 网络连接问题的最常见原因,并且我们将提供解决这些问题的建议。

让我们开始吧!

识别问题

开始诊断 Wi-Fi 连接问题之前,您需要确定问题确实与 Wi-Fi 相关。如本文序言所述,大部分用户不知道 Wi-Fi 相关问题、DHCP 服务器问题、DNS 问题等的差异。用户只知道他们无法连接网络。所以诊断流程的第一步就是重复问题并找出问题是否出在 Wi-Fi 网络上。

重复连接问题是一个相对简单的过程,有多种方式可以完成:

1.

您可让投诉无法连接网络的人为您展示他们遇到的问题或他们收到的错误消息。这种方法可能不会为您提供太多与问题的根本原因相关的细节,但它可以让您确认是否真的有问题。不仅如此,如果用户设备真的出现 Wi-Fi 网络连接问题,那么,如果问题设备在您的手上,您就可以检查客户端设备上是否有配置问题或用户错误。毕竟,网络连接问题最常见的原因不是网络,而是用户错误或简单的 Wi-Fi 网络配置问题。
 

A.

部分最常见的用户错误有:
 

i.  

用户尝试连接错误的网络 – 这在忙碌的环境上经常发生。用户可能误选了错误的 SSID,或者用户设备可能会自动连接一个过远的已知热点而无法成功连接。
 

ii.

用户输入了错误的安全凭证 – 有时候会输错,而这是这种类型问题的主要原因。
 

iii.

用户尝试使用未授权的设备连接网络 – 这种问题经常发生在访问网络需要证书的情况下,或者仅有特定 MAC 地址的设备可以连接网络的情况下。
 

iv.

使用过期设备 – 如果客户端设备不支持 5.0GHz 频带或扩展信道,则用户连接特定 SSID 时可能会有问题。
 

B.

部分最常见的 Wi-Fi 网络配置问题有:
 

i.  

缺少 SSID – 如果用户尝试连接的 SSID 未显示出来,则可能意味着已错误地将 SSID 配置为隐藏。也可能意味着 Wi-Fi 网络有真正的问题,例如覆盖范围不足,或接入点已停止传输。使用其他设备查找您要连接的 SSID 即可轻松验证这个问题,但请记住,第二个设备要和问题设备在相同的物理位置上。
 

ii.

无效 IP 地址 – 虽然不是全部,但部分用户设备可以提供这些信息,部分用户设备可以连接 Wi-Fi 网络并成功验证,但无法获得 IP 地址。这种类型问题的根本原因通常是 DHCP 服务器配置问题(例如,没有足够可以使用的 IP 地址)。Wi-Fi 网络连接不稳定时也会发生此问题。基本上就是,IP 地址信息受到破坏,无法传输到用户设备。
 

iii.

无效 DNS 地址 – 如果客户端设备说它可以成功连接 Wi-Fi 网络,但没有网络连接,这通常意味着 DNS 服务器有配置问题。也可能是因特网服务提供商的问题。

图片 1:Android 设备常见 Wi-Fi 连接错误示例1

2.

另一种验证 Wi-Fi 网络连接是否有问题的方法是使用另一个设备连接网络。在这种情况下,您可以使用有问题的人使用的设备,这样您可以验证 Wi-Fi 网络是否有连接问题。或者您可使用专用 Wi-Fi 测试工具运行完整的“连接测试”,这样您不仅可以验证连接,还可以获得一些详细信息,让您更快地找到问题的根本原因。例如,专用测试工具可以提供的一些有用的信息包括:
 

a.

连接状态和时间 – 这可帮助您验证您是否可以连接某个接入点,以及需要多少时间。这个阶段的问题将证明 Wi-Fi 网络上确实有连接问题,这通常是覆盖率问题、干扰、低 SNR 等造成的。
 

b.

验证状态和时间 – 这可帮助您验证您能否成功验证身份以及需要多长时间。这个阶段的问题通常意味着使用了错误的密码短语;如果使用的是 WPA2-E,则可能意味着使用了错误的证书。身份验证时间长通常意味着身份验证服务器有问题,但也可能是 Wi-Fi 连接不稳定造成的。
 

c.

网关状态和响应时间 – 这可以验证设备是否能与网关通信,并有助于验证通信速度。
 

d.

DHCP 状态和响应时间 – 这将显示设备能否获得 IP 地址以及速度有多快。这个阶段的问题通常与 DHCP 服务器有关,或者是 Wi-Fi 网络的稳定性问题。
 

e.

DNS 状态和响应时间 – 这将显示设备能否与 DNS 服务器通信,以及需要多少时间。此时的问题是您可成功连接 Wi-Fi 网络,但因为 DNS 服务器有问题,所以无法使用 URL 访问因特网。
 

f.

找到目标 – 部分测试设备让您可能验证到具体目标的连接。它可以是一个 URL 或 IP 地址。这可用于验证到常用本地资源或因特网的连接。
 

g.

连接 PHY 数据速率 – 这可验证连接测试期间测量的 PHY 数据速率。数据速率低可能是 Wi-Fi 网络的问题,也可能是客户端设备过时或者接入点配置问题。
 

h.

重试率 – 这通常是发送的重试帧的百分比。高于 20% 的重试率将证明 Wi-Fi 网络有问题。

图片 2:NETSCOUT Aircheck G2 连接测试结果示例。

识别根本原因

证明用户报告的连接问题是 Wi-Fi 网络问题造成的之后,便可开始查找问题的根本原因。Wi-Fi 连接问题最常见的原因有:

  • 信号覆盖率
  • 信噪比 (SNR)
  • 旧版 802.11 设备
  • 安全性
  • 容量
  • 无线问题

信号覆盖率

信号覆盖率差仍然是 Wi-Fi 连接问题最常见的原因之一。毕竟,如果 Wi-Fi 设备无法互相听到,它们就无法通信。问题是,很多东西会影响 Wi-Fi 信号在环境中的传播,因此会产生覆盖问题:

  • 丢失(可用空间)– 波自然展宽造成的信号强度丢失。信号传播地越远,信号衰减的强度就越大。
  • 反射 – 波射到大于波本身的光滑物体上时,波可能会从另一个方向上弹回,具体取决于介质。反射是 802.11a/b/g 网络性能差的主要原因,因为它会造成一种被称为多径传输的效果,导致信号强度丢失、以及数据包错误。
  • 折射 – RF 信号通过密度不均匀介质时发生弯曲,导致波的方向改变。这最常发生于户外,是环境条件造成的(水蒸汽、气温变化、气压变化)。信号通过特定类型的玻璃和其他材料时也可能发生折射。
  • 衍射 —— RF 信号沿物体弯曲。这通常是 RF 信号被部分遮挡造成的,例如被小山或建筑遮挡。
  • 散射 – 电磁信号波长大于反射或通过信号的介质时,就会发生多次反射。遇到不均匀的表面时,例如铁丝网围栏、灰泥墙中的铁丝网、岩石地带等,就会发生这种情况,导致信号因在多个方向上反射而被消耗,造成信号强度降低。
  • 吸收 – 如果信号不在物体上反射、没有绕过物体、或通过物体,则会发生 100% 的吸收。大部分材料都会吸收一定量的射频信号,导致信号强度降低。最常见的吸收物有砖墙、水泥墙和水。

图片 3:射频行为示例

另外,与大部分人认为的不同,接入点信号覆盖率不是您唯一需要担心的。您还需要考虑客户端设备信号覆盖。毕竟,如果接入点无法听到客户端设备的响应,通信就会失败。

  • 接入点覆盖 – 从客户端设备角度看到的接入点信号强度。信号要足够强才能保证客户端设备能听到接入点发送的消息。
  • 客户端设备覆盖 – 从接入点角度看到的客户端设备信号强度。信号要足够强才能保证接入点听到客户端设备发送的回复。

关于如何识别覆盖问题,您可使用几个简单的方法:

  1. 诊断问题区域 – 在已知的问题区域诊断覆盖问题非常简单。您只需要一个能测量接入点和客户端信号强度的工具。在问题区域验证接入点信号强度可以让您确认所有客户端设备都能看到您的网络。同时,从接入点的角度验证客户端设备信号强度可以确认能否实现通信。注意客户端设备覆盖问题的一个常见原因是接入点的功率增大到非常高的水平。如果接入点的覆盖率过高,则覆盖范围边缘且 Wi-Fi 发射功率较低的客户端设备可能无法回复接入点,从而造成连接尝试失败。
  2. 调查站点 – 另一种常用方法是调查整个站点而不仅仅是一个点,具体就是执行站点调查,从而生成 Wi-Fi 网络性能的图形或热图。有多种工具可以执行站点调查。其中部分可以对覆盖情况和 Wi-Fi 干扰进行基本分析。同时,其中最先进的工具可以分析覆盖率、噪音水平、SNR、数据速率、重试率、Wi-Fi 干扰、非 Wi-Fi 干扰等等很多。请注意,我们强烈建议在部署新 Wi-Fi 网络后,以及在之后每隔几个月执行一次站点调查。这样您可验证您的 Wi-Fi 网络性能是否符合预期,并有助于发现未来可能导致问题的变化。

覆盖率问题通常是通过添加更多接入点、使用增益更高的天线、或提高接入点发射功率的方式解决的。请注意,提高功率也会提高噪音水平,因此通常建议使用更好的天线或更多接入点。

图片 4:使用 NETSCOUT AirMagnet Survey Pro 收集的信号强度热图示例。

信噪比

图片 5:SNR 图示例。

连接质量和速率直接取决于接收设备(包括接入点和客户端)检测到的信噪比 (SNR)。如上一节所述,信号强度衰减或损耗是很容易发生的事情。因此,随着信号水平降低,SNR 降低,传输速率也会降低。例如,距离接入点“过远”的设备可能可以看到它想连接的网络,但如果 SNR 过低,传输质量也会很差,使其无法成功连接(某一时刻“弱但足够强”的信号在下一时刻可能变得“过弱”)。

影响信噪比的另一个因素是本底噪音,这可定义为特定信道上的环境或背景无线电能量水平。这个背景能量包括附近 802.11 传输无线电的调制或编码位,或来自非 802.11 设备(例如微波炉、蓝牙设备、无绳电话等)的非调制能量。噪音水平越高,信噪比越低。

最差情况就是信号弱而噪音水平高,这种致命的组合会大幅降低信噪比,进而导致性能和连接问题。无论如何,识别信噪比问题都非常简单,您只需要一个可以同时测量信号强度和噪音的工具。请注意,在过去,大部分 Wi-Fi 适配器可以测量噪音水平,但现在这种已经不多了,因此您可能需要一个专用的诊断工具来提供这些信息。有很多 Wi-Fi 诊断甚至调查工具可以完成此任务。

关于如何解决信噪比低造成的连接问题:

  1. 提高 Wi-Fi 网络覆盖率,确保信号强度比本底噪音高至少 20 dBm(对于超出 Wi-Fi 部署的语音,您可能需要让信号强度高 30 dBm)。
  2. 通过使用 Wi-Fi 流量低的信道、以及删除所用 Wi-Fi 信道上会增加本底噪音的非 Wi-Fi 设备减少环境中的本底噪音。如果无法移动或禁用产生噪音的非 Wi-Fi 设备,您将需要重新配置您的接入点,让它们不再使用本底噪音高的信道。

图片 6:NETSCOUT Aircheck G2 收集的信号水平、噪音水平和 SNR 测量结果示例。

旧版 802.11 设备

周围仍有较老的 Wi-Fi 设备!但它们不支持现在较高的数据速率,所以当它们连接到 Wi-Fi 网络时,它们只能以较低的数据速率传输。不仅如此,用户可能会在未察觉的情况下使用不支持较高数据速率的旧设备,这样,为了节省宝贵的广播时间,接入点有时候会屏蔽较早的速率,特别是 802.11b,从而产生问题。仅支持较老的速率的设备可能无法连接网络。

另一个问题是不支持 5.0 GHz 频带的老设备。很多企业网络为了可以使用更多信道和减少干扰而迁移为支持 5.0 GHz 带宽,在这种情况下,旧 802.11 设备将无法再连接企业 Wi-Fi 网络。不仅如此,部分旧客户端设备可能支持 5.0 GHz 带宽,但不是支持该带宽上的所有信道。例如,很多较早的设备不支持 DFS 信道(频率与雷达发射共享),这些设备也因此无法连接网络。

关于如何方便地识别这些限制,最简单的方法就是使用可以识别客户端设备功能的工具。您会希望您选择的工具可以提供客户端设备的以下信息:

  • SSID – 可以识别客户端设备连接到的网络,但仅在设备连接到网络后可以使用;还可以验证客户端设备是否连接到了正确的网络。
  • 接入点名称 – 可以验证客户端设备连接的是哪个接入点,如果您要确定客户端设备连接的是最近的接入点,这可能会非常有用。
  • 连接速率 – 提供客户端设备使用的连接数据速率。帮助您验证客户端设备支持的最高速率,从而判断设备是否因为数据速率限制而无法连接 Wi-Fi 网络。
  • 安全性 – 提供客户端设备使用的安全保护类型信息,可以验证客户端设备的安全配置。
  • 802.11 类型 – 客户端设备支持的 802.11 技术类型。帮助您验证客户端设备是否支持最新的 802.11 技术和更高的数据速率。
  • 带宽 – 提供与客户端设备使用的带宽相关的信息,让您验证客户端设备是否支持 2.4 GHz 和 5.0 GHz 带宽。
  • 信道 – 提供有关客户端设备使用的信道的信息。部分较老的客户端设备可能无法支持所有 5.0 GHz 信道。

这种类型问题的唯一解决方案就是让用户将设备升级到支持最新的 802.11 技术,或更改接入点上的配置使其支持较老的设备。升级客户端设备应该是比较理想的选择,因为增加对较老的 802.11 技术的支持可能会影响较新的客户端设备的性能。

图片 7:使用 NETSCOUT AirMagnet WiFi Analyzer Pro 收集的客户端设备信息示例。

安全性

安全是好的,但管理接入点和客户端的安全并不简单。任何密码短语错误、证书丢失、或错误都会导致客户端设备无法连接。

除此之外,部分网络的安防方法是只允许特定的 MAC 地址连接和验证,如果设备的 MAC 不在列表中,它就无法成功连接。

接入点和客户端设备都必须有正确的安全凭证才能成功连接,任何一方的凭证配置有误都会造成授权用户无法通过验证。

关于识别安全配置问题导致的连接问题,下面是一些提示:

  1. 如果网络上使用 WPA-P 或 WPA2-P,要验证的第一件事就是密码短语是否正确。
  2. 如果网络上使用 WPA-E 或 WPA2-E,您应该先验证使用的凭证是否正确,以及客户端设备是否已安装所需的凭证。
  3. 如果仅允许授权的设备访问网络(使用 MAC 地址),则您还应该检查客户端设备的 MAC 地址是否在批准的名单中。
  4. 如果使用 WPA-E 或 WPA2-E 且多个设备有相同的问题,则您应该确定身份验证服务器是否正常。

确定安全配置问题后,您只需修复客户端设备、无线网络、或身份验证服务器上的配置即可解决问题。

图片 8:MAC 操作系统设备上的安全设置示例。

容量

如果同一片区域有太多客户端设备正在传输,或者有一个或多个客户端设备生成了过量的流量(带宽滥用),则会产生容量问题。以下情况也会产生容量问题:

  1. 同信道干扰过多 – 同一信道上有太多设备。例如,同一区域同一信道上的接入点建议不要超过四个。
  2. 接入点网络配置不足 – 没有足够的接入点来处理可用的客户端设备数量。建议一个接入点上同时接入的客户端设备不要超过 25 个。
  3. 客户端负载失衡 – 大部分客户端连接到了同一个接入点,而不是均衡地分配到该区域中的所有接入点
  4. 非 Wi-Fi 干扰 – 不使用 Wi-Fi 技术但生成相同频率射频信号的设备会提高信道利用率,从而降低信道容量。

这些都会造成单个信道上有过多的客户端传输,从而使信道过载。另外,一定要理解,不仅信道上连接的客户端数量会增加该信道的负载,它们产生的流量也会。传输大文件或流传输高清视频的几个客户端就可以使一个信道过载。

那么如何判断信道是否过载呢?方法是测量信道的利用率,或者从基本上,测量信道的使用百分比。很多专用 Wi-Fi 故障排除工具甚至应用都可以提供这些信息,但它们大部分只分析 Wi-Fi 利用率,可能无法提供判断所用 Wi-Fi 信道有多忙碌的足够信息。因此,测量利用率的最佳方式就是使用专用的 Wi-Fi 故障排除工具以同时分析 Wi-Fi 和非 Wi-Fi 利用率。

图片 9:NETSCOUT Spectrum XT 对比 Wi-Fi 和非 Wi-Fi 利用率的信道忙闲度图。

关于如何解决容量问题,下面是一些提示:

  1. 使用接入点控制器限制各个客户端设备可以使用的带宽量。这有助于避免客户端设备生成可能影响网络性能的过量流量。
  2. 让接入点控制器自动调整信道,从而减少信道干扰。如果您的控制器上没有此选项,则您需要手动调整接入点信道分配,使得同一信道上不会出现使用重叠信号的两个接入点。
  3. 尽量将设备移到可用信道更多的 5.0 GHz 带宽。这可通过在接入点控制器上启用“带宽转向”选项来完成。基本上,如果您启用此选项,则控制器将把客户端设备移到 5.0 GHz 带宽,并将 2.4 GHz 带宽留给旧设备。
  4. 计划 Wi-Fi 网络时,一定要根据预期的最大用户数量安装足够的接入点,另外请记住,虽然很多接入点支持超过 100 个并发客户端连接,但仍然建议将并发连接的数量限制到每个接入点 25 或 30 个客户端。并发客户端的数量取决于可用的带宽量,以及您计划为每个用户提供的带宽量。
  5. 一定要在接入点控制器上启用“负载平衡”选项。这将使控制器可以平衡各个接入点之间的客户端设备负载。这样便不会产生大部分客户端连接到同一个接入点的现象。
  6. 使用频谱分析仪检测、识别和查找所有非 Wi-Fi 干扰源。您可能还需要使用频谱分析仪识别受到干扰影响的信道。然后,如果可能,可以移除或禁用干扰设备,或者如果不可能,请一定要让接入点使用不受干扰设备影响的信道。

无线问题

每个无线接入点都有一个到网络的回程连接,而这几乎总是以太网。接入点以太网到网络的连接是整体连接链中的关键链接。即使客户端设备连接到 WLAN,它们仍然需要像 DHCP 和 DNS 这样的基本有线服务才能访问大部分资源。部分可能导致 Wi-Fi 连接问题的最常见有线问题是:

  1. DHCP 和 DNS 服务访问 - 如本文前面的部分所述,DHCP 或 DNS 服务问题会导致用户以为他们无法连接 Wi-Fi 网络。如果无法访问 DHCP 服务器,则用户的客户端设备将无法获得 IP 地址。如果无法使用 DNS 服务器,则用户的客户端设备将无法通过 URL 访问网站。
  2. WAN 连接 - 如果到因特网的 WAN 连接不正常,用户就会看到 Wi-Fi 网络不可用。这可能是简单的路由问题造成的,例如以太网线插入了 LAN 端口而非 WAN 端口、WAN 接口需要静态 IP 地址、或需要在网络服务提供商的调制解调器上输入以太网点对点协议 (PPPoE) 凭证。
  3. 接入点功率 - 大部分调制解调器接入点都使用以太网供电 (PoE)。因此,如果交换机上提供的电源断开,或配置了错误的 PoE 选项,则接入点的性能就会受到严重影响。这可能导致 Wi-Fi 连接问题,并可能导致终端用户以为 Wi-Fi 有问题。

那么,如何判断问题是否在网络的有线方面呢?最简单的方式就是使用专用的 Wi-Fi 故障排除工具运行连接测试。如本文档之前所述,连接测试可以识别连接流程的哪一部分有问题。例如,连接或身份验证步骤失败可能意味着存在 Wi-Fi 连接问题(如本文之前所述)。同时,DHCP 或 DNS 步骤失败可能意味着有线网络上的服务有问题。再加一个可以验证到外部网站连接的步骤,然后您就可以确认是否有 WAN 连接问题了。最后,我们还建议准备一个可以帮助您验证有线网络 PoE 和连通性的工具。此类工具可以测量为接入点提供的功率,并让您在有线网络上运行连接测试,从而快速发现 DHCP 或 DNS 服务问题。

图片 10:NETSCOUT AirCheck G2 上的以太网测试示例。

关于如何解决有线问题造成的 Wi-Fi 连接问题,下面是一些提示:

  1. 验证您的 DHCP 或 DNS 服务器配置。
  2. 验证以太网交换机和所用 VLAN 的配置。这包括 PoE 配置,而且您需要确定它满足接入点的功率要求。
  3. 验证接线,确保线上没有断开的地方,并确保所有接头安装正确。
  4. 确保您的网线长度不超过 328 英尺,因为这是 PoE 的限制。如果您的线过长,则接入点收到的功率会低于预期。
  5. 确保您的 PoE 交换机没有过载。每个交换机都有输出功率限制,所以如果您同时为过多设备供电,或多个高能耗设备连接到同一台交换机上,则您的交换机可能无法为您的接入点生成所需的功率输出(即使配置正确)。

结论

总之,Wi-Fi 连接问题的诊断或解决并不一定困难。只要有正确的工具和一些知识,您应该就能快速而方便地解决 Wi-Fi 连接问题。NETSCOUT 致力于提供市场上最好的 Wi-Fi 故障排除工具,包括分析 Wi-Fi 网络性能的调查工具,以及运行连接测试、识别非 Wi-Fi 干扰源、测试有线网络等的软件或手持故障排除工具。

1Android 是 Google Inc. 的商标。

© 2018 NETSCOUT SYSTEMS, INC. 保留所有权利。NETSCOUT 和 NETSCOUT 标志是 NETSCOUT SYSTEMS, INC. 和/或其子公司和/或其附属公司在美国和/或其他国家的注册商标。所有其他品牌和产品名称和注册和未注册商标是其相应所有者独有的财产。

 
 
Powered By OneLink