7月2日,日本运营商KDDI移动网络发生大规模通信故障,我们要知道哪些东西?

我们正式开通免费微信群,欢迎各位朋友加入微信群交流,进群送资料!加微信ydian188,备注“弱电智能网”,不备注不予通过。

当地时间7月2日凌晨1点35分开始,日本运营商KDDI的移动网络发生大规模通信故障,导致全日本范围内无法拨打电话、无法收发短信、数据通信变慢。

此次事故影响范围大,持续时间长,影响用户数量达3915万,故障一直持续到7月4日下午才基本完全恢复,给日本全社会造成了极大的不便和损失,也是KDDI有史以来遭遇的最大一次网络系统故障。

故障发生后,KDDI高层及时召开新闻发布会,向广大深受影响的个人和企业用户鞠躬致歉,并表示考虑赔偿损失。

那究竟是什么原因造成了此次大规模通信故障?看完KDDI的报告后,发人深省。

故障原因一:核心路由器割接失败

7月2日凌晨,KDDI组织工程师对连接全国移动核心网和中继网络的一个核心路由器进行割接,将老旧的核心路由器更换为新产品。

不幸的是,通信人最担心的噩梦发生了——割接失败了。在更换核心路由器的过程中,新的核心路由器出现了不明原因的故障。

7月2日,日本运营商KDDI移动网络发生大规模通信故障,我们要知道哪些东西?

搞通信的伙伴们都知道,核心路由器位于网络核心位置,是整个网络的“交通枢纽”,不仅性能强悍、价格昂贵,且需时时刻刻保持稳定运行,否则,一旦出现问题,动辄可能影响全网数百万甚至数千万用户。

正因如此,核心路由器割接好比为活人换“心脏”,是一项极具挑战的工作,也对要更换的新产品的成熟性、稳定性、互联互通性等能力要求极高。

但KDDI偏偏在这项要求极其谨慎的工作上掉了链子,接下来的后果当然就相当严重了——

由于新核心路由器无法将语音流量正确路由到VoLTE交换节点,直接导致部分VoLTE语音业务中断15分钟。

故障原因二:信令风暴击溃VoLTE网络

核心路由器割接失败,这场景简直不敢想象,隔着屏幕都能吓出冷汗!

怎么办?赶紧回退呗。KDDI的工程师们快速启动了回退操作,于7月2日凌晨1点50分将连接重新切换回旧的核心路由器。

但更大的问题发生了。

7月2日,日本运营商KDDI移动网络发生大规模通信故障,我们要知道哪些东西?

回退后,“由于VoLTE终端每50分钟进行一次位置注册”,大量终端向VoLTE交换节点发起位置注册信令,以重新连接至网络。海量信令集中突发,很快引发VoLTE交换节点拥塞,致使大量用户无法进行VoLTE通信。

同时,移动网络中有一个“用户数据库”,负责存储用户的签约数据和位置信息,由于VoLTE交换节点拥塞,“注册在用户数据库的位置信息无法反映在VoLTE交换机上”,出现数据不匹配问题,也导致很多用户无法通信和拨打电话。

针对此情况,KDDI于7月2日凌晨3:00后开始从无线侧、VoLTE核心网侧同时实施流量控制策略,以及通过断开PGW的方式减轻用户数据库负荷,以缓解网络拥塞,并在PGW采用“会话重置”措施解决用户数据库中的数据不一致问题。

7月2日,日本运营商KDDI移动网络发生大规模通信故障,我们要知道哪些东西?

因为实施流量控制,接下来导致了全国范围内的数据通信和语音通话难以连接。

接下来,KDDI开始紧张的网络恢复工作。7月3日上午11点,KDDI宣布日本西部基本完成网络修复工作。下午5点30分,日本东部基本完成。但仍然有一些用户难以进行数据通信和语音通话。

7月2日,日本运营商KDDI移动网络发生大规模通信故障,我们要知道哪些东西?

直到7月4日下午4点,距离故障发生62个小时后,KDDI表示已在全国范围内基本恢复。

发人深省

类似的重大网络故障在日本并不是头一次。

2021年10月14日,日本另一家运营商NTT DoCoMo的移动网络也发生过全国性的重大通信事故,导致大量手机用户无法进行通话和数据通信。

此次事故同样因为割接失败后回退操作,引发信令流量大爆发,导致网络大拥塞。

具体情况是,NTT DoCoMo在替换用于存储物联网终端设备的用户和位置信息的网络设备时出现了问题,然后立即启动回退操作,重新倒回到旧设备。

但这一回退操作,引发了大量物联网终端向旧设备重新发起位置注册信息,汹涌而来的“信令风暴”快速引发了网络拥塞,并波及3G/4G/5G网络的语音和数据分组核心设备,导致大量用户无法通话和数据通信。

与NTT DoCoMo不同的是,KDDI此次是因为核心路由器割接失败引起,而且故障持续时间要长很多。

但值得一提的是,KDDI似乎并非没有吸取DoCoMo的教训。

KDDI在全日本范围内拥有6个交换中心,共18个VoLTE交换节点,且交换中心内的VoLTE交换节点是相互冗余备份的。而本次因核心路由器割接导致VoLTE业务中断的只是其中一个交换中心的VoLTE交换节点。

“我们做过压力测试,因为有冗余备份,即使一个交换中心范围内的所有终端同时发起重新连接请求,也不会发生拥塞。”

KDDI表示,“但不知道什么原因,结果还是发生了拥塞,我们还没有完全搞清楚到底是哪里出了问题。”

但愿KDDI最终能彻底找出此次事故的所有原因。也希望通信业再也不要重蹈覆辙。因为,重大网络故障,这六个大字,对于通信业而言,实在太可怕了。

声明:本文来自网优雇佣军,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们。

题图来自 Unsplash,基于 CC0 协议

(4)
上一篇 2022年7月7日 上午9:51
下一篇 2022年7月7日 上午10:08

相关推荐

  • 2017年底运营商提速降费,普及100M宽带,将会促进智能硬件的发展

    2016年通过国家政策的出台及总理的督促,三大运营商终于不情不愿的推出了降费方案,随着智能硬件不断普及,用户对于流量和网速的要求越来越高。在提速降费的号召下,三大运营商被要求于2017年底,在全国全面普及100M的光纤宽带。 中国移动表示提速降费的工作重点放在4G网络、有线接入,打造以50M接入能力为主固定宽带网络,全国平均接入速率达20M以上。 中国联通将…

    2017年1月3日
    007.2K
  • 5G移动网络离我们越来越近了,2020年前将实现大规模商用

    说到通信,5G移动网络是非常火的一个词,虽然到现在,5G标准还未完全确定,但是包括我国在内的多个国家都已经明确将第一时间(2020年或更前)开始大规模商用,中国移动和中国电信都明确了将在2018年开展商用实验。5G移动网络是什么?离我们还有多远?规模商用还有哪些问题要解?中国与世界领先水平有多大差距? 一、5G移动网络是什么? 第五代移动电话行动通信标准,也…

    2017年5月20日
    001.8K
  • 爱立信:对5G标准统一有信心 技术方向分歧并不大

    5G,已经成为全球移动通信产业通往下一站的共同目标。随着5G研发大幕在全球开启,产业界又将迎来一个个新的挑战:5G标准将如何制定?潜在的关键技术如何实现突破性创新?目前5G研发方面又有哪些最新进展? 对于面向2020年及未来商用的第五代移动通信技术所面临的一系列挑战以及产业发展趋势,来自电信设备市场的百年老店爱立信有着深入的洞察。对此,爱立信东北亚区市场部主…

    2016年5月24日
    006.6K
  • 5G的普及将增加全球能源的压力

    你知道吗?到2025年,通信行业将消耗全球20%的电力。随着4K/8K、VR/AR、自动驾驶、机器人、视频监控等应用蓬勃生长,一场伴随着5G万物智联而来的数据海啸正滚滚袭来,而海量数据引发的电力消耗也必将成倍增长。 全球多家领先运营商已公开表态:要以最低的成本建设最好的5G网络。可电费已被一些运营商确定为最高的OPEX支出,至少占运营商总运营成本的15%,可…

    2018年12月8日 资讯
    00170
  • 2017年十大创业趋势:产业升级新机会

    2016年是神奇的一年,英国脱欧、特朗普当选,似乎所有大事都未按照人预判中进行。埋头发展经济的中国,2016年同样不平凡,年初让人谈之色变的资本寒冬没有想象中的激烈,年中不可一世的共享出行却因政令深陷泥潭。从3D打印、移动直播、网红经济、自媒体到PAPI酱/罗振宇风生水起内容创业,在我们的见证下这一年轰轰烈烈。 还有一个多月时间,新的一年又将开始。2017年…

    2016年12月8日
    002.5K
  • 什么是PON(无源光纤网络),PON的发展及演进

    全球知名媒体Omdia在光纤和铜缆接入设备预测报告中对2022年2月的预测显示,PON设备端口收入预计在2020年至2027年期间以12.3%的年复合增长率增长,到2027年将达到163亿美元,远高于2020年的82亿美元。 此前,Omdia有份报告称,在3月份举行的美国OFC展会中,众多 CSP 正在顺利部署 XGS PON(10G 对称),其他 CSP …

    2022年6月21日
    009.5K

发表评论

登录后才能评论
关注我们