Meta宕机影响Facebook、Instagram、WhatsApp和Threads;知道哪里出了问题

2025-01-25 22:48来源:本站编辑

墨尔本,12月14日:全球流行的社交媒体和消息服务,包括Facebook, Instagram和WhatsApp的用户受到严重影响。所有这些平台都是由社交媒体巨头meta运营的。

随着停机消息的传播,我们了解到它几乎影响了meta的所有产品,包括Messenger和Threads,以及meta的商业产品,如Facebook Ads Manager和Instagram的Messenger API。大多数服务都开始重新上线。但到底是哪里出了问题,我们能从这次大规模停电中学到什么?

中断的范围

据报道,从英国到加拿大到美国和其他地区都出现了停电。周三(纽约时间下午12点30分左右,伦敦时间下午5点30分左右,悉尼时间周四凌晨4点30分左右),美国首先报告了这次中断。5个小时后,meta发消息给X,表示已经解决了99%的故障。

是什么原因导致的?

目前,还没有关于停电原因的官方消息。然而,我们可以根据它的范围做出一些有根据的猜测。

从目前的报道来看,宕机不仅影响了meta的主要社交媒体平台和消息服务,还影响了它的一些商业产品。它还影响了meta的Facebook登录服务,该服务允许用户使用Facebook用户名和密码登录第三方网站。

换句话说,似乎很少有meta产品没有受到这次中断的影响。这表明,无论出了什么问题,都是一个单点故障:所有meta服务依赖的某个东西,没有它,服务就无法运行。

可靠性设计

这种中断是罕见的。这是因为主要的互联网平台被设计成高度可靠的。实现可靠性的主要方式是通过复制。例如,当你访问Instagram时,你的电脑连接到一个服务器,该服务器将发送回你的Instagram动态。事实上,Instagram的内容并不是存储在一台电脑上,而是通过大量的电脑复制,这些电脑被称为内容分发网络(CDN)。

几乎所有主要的网络平台,包括新闻网站,如The Conversation,大公司和在线服务,如YouTube和b谷歌,都使用内容交付网络来提高其网站的可靠性和效率。内容传递网络背后的理念是,如果网络中的一台计算机出现问题,另一台计算机可以接替它的位置。这就是网络可靠的原因。

内容分发网络在网站需求量大的时候也有帮助。如果许多人试图请求相同的内容,这些请求可以在网络中的许多计算机之间分散,从而使每个请求都能得到有效处理。meta宕机的广泛性表明,它可能发生在meta系统中未被复制的部分。然而,在我们确定之前,我们必须等待meta关于原因的消息。

需要吸取的教训

今年早些时候,CrowdStrike的Falcon安全软件造成了重大宕机,meta的宕机紧随其后。猎鹰的设计意味着它与微软的Windows系统纠缠不开。这使得猎鹰成为单点故障,因此,当它坠毁时,它也会以一种壮观的方式导致Windows系统崩溃。

从这次宕机事件中得到的一个重要教训是,像Falcon这样的侵入性安全软件应该重新设计,以便与Windows保持一定的距离。这个想法被称为故障隔离,它说系统应该被构建为一个独立组件的集合,这样如果一个组件出现故障,它就不会导致整个系统故障。

这就是为什么现代船舶被设计成有多个内部隔间的原因,并配有使每个隔间水密的机制。这样,如果船体破裂,水就不会淹没整艘船。Cmeta的停电及时提醒我们,需要对关键系统进行设计,以最大限度地提高其可靠性,包括尽量减少中心故障点,并采用故障隔离等工程原则。

展望未来

与此同时,meta中断的确切原因仍有待确定。世界上很多人都依赖meta的服务。其中包括使用Instagram作为吸引在线客户的主要平台的企业,或使用Facebook Marketplace作为主要收入来源的商家。对许多家庭来说,WhatsApp已经成为一种不可或缺的保持联系的方式,尤其是在危机时刻。我们只希望meta能够坦率地说明这次宕机的原因,以及它将采取的措施,以确保它不会再次发生。(对话)

鸡鸣网声明:未经许可,不得转载。