추천, 2024

편집자의 선택

Amazon Web Services의 Glitch는 다른 사람들을위한 모닝콜을 제공하는 Netflix 및 Tinder의 AWS 결함이 있습니다. "노스 버지니아 공장은 일요일 넷플 릭스, 틴더 및 기타 주요 웹 사이트에서 문제를 일으켰습니다.

[오픈인터뷰]'가상화 스토리지'(IP SAN)에 관한 5가지 궁금증

[오픈인터뷰]'가상화 스토리지'(IP SAN)에 관한 5가지 궁금증
Anonim

이 문제는 주로 정상보다 높은 오류율의 형태로 나타났습니다. 영향을받은 사이트에는 IMDb 및 Amazon의 Instant Video and Books 웹 사이트도 포함되어 있습니다.

snafu의 중심에는 AWS의 DynamoDB 데이터베이스 문제가 있지만 EC2, 모바일 중심의 Cognito 서비스 및 CloudWatch "

"최고의 TV 스트리밍 서비스 "

"근본 원인은 DynamoDB 내 메타 데이터 서비스의 일부에서 시작되었습니다. "AWS는 대시 보드 업데이트에 설명 된 AWS의 설명을 게시했습니다 일요일 오전 4시 52 분 (PDT). "이것은 테이블 및 파티션 정보를 관리하는 내부 서브 서비스로, 복구 작업은 이제 메타 데이터 작업 복원에 초점을 맞추고 있으며 복구 작업을 진행하는 동안 API를 조정할 것입니다."

PDT 일요일 오전 3시에 시작한 후 DynamoDB 문제는 오전 8시 15 분에 해결되었습니다. 다른 모든 서비스는 11.05 am

에 복구되었습니다. "Enderle Group의 수석 애널리스트 인 Rob Enderle은 다음과 같이 말합니다. 미션 크리티컬 시스템 용으로 판매되는 서비스는 엄청난 중복성을 가져야하며 여러 고객의 구현 간 격리가 있어야 모든 사람을 파멸시키지 않아야합니다. "

앞으로 유사한 사건이 발생할 경우, 엔더는 "AWS는 고객을 잃을 수있다"며 "AWS 고객을위한 경고의 이야기"라고 말했다. "결국 아마존에는 적절한 장애 조치 보호 기능이 없기 때문에 고객은 자신의 이중화 접근 방식으로 인해 최소한의 혼란을 겪은 것 같습니다."

이메일을 통해 영향을받은 AWS 지역에서 발생한 트래픽을 신속하게 리디렉션 할 수있었습니다. "914 AWS에서 미션 크리티컬 시스템을 실행하는 다른 아마존 고객은 넷플 릭스의 접근 방식을 에뮬레이트하는 것이 좋을 것이라고 Enderle은 제안했습니다.

이번 행사는 AWS를 통합하고 강력한 장애 극복 능력을 갖춘 BMC와 같은 회사뿐만 아니라 "SoftLayer에서 훨씬 더 강력한 제품을 제공하는 IBM"에게 이익이 될 수 있다고 Enderle은 말했습니다. RedMonk의 공동 설립자이자 수석 애널리스트 인 Stephen O'Grady는 고객이 가동 시간에 중점을 두었 기 때문에 클라우드 제공 업체에게 중요한 역할을한다고 덧붙였습니다. "의심 할 여지없이 AWS는 오늘날 고객과 '즐겁지 않다' "라고 말했다.

오그 레이디는 "아마존과 같은 기업의 궤도에 지속적인 영향을 미치지는 못했다"며 "모든 공급 업체는 중단이있다"며 " 그것과 복구는 거의 즉시 시작되었습니다 "라고 Forrester의 수석 애널리스트 인 Dave Bartoletti는 동의했습니다. 그는 "내 경험에 비추어 볼 때 AWS는 고객을 놀라게하지 않고도 1 년에 2 ~ 3 년을 처리 할 수있다"고 덧붙였다.

그는 "클라우드 애플리케이션의 실패를 디자인하는 것은 일종의 모닝 콜이다"라고 덧붙였다. 이 기사의 이전 버전은 영향을받은 서비스가 복구 된 시간을 다섯 번째 단락에서 잘못 설명했습니다. DynamoDB 문제는 오전 8시 15 분에 수정되었으며 다른 서비스는 오전 11시 5 분에 복원되었습니다.

Top