No ano passado, vimos a Engenharia de Caos passar de uma ideia muito comentada para se tornar uma abordagem aceita e estabelecida para melhorar e assegurar a resiliência de sistemas distribuídos. À medida que organizações pequenas e grandes começam a implementar a Engenharia de Caos como um processo operacional, estamos aprendendo como aplicar essas técnicas com segurança em escala. A abordagem definitivamente não é para todo mundo e, para ser efetiva e segura, requer suporte organizacional em escala. A aceitação por parte da indústria e a expertise disponível definitivamente aumentarão com a aparição de serviços comerciais, como Gremlin, e ferramentas de deployment, como Spinnaker, implementando algumas ferramentas de engenharia de caos.
In previous editions of the Radar, we've talked about using Chaos Monkey from Netflix to test how a running system is able to cope with outages in production by randomly disabling instances and measuring the results. Chaos Engineering is the nascent term for the wider application of this technique. By running experiments on distributed systems in production, we're able to build confidence that those systems work as expected under turbulent conditions. A good place to start understanding this technique is the Principles of Chaos Engineering website.
In previous editions of the Radar, we've talked about using Chaos Monkey from Netflix to test how a running system is able to cope with outages in production by randomly disabling instances and measuring the results. Chaos Engineering is the nascent term for the wider application of this technique. By running experiments on distributed systems in production, we're able to build confidence that those systems work as expected under turbulent conditions. A good place to start understanding this technique is the Principles of Chaos Engineering website.