Flux - 看看 Netflix 如何观测系统实时流量变化

查看原文

Netflix 家观测他们复杂的微服务架构的方法是,引入一个自己撸出来的工具 Flux,方法是可视化观测流经系统的所有流量。他们的需求是:要看实时数据,数据主要是容量+延迟+请求的健康,能看到服务依赖,能在网络层看到流量,最好能钻到 IPC 级别查看流量。

一般来说,只要我们能把监控的东西转为报警或者阈值,那我们就能自动化。但对于那些实在说不清道不明的东西,只能引入人来分析,而可视化就是很好地工具:人脑最适合处理大量的视觉数据,并发的,多维的。

他们最终的呈现方案是一个图片,四个圈,分别代表互联网和三个数据中心;这四个圈互相发送光点代表发送流量。可以通过观察这些观点的数量和颜色(红色代表错误)来得出结论,一个数据中心是不是OK的。