Evernote 它是一个跨平台的软件,即服务应用程序,旨在帮助人们提高工作效率,使人们更容易在网络和移动设备上做笔记和管理信息。
如今,Evernote 超越世界 2.2 其中,亿用户 80% 美国以外的用户。因为这么多人依赖这个平台,Evernote 必须保证服务的高可用性——否则会有客户不满和取消订阅的风险。。
标题通过服务水平目标了解客户旅程
Evernote 的 SRE 经理 Garrett Plasky 站点可靠性工程师领导,devops 他们负责由工程师和系统管理员组成的团队 Evernote 健康的生产服务基础设施,最终保证客户满意度。
“2016 年,Evernote 开始对其托管基础设施进行重大改进,”Plasky 分享道。这次更新——将许多工作负荷转移到谷歌云平台——是努力使运营民主化的一部分,使工程师能够快速移动、迭代和建立服务。
然而,随着敏捷性的提高,责任也增加了。Evernote 工程师不仅负责服务建设,还负责生产中的维护。为了有效地做到这一点,他们需要跟踪关键的绩效指标 (KPI),这可以帮助他们在基础设施出现问题时如何维护服务水平目标 (SLO) 做出明智的决定。
这些都是我们正在监控和提醒更多的事情类型——完整的用户旅程,也就是我们用户关心的事情。Plasky 解释说:例如,打开、创建和同步笔记需要多长时间?我们正在重新定义我们思考重要事项的方式,从顶部向下看,而不是从底部向上看。
为了提高工程师的能力,提高未来的响应性,标题开发洞察力
从客户的角度来看 SLO 还为 Plasky 团队提供洞察力,使他们能够对复杂的应用环境做出明智、实时的决策。Evernote 工程师负责维护他们创建的服务,并有权确定给定的警报是否严重到值得采取行动。PagerDuty 帮助提供必要的数据 Plasky 该团队决定了每个事件的相关性,使工程师能够更有效地工作,并保持最终用户的高服务可用性。
此外,使用 PagerDuty 的功能还使 Plasky 他的同事可以进行有洞察力和简化的事后分析。作为一个运营组织,我们面临的挑战之一是继续我们成熟和全面的事件响应过程,但我们也应该平衡这一点,因为我们不想花两个人整理一份事后报告或三个小时的会议来讨论一个问题。 事后自动报告,PagerDuty 帮助团队应对这一挑战。
“我们有不同的数据和警报来源。但让它们全部通过 PagerDuty收集是有价值的,因为它让我们很容易看到发生了什么,出了什么问题,什么时候发生。 – Garrett Plasky ,Evernote 的 SRE 经理
标题Evernote 和 PagerDuty:共同成长
随着 Evernote 不断发展,PagerDuty 就在它身边。当 Plasky 于 2012 年加入 Evernote 公司只会 PagerDuty 用于报警和通知。现在,他的团队仍在使用它 PagerDuty 来安排 on-call 利用了解生产问题,轮换并利用该平台的高级分析功能为其提供单一的事实来源。
Evernote 计划明年增加微服务的使用,公司将增加更多的产品工程团队作为 PagerDuty 这样,他们就可以将服务移交给用户 Plasky 团队负责运营自己的服务。额外的 PagerDuty功能和集成在未来计划中也占有重要地位,特别是可用的事后分析模板和响应播放,因此 Evernote 事件响应过程可以继续自动化和改进。
我们有不同的数据和报警来源。 PagerDuty 把它们都集中起来是有价值的,因为它让我们很容易看到发生了什么,出了什么问题,什么时候出错,Plasky 分享道。“PagerDuty 在关键故障时唤醒我们的东西,这对客户满意至关重要。