0

0

站点可靠性工程师的深度工作

betcha

betcha

发布时间:2024-06-04 15:08:39

|

937人浏览过

|

来源于DZone

原创

深度工作是指在不受干扰的情况下专注于认知任务,例如自动化、提高可观察性、解决难题和流程改进。这对于提高工作意义感、促进心流状态和创造价值至关重要。对于 SRE(站点可靠性工程师)来说,自动化、建立即时访问系统、规划项目和划分时间段等策略可以帮助他们减少浅层工作,从而腾出更多时间进行深度工作。这些策略通过促进专注、减少随机性和提供学习时间,有助于创造一个有利于产生影响和工作满意度的环境。

站点可靠性工程师的深度工作

什么是深度工作?

我们先来看看什么是深度工作。深度工作的概念是由卡尔·纽波特在他的著作《深度工作:在分心的世界中专注成功的规则》中提出的。在书中,卡尔·纽波特将深度工作定义为不受干扰地专注于一项需要认知的任务。与深度工作相反的是浅层工作,卡尔·纽波特将其定义为可以在分心时完成的后勤类任务,例如易于复制的工作协调和沟通任务。 

深度工作为何重要?

首先,深度工作是有意义的,让人感到满足的。根据盖洛普最近的一项调查,美国员工敬业度创下了历史新低,原因是他们对组织的了解程度和满意度较低。深度工作可以帮助解决这个问题。

其次,深度工作可以为心流状态铺平道路。研究发现,心流状态可以带来幸福。  

最后,深度工作是有回报的。从事需要认知的工作会给团队和组织带来价值,而这反过来又会为从事深度工作的个人带来晋升和经济奖励。正如卡尔·纽波特所说,“深度生活才是美好的生活。”

现在,让我们看一下对 SRE 具有认知要求的一些活动、可以被视为浅层活动的活动,以及 SRE 团队可以采用的一些策略,以在 SRE 团队内部促进深度工作。

对于 SRE 来说,哪些任务需要较高的认知要求?

以下是 SRE 团队可以执行的一些认知要求高的任务,以对组织产生更大的影响:

1、自动化和构建服务:开发良好的自动化以消除繁琐工作、提高管理基础设施的效率并降低成本是一项需要认知的任务。为后端团队开发的代码库做出贡献对 SRE 来说也是一个很好的机会,并且是一项需要认知的任务。

2、提高可观察性:站点可靠性工程师的另一项认知要求高的任务是提高系统的可观察性。这可以通过设计和创建可用的仪表板、调整警报以提高信噪比、检测代码库以发出有用的指标等来实现。

3、调试和解决影响生产系统的难题:在时间压力下解决影响生产系统可用性的难题是另一项需要认知能力的任务。  

4、改进流程:改进变更管理流程、事件管理流程等流程以提高团队的整体效率,改进 SLO 可能是另一项需要认知能力的任务。

5、改进文档:编写好的文档可能会产生影响,但需要集中精力才能完成。好的文档包括可用的故障排除指南、标准操作程序、架构图等。

6、学习新的技术技能:持续学习是做好 SRE 工作的关键。学习新的技术技能并跟上生成式 AI 等最新技术趋势也需要一定的认知能力。

SRE 在进行深度工作时面临哪些挑战?

以下是 SRE 在运营业务时需要执行的一些浅显任务,这些任务使他们很难进行深度工作:

1. 部署和升级

这些是业务必不可少的活动,但本质上往往是重复性的。根据团队内部的自动化水平,SRE 会花费一些时间在这些活动上。

2. 回答其他工程师的问题

通过来自其他团队的随机问题对 SRE 团队成员进行随机化可能会有所帮助,因为 SRE 团队往往对生产系统和基础设施有更深入的了解。

3. 生产访问请求

在许多团队中,只有 SRE 团队才能访问生产系统,以维护生产环境的稳定性。后端工程和数据工程团队等团队成员可能会中断 SRE 以从生产系统获取信息,用于各种目的,例如调试问题等。

4. 由于值班和生产问题而导致的随机化

SRE 往往对生产系统有全面的了解,即使 SRE 不在值班轮岗中,也经常会被拖入各种值班问题中。这会占用他们处理重要项目的时间。

BiLin AI
BiLin AI

免费的多语言AI搜索引擎

下载

5. 会议

开会会产生很多开销。对于 SRE 角色来说,有时很多人会加入试图解决问题的电话会议,这些电话会议往往会很长,很多工程师在很长一段时间内只是充当旁观者。

6. 回复电子邮件并回复团队/Slack 聊天

这是知识经济中大多数工作人员的常见活动,SRE 也不能幸免。回复电子邮件和聊天会不断打乱 SRE 的时间,并分散他们对重要工作的注意力。

SRE 可以采用哪些策略来促进深度工作?

现在让我们看一下 SRE 团队可以采用的一些策略,以最大限度地减少花在浅层工作上的时间并将这些时间花在深度工作上:

1.投资自动化

SRE 团队应优先投入时间进行自动化,以消除繁琐的工作并减轻部署、升级等各种活动的运营负担。创建具有内置自动验证的强大持续集成和持续部署管道将减少在这些活动上花费的时间。目标应该是为开发团队提供必要的工具,以便他们能够通过升级和部署进行自助服务。SRE 团队管理层应规划项目,以便为此类项目分配适当的资源。

2. 建立即时访问系统

具有适当审计跟踪和批准流程的即时访问系统可以帮助 SRE 团队以外的人员获得对生产环境的适当访问权限,从而帮助 SRE 团队不必花时间为其他人提供影子访问权限,而可以专注于深度工作。

3. 积极规划项目

SRE 团队可以实施适当的项目管理来优先执行重要工作,例如提高关键生产服务的可观察性。

4. 与研发和后端工程团队共享待命负载

与后端工程团队共享值班负载,同时让 SRE 团队专注于改进工具和文档,并培训其他人如何有效地处理值班问题也会有所帮助。

5. 遵循高效的值班轮换和事件管理流程

按照高效的值班轮换制,即当周只有负责值班的工程师处理大部分值班问题,这样其他工程师就可以专注于专门的项目,并使团队的其他成员能够进行深度工作。拥有清晰易懂的故障排除指南将有助于实现这一目的。

6. 划分时间段,专注于重要项目

从个人层面来说,SRE 团队的各成员可以在日历上留出时间专注于重要项目,以避免随机化。  

7. 提供持续学习的时间和资源

为 SRE 团队成员提供学习和探索新技术的时间,以及实施这些技术来解决可靠性问题的自由,这是促进学习的好方法。此外,提供在线学习服务和书籍订阅也是一个好主意。

8. 允许 SRE 从事他们选择的项目

允许 SRE 团队成员从事他们选择的项目将是鼓励他们进行深度工作的好方法。例如,编写最终用户使用的功能、试验新技术以及在不同的团队中工作都是实现这一想法的一些方法。众所周知,谷歌允许所有员工将 20% 的时间花在他们选择的项目上。实施这样的政策将是鼓励深度工作的好方法。 

结论

通过遵循本文讨论的策略,站点可靠性工程师可以致力于进行深度工作并获得快乐、满意和有意义的工作,同时对组织产生更大的影响。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
PHP 命令行脚本与自动化任务开发
PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境(CLI)下的开发与应用,内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理,以及与 Linux 定时任务(Cron)的结合使用。通过实战示例,帮助开发者掌握使用 PHP 构建 自动化脚本、批处理工具与后台任务程序 的能力。

67

2025.12.13

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

88

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

273

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

618

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.7万人学习

布尔教育设计模式视频教程
布尔教育设计模式视频教程

共10课时 | 2.6万人学习

设计模式
设计模式

共36课时 | 34.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号