0

0

我的 HNG 之旅第六阶段:利用 Python 公开 DORA 指标

PHPz

PHPz

发布时间:2024-08-10 21:42:04

|

406人浏览过

|

来源于dev.to

转载

我的 hng 之旅第六阶段:利用 python 公开 dora 指标

介绍

对于第 6 阶段,我们的任务是公开 dora(devops 研究),我最近开始了一个使用 python 公开 dora(devops 研究和评估)指标的项目。这次经历教会了我关于 devops 实践以及与合作的复杂性的宝贵经验。在本文中,我将引导您完成整个过程,解释每个指标的含义,并强调一些需要注意的常见陷阱。

dora 指标是什么?
在深入研究代码之前,我们先简单讨论一下 dora 指标是什么:

  • 部署频率:组织成功发布到生产环境的频率。
  • 变更前置时间:提交到投入生产所需的时间。
  • 更改失败率:导致生产失败的部署百分比。
  • 恢复服务的时间:从生产故障中恢复需要多长时间。

这些指标帮助团队衡量他们的软件交付性能并确定需要改进的领域。

开始
要开始公开这些指标,您需要:

  • python 3.7 或更高版本
  • github 帐户和个人访问令牌
  • github api 的基础知识

首先,安装必要的库:

pip install requests prometheus_client

代码结构
我将 python 脚本构建为一个名为 dorametrics 的类。这是其初始化的简化版本:

class dorametrics:
    def __init__(self, github_token, repo_owner, repo_name):
        self.github_token = github_token
        self.repo_owner = repo_owner
        self.repo_name = repo_name
        self.base_url = f"https://api.github.com/repos/{repo_owner}/{repo_name}"
        self.headers = {
            'authorization': f'token {github_token}',
            'accept': 'application/vnd.github.v3+json'
        }

        # define prometheus metrics
        self.deployment_frequency = gauge('dora_deployment_frequency', 'deployment frequency (per day)')
        self.lead_time_for_changes = gauge('dora_lead_time_for_changes', 'lead time for changes (hours)')
        self.change_failure_rate = gauge('dora_change_failure_rate', 'change failure rate')
        self.time_to_restore_service = gauge('dora_time_to_restore_service', 'time to restore service (hours)')

此设置允许我们与 github api 交互并为每个 dora 指标创建 prometheus 指标。

从 github 获取数据
最具挑战性的方面之一是从 github 检索必要的数据。这是我获取部署的方式:

def get_deployments(self, days=30):
    end_date = datetime.now()
    start_date = end_date - timedelta(days=days)

    url = f"{self.base_url}/deployments"
    params = {'since': start_date.isoformat()}
    deployments = []

    while url:
        response = requests.get(url, headers=self.headers, params=params)
        response.raise_for_status()
        deployments.extend(response.json())
        url = response.links.get('next', {}).get('url')
        params = {} 

    return deployments

此方法处理分页,确保我们在指定的时间范围内获得所有部署。

Machine Translation
Machine Translation

聚合多个来源的AI翻译

下载

立即学习Python免费学习笔记(深入)”;

计算 dora 指标
让我们看看我是如何计算部署频率的:

def get_deployment_frequency(self, days=30):
    deployments = self.get_deployments(days)
    return len(deployments) / days

这个简单的计算为我们提供了指定时间段内每天的平均部署数量。

变更准备时间
计算变更的提前期更为复杂。它需要将提交与其相应的部署相关联:

def get_lead_time_for_changes(self, days=30):
    commits = self.get_commits(days)
    deployments = self.get_deployments(days)

    lead_times = []
    for commit in commits:
        commit_date = datetime.strptime(commit['commit']['author']['date'], '%y-%m-%dt%h:%m:%sz')
        for deployment in deployments:
            if deployment['sha'] == commit['sha']:
                deployment_date = datetime.strptime(deployment['created_at'], '%y-%m-%dt%h:%m:%sz')
                lead_time = (deployment_date - commit_date).total_seconds() / 3600  # in hours
                lead_times.append(lead_time)
                break

    return sum(lead_times) / len(lead_times) if lead_times else 0

该方法计算每次提交与其对应的部署之间的时间差。需要注意的是,并非所有提交都会导致部署,因此我们只考虑那些会导致部署的提交。最终结果是平均交货时间(以小时为单位)。
我在这里面临的一项挑战是将提交与部署相匹配。在某些情况下,部署可能包括多个提交,或者提交可能不会立即部署。我必须根据可用数据做出假设,这可能需要针对不同的开发工作流程进行调整。

改变失败率
确定变更失败率需要分析每个部署的状态:

def get_change_failure_rate(self, days=30):
    deployments = self.get_deployments(days)

    if not deployments:
        return 0

    total_deployments = len(deployments)
    failed_deployments = 0

    for deployment in deployments:
        status_url = deployment['statuses_url']
        status_response = requests.get(status_url, headers=self.headers)
        status_response.raise_for_status()
        statuses = status_response.json()

        if statuses and statuses[0]['state'] != 'success':
            failed_deployments += 1

    return failed_deployments / total_deployments if total_deployments > 0 else 0

此方法计算失败的部署数量,并将其除以部署总数。这里的挑战是定义什么构成“失败”的部署。如果最近的状态不是“成功”,我认为部署失败。
值得注意的是,这种方法可能无法捕获所有类型的故障,尤其是成功部署后发生的故障。在生产环境中,您可能希望与监控或事件管理系统集成,以实现更准确的故障检测。

使用 prometheus 公开指标
为了使这些指标可供 prometheus 抓取,我使用了 prometheus_client 库:

from prometheus_client import start_http_server, Gauge

# In the main execution block
start_http_server(8000)

# Update metrics every 5 minutes
while True:
    dora.update_metrics()
    time.sleep(300)

这会在端口 8000 上启动服务器并每 5 分钟更新一次指标。

常见陷阱
在这个项目中,我遇到了几个挑战:

  • api 速率限制:github 限制您可以发出的 api 请求数量。我必须实现分页并注意更新指标的频率。
  • 令牌权限:确保您的 github 令牌具有读取部署和提交的必要权限。
  • 数据解释:确定什么构成“部署”或“失败”可能是主观的。我必须根据现有数据做出假设。
  • 恢复服务的时间:这个指标特别具有挑战性,因为它通常需要来自事件管理系统的数据,而仅通过 github 的 api 无法获得这些数据。

结论
使用 python 公开 dora 指标是一次富有启发性的经历。它加深了我对 devops 实践的理解,并提高了我使用 api 和数据处理的技能。
请记住,这些指标旨在指导改进,而不是作为击败团队的棍子。明智地使用它们来培养开发过程中持续改进的文化。
感谢您的阅读❤

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

4480

2026.01.21

Docker容器化部署与DevOps实践
Docker容器化部署与DevOps实践

本专题面向后端与运维开发者,系统讲解 Docker 容器化技术在实际项目中的应用。内容涵盖 Docker 镜像构建、容器运行机制、Docker Compose 多服务编排,以及在 DevOps 流程中的持续集成与持续部署实践。通过真实场景演示,帮助开发者实现应用的快速部署、环境一致性与运维自动化。

42

2026.02.11

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

2

2026.03.16

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

90

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

136

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

380

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

64

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

111

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

113

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号