0

0

如何用 Python 脚本高效解析专有配置文件并导出为 CSV

花韻仙語

花韻仙語

发布时间:2026-03-06 12:25:14

|

404人浏览过

|

来源于php中文网

原创

如何用 Python 脚本高效解析专有配置文件并导出为 CSV

本文提供一个轻量、可靠且可定期自动执行的 python 解决方案,用于从结构松散的专有文本配置文件中提取关键字段(首标识符 + cycles 值),跳过注释与无 cycles 条目,最终生成标准 csv 文件,适配 power bi、power apps 及 sharepoint 数据集成需求。

本文提供一个轻量、可靠且可定期自动执行的 python 解决方案,用于从结构松散的专有文本配置文件中提取关键字段(首标识符 + cycles 值),跳过注释与无 cycles 条目,最终生成标准 csv 文件,适配 power bi、power apps 及 sharepoint 数据集成需求。

在您的实际工作场景中(Windows 10 锁定环境、已安装 Visual Studio 2022 含 Python 支持、无 Java/额外工具权限),Python 是最务实的选择:它无需管理员权限即可运行,语法简洁,且原生支持 CSV 和正则处理,完美契合您对“可重复、可调度、免安装”的核心诉求。

以下是一个健壮、生产就绪的 Python 脚本,已针对您提供的 ptube 类配置格式优化:

import csv
import re

def parse_config_to_csv(input_path: str, output_path: str):
    rows = []
    current_item = None

    with open(input_path, 'r', encoding='utf-8') as f:
        for line in f:
            line = line.strip()
            # 忽略空行和注释行(以 // 开头)
            if not line or line.startswith('//'):
                continue

            # 匹配 "ItemName {" 格式(支持含空格或特殊字符的名称,但此处按常规命名假设)
            if line.endswith('{'):
                # 提取左花括号前的首个非空单词(即 item 名称)
                match = re.match(r'^(\S+?)\s*\{', line)
                if match:
                    current_item = match.group(1)
                else:
                    current_item = None  # 安全兜底
                continue

            # 查找 cycles=xxx; 行(允许前后空格、分号可选)
            if current_item and 'cycles=' in line:
                # 使用正则精准提取等号后、分号(如有)前的数值(支持整数/可能含空格)
                cycle_match = re.search(r'cycles\s*=\s*(\d+)\s*;?', line)
                if cycle_match:
                    cycles_value = cycle_match.group(1)
                    rows.append([current_item, cycles_value])
                    current_item = None  # 防止同一 item 多次匹配 cycles(虽规范中应唯一)

    # 写入 CSV(UTF-8-BOM 确保 Excel 正确识别中文/特殊字符)
    with open(output_path, 'w', newline='', encoding='utf-8-sig') as f:
        writer = csv.writer(f)
        writer.writerow(['Item', 'Cycles'])  # 添加表头,提升可读性与 Power BI 兼容性
        writer.writerows(rows)

# ✅ 使用示例(请替换为您的实际路径)
if __name__ == '__main__':
    parse_config_to_csv('config.txt', 'output.csv')

脚本优势说明

  • 精准识别结构:使用 re.match(r'^(\S+?)\s*\{', line) 安全提取 item 名,避免 split()[0] 在含空格别名时出错;
  • 鲁棒性增强:显式跳过注释与空行;正则 cycles\s*=\s*(\d+)\s*;? 可匹配 cycles= 2693452; 或 cycles=577754 等变体;
  • 防重机制:匹配到 cycles 后立即清空 current_item,确保每个 item 最多输出一行(符合业务逻辑);
  • 生产友好:添加 CSV 表头、UTF-8-BOM 编码(Excel 默认识别)、清晰函数封装,便于后续集成进 Power Automate(通过“运行 PowerShell 脚本”调用 python script.py)或定时任务。

⚠️ 重要注意事项

海绵音乐
海绵音乐

字节跳动推出的AI音乐生成工具

下载

立即学习Python免费学习笔记(深入)”;

  • 将原始配置文件保存为 config.txt(UTF-8 编码),并确保路径不含中文或特殊符号(或使用绝对路径);
  • 若实际文件中 item 名含空格(如 "Blower 100"),需调整正则为 r'^"([^"]+)"\s*\{' 或 r"^([^{\n]+?)\s*\{",我们可为您定制;
  • 对于 48K 行大文件,本脚本内存占用极低(单行处理),通常在 1 秒内完成;
  • 首次运行后,您可将 .py 文件与 .txt 输入文件放入同一文件夹,双击运行,或通过 Windows 任务计划程序每日自动执行。

该方案已验证通过您提供的样例数据,输出严格符合预期:

Item,Cycles
Blower100,2693452
TU110,577754

您可立即将生成的 output.csv 直接导入 Power BI(“获取数据 → 文本/CSV”),或上传至 SharePoint 文档库后通过 Power Apps 的 CSV 连接器读取——整个链路零第三方依赖,完全符合企业安全策略。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

207

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

313

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

290

2025.06.11

c++标识符介绍
c++标识符介绍

本专题整合了c++标识符相关内容,阅读专题下面的文章了解更多详细内容。

174

2025.08.07

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1408

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1161

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

832

2023.08.01

windows查看端口被占用的情况
windows查看端口被占用的情况

windows查看端口被占用的情况的方法:1、使用Windows自带的资源监视器;2、使用命令提示符查看端口信息;3、使用任务管理器查看占用端口的进程。本专题为大家提供windows查看端口被占用的情况的相关的文章、下载、课程内容,供大家免费下载体验。

461

2023.08.02

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

19

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.8万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号