0

0

将十六进制文本转换为指定 JSON 格式的教程

DDD

DDD

发布时间:2025-09-04 18:45:46

|

695人浏览过

|

来源于php中文网

原创

将十六进制文本转换为指定 json 格式的教程

本文档旨在指导开发者如何使用 Python 将包含十六进制数据的文本文件转换为特定格式的 JSON 文件。该过程涉及读取文本文件,解析十六进制数据,将其转换为十进制,并最终以指定的 JSON 结构输出。通过本文,你将学习如何使用正则表达式提取数据,以及如何构建符合要求的 JSON 结构。

1. 理解输入数据格式

首先,我们需要理解输入的十六进制文本文件的格式。从示例数据来看,文件包含多个数据块,每个数据块的格式如下:

(ABC 01) Part: 1
00, 0a, 00, 0c

其中,(ABC 01) Part: 1 包含 ABC 编号、Part 编号(即 Section),以及实际的十六进制数据 00, 0a, 00, 0c。我们的目标是从这些数据块中提取信息,并将其转换为 JSON 格式。

2. 使用正则表达式解析文本

Python 的 re 模块非常适合用于解析这种结构化的文本数据。我们可以使用正则表达式来提取 ABC 编号、Section 编号和十六进制数据。

import json
import re

text = """
(ABC 01) Part: 1
00, 0a, 00, 0c

(ABC 01) Part: 2
02, fd, 01, 5e

(ABC 01) Part: 3

(ABC 05) Part: 4
00, 0a, 00, 0c
"""

pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)"
pat_hex = r"[\da-fA-F]+"

data = []
for name, n, section, group in re.findall(pat_groups, text, flags=re.S | re.M):
    data.append(
        {
            name: int(n),
            "Section": section,
            "Data": list(map(lambda i: int(i, 16), re.findall(pat_hex, group))),
        }
    )

json_string = json.dumps(data, indent=4)
print(json_string)

代码解释:

SlidesAI
SlidesAI

使用SlidesAI的AI在几秒钟内创建演示文稿幻灯片

下载
  • pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)": 这个正则表达式用于匹配整个数据块。
    • ^\(: 匹配行首的 ( 字符。
    • (\S+): 匹配 ABC 标识符(非空白字符),并将其捕获到第一个分组。
    • (\d+): 匹配 ABC 编号(数字),并将其捕获到第二个分组。
    • \) Part:: 匹配 ) Part: 字符串。
    • (\d+): 匹配 Section 编号(数字),并将其捕获到第三个分组。
    • \s*: 匹配零个或多个空白字符。
    • (.*?): 匹配数据部分(任意字符,非贪婪模式),并将其捕获到第四个分组。
    • (?=^\(|\Z): 正向预查,确保匹配的数据块后面要么是另一个数据块的开始 (^\(),要么是字符串的结尾 (\Z)。
  • pat_hex = r"[\da-fA-F]+": 这个正则表达式用于匹配十六进制数据。
    • [\da-fA-F]+: 匹配一个或多个十六进制字符(数字 0-9 和字母 a-f,不区分大小写)。
  • re.findall(pat_groups, text, flags=re.S | re.M): 使用 re.findall 函数查找所有匹配的数据块。re.S 标志使 . 可以匹配换行符,re.M 标志使 ^ 和 $ 可以匹配每行的开头和结尾。
  • list(map(lambda i: int(i, 16), re.findall(pat_hex, group))): 对于每个数据块,使用 re.findall 函数查找所有十六进制数据,并使用 map 函数将其转换为十进制整数。int(i, 16) 将十六进制字符串 i 转换为十进制整数。
  • json.dumps(data, indent=4): 将 Python 列表 data 转换为 JSON 字符串,并使用 indent=4 参数进行格式化,使其更易于阅读。

3. 代码优化与改进

上面的代码提供了一个基本框架,可以根据实际需求进行优化和改进。

  • 文件读取: 可以将硬编码的字符串 text 替换为从文件中读取数据。
  • 错误处理: 可以添加错误处理机制,例如,当无法将十六进制字符串转换为十进制整数时,记录错误信息。
  • 数据验证: 可以添加数据验证步骤,例如,检查 ABC 编号和 Section 编号是否为有效值。

4. 完整示例代码

以下是一个完整的示例代码,演示了如何从文件中读取数据,并将其转换为 JSON 格式。

import json
import re

def hex_to_json(input_file, json_output_file):
    try:
        with open(input_file, 'r') as f:
            text = f.read()

        pat_groups = r"^\((\S+) (\d+)\) Part: (\d+)\s*(.*?)(?=^\(|\Z)"
        pat_hex = r"[\da-fA-F]+"

        data = []
        for name, n, section, group in re.findall(pat_groups, text, flags=re.S | re.M):
            try:
                hex_values = re.findall(pat_hex, group)
                decimal_values = [int(i, 16) for i in hex_values]
                data.append(
                    {
                        name: int(n),
                        "Section": section,
                        "Data": decimal_values,
                    }
                )
            except ValueError as e:
                print(f"Error converting hex to decimal: {e}")
                continue # Skip this entry if conversion fails

        with open(json_output_file, 'w') as outfile:
            json.dump(data, outfile, indent=4)

        print(f"Conversion complete. Output saved to {json_output_file}")

    except FileNotFoundError:
        print(f"Error: Input file '{input_file}' not found.")
    except Exception as e:
        print(f"An unexpected error occurred: {e}")


# Example usage
input_file = 'hex.txt'  # Replace with your input file name
json_output_file = 'output.json' # Replace with your desired output file name
hex_to_json(input_file, json_output_file)

注意事项:

  • 确保输入文件存在,并且格式正确。
  • 根据实际需求调整正则表达式,以匹配不同的数据格式。
  • 添加适当的错误处理机制,以处理意外情况。
  • 可以根据需要自定义 JSON 数据的结构。

5. 总结

本教程介绍了如何使用 Python 将包含十六进制数据的文本文件转换为特定格式的 JSON 文件。通过使用正则表达式解析文本数据,并将其转换为十进制整数,我们可以轻松地构建符合要求的 JSON 结构。希望本教程能够帮助你解决类似的问题。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

418

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

535

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

512

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

251

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

745

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

214

2023.08.11

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号