0

0

如何正确从金字塔结构中提取每行末尾单词

花韻仙語

花韻仙語

发布时间:2026-02-17 19:55:01

|

832人浏览过

|

来源于php中文网

原创

如何正确从金字塔结构中提取每行末尾单词

本文详解python中构建数字金字塔并准确提取每行末尾单词的完整实现,纠正常见索引逻辑错误,提供健壮、可复用的解决方案。

本文详解python中构建数字金字塔并准确提取每行末尾单词的完整实现,纠正常见索引逻辑错误,提供健壮、可复用的解决方案。

在处理类似“编号+单词”格式的文本(如 3 select\n2 paragraph\n5 always...)时,目标是将其按编号升序排序后,按三角形/金字塔层级(第1层1个元素、第2层2个、第3层3个……)组织,并提取每一层最后一个单词——而非每层第一个或任意错位元素。原始代码失败的根本原因在于:它错误地将“行号”(level)与“编号值”(number)混为一谈,并用 current_number += level 动态生成期望编号,导致无法匹配真实数据中的编号分布;同时,pyramid 构建方式未体现真正的金字塔结构,而是按编号逐个收集,破坏了层级语义。

正确的解法应分三步:解析映射 → 排序对齐 → 定位三角形边界。以下是优化后的专业实现:

def unscramble_and_extract_pyramid_words(file_path):
    """
    从文件读取编号-单词对,构建金字塔并返回每层末尾单词序列
    文件格式示例:'3 select\n2 paragraph\n5 always\n6 poem\n1 chick\n4 planet'
    """
    try:
        with open(file_path, 'r', encoding='utf-8') as f:
            lines = [line.strip() for line in f if line.strip()]

        # 步骤1:解析为 {编号: 单词} 映射,并提取所有编号
        num_word_map = {}
        numbers = []
        for line in lines:
            parts = line.split(maxsplit=1)  # 仅分割一次,避免单词含空格出错
            if len(parts) < 2:
                raise ValueError(f"Invalid line format: '{line}'")
            num = int(parts[0])
            word = parts[1].strip()
            num_word_map[num] = word
            numbers.append(num)

        if not num_word_map:
            return ""

        # 步骤2:按编号升序排列单词列表(确保索引0对应最小编号)
        max_num = max(numbers)
        sorted_words = [num_word_map.get(i, "") for i in range(1, max_num + 1)]

        # 步骤3:计算三角形第n层末尾位置(即前n层总元素数)→ 即第n层最后一个元素索引(0-based)
        # 第1层末尾索引 = 1-1 = 0;第2层末尾索引 = (1+2)-1 = 2;第3层 = (1+2+3)-1 = 5...
        def triangular_sum(n):
            return n * (n + 1) // 2

        result_words = []
        layer = 1
        while True:
            last_index_in_layer = triangular_sum(layer) - 1  # 0-based index
            if last_index_in_layer >= len(sorted_words):
                break
            if sorted_words[last_index_in_layer]:  # 避免空字符串
                result_words.append(sorted_words[last_index_in_layer])
            layer += 1

        return " ".join(result_words)

    except FileNotFoundError:
        return "Error: File not found."
    except ValueError as e:
        return f"Error: {e}"
    except Exception as e:
        return f"Unexpected error: {e}"

# 示例调用(假设 text_file.txt 内容为题目所给)
# print(unscramble_and_extract_pyramid_words("text_file.txt"))

关键修正说明:

Img.Upscaler
Img.Upscaler

免费的AI图片放大工具

下载
  • 精准映射解析:使用 split(maxsplit=1) 确保单词部分不被二次分割(如单词含空格也能保留);显式构建 num_word_map 避免重复解析。
  • 层级定位无误:利用三角形数公式 T(n) = n(n+1)/2 直接计算第 n 层末尾元素在全局有序列表中的0-based索引(如 T(1)-1=0, T(2)-1=2, T(3)-1=5),完全匹配金字塔结构:
    Level 1: [chick]              → index 0  
    Level 2: [paragraph, select]  → index 2 → "select"  
    Level 3: [planet, always, poem] → index 5 → "poem"  
  • 健壮性增强:异常分级处理(文件、格式、运行时);跳过空行;自动终止超出范围的层级遍历。

注意事项:

  • 输入文件中编号必须为连续正整数(1, 2, 3,...),否则金字塔结构不成立;若存在缺失编号(如无4),需提前校验或填充占位符。
  • 本方案时间复杂度为 O(N),远优于原始代码中多次遍历列表的 O(N²) 操作。
  • 若需支持非连续编号的“稀疏金字塔”,应先重编号或使用动态层级划分算法——但此已超出题设场景。

运行示例输入,输出将严格为 chick select poem,完美符合预期。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

454

2023.08.14

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

462

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法
微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式,涵盖首页直达地址、账号登录流程与常见访问问题说明,帮助用户快速找到微博官网主页,实现便捷、安全的网页端登录与内容浏览体验。

135

2026.02.13

Flutter跨平台开发与状态管理实战
Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开,系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示,帮助开发者构建流畅、可维护的跨平台移动应用。

63

2026.02.13

TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

20

2026.02.13

Redis高可用架构与分布式缓存实战
Redis高可用架构与分布式缓存实战

本专题围绕 Redis 在高并发系统中的应用展开,系统讲解主从复制、哨兵机制、Cluster 集群模式及数据分片原理。内容涵盖缓存穿透与雪崩解决方案、分布式锁实现、热点数据优化及持久化策略。通过真实业务场景演示,帮助开发者构建高可用、可扩展的分布式缓存系统。

26

2026.02.13

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

29

2026.02.12

雨课堂网页版登录入口与使用指南_官方在线教学平台访问方法
雨课堂网页版登录入口与使用指南_官方在线教学平台访问方法

本专题系统整理雨课堂网页版官方入口及在线登录方式,涵盖账号登录流程、官方直连入口及平台访问方法说明,帮助师生用户快速进入雨课堂在线教学平台,实现便捷、高效的课程学习与教学管理体验。

14

2026.02.12

豆包AI网页版入口与智能创作指南_官方在线写作与图片生成使用方法
豆包AI网页版入口与智能创作指南_官方在线写作与图片生成使用方法

本专题汇总豆包AI官方网页版入口及在线使用方式,涵盖智能写作工具、图片生成体验入口和官网登录方法,帮助用户快速直达豆包AI平台,高效完成文本创作与AI生图任务,实现便捷智能创作体验。

523

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号