0

0

Python数位DP教程:解决大范围数位和计数问题

DDD

DDD

发布时间:2025-11-21 15:42:07

|

719人浏览过

|

来源于php中文网

原创

Python数位DP教程:解决大范围数位和计数问题

本文介绍了如何使用数位动态规划(digit dp)高效解决在大数值范围(n可达10^12)内,统计数位和小于等于给定值x的整数数量的问题。针对传统遍历方法的低效性,文章详细阐述了基于递归与记忆化搜索的数位dp算法原理,并通过具体示例和python代码,指导读者实现一个高性能的解决方案,适用于处理大规模数据场景下的数位条件计数挑战。

问题概述

计算机科学中,我们经常会遇到需要统计满足特定条件的数字数量的问题。一个常见的挑战是,在给定一个大范围 [1, n] 和一个上限 x 的情况下,计算所有整数 i (其中 1 <= i <= n) 满足其各位数字之和(数位和)小于或等于 x 的数量。这里的 n 可以是一个非常大的数,例如 10^12。

传统方法的局限性

一个直观的解决方案是遍历从 1 到 n 的每一个数字,计算其数位和,然后判断是否满足条件。示例如下:

def digitsums_lower_than_x_naive(x, n):
    digit_sum = lambda y: sum(int(digit) for digit in str(y))
    # 题目要求1到n,这里+1是为了包含0,因为数位DP通常从0开始计数
    # 实际应用中,如果题目要求1到n,需要对0进行特殊处理或减去DS(x, 0)
    return sum(1 for i in range(1, n + 1) if digit_sum(i) <= x) + 1

尽管此函数对于小范围的 n 能给出正确结果,但其时间复杂度为 O(n * log(n))(log(n) 是计算数位和的时间),对于 n 达到 10^12 这样的量级,这种方法将极其低效,无法在实际应用中接受。我们需要一种更高效的算法。

核心算法:数位动态规划(Digit DP)

为了解决大范围内的数位和计数问题,我们通常采用数位动态规划(Digit DP)的方法。数位DP的核心思想是将一个大数的计数问题分解为子问题,通过递归地处理数字的每一位,并利用记忆化搜索(memoization)避免重复计算。

立即学习Python免费学习笔记(深入)”;

基本思想

数位DP通过从最高位到最低位逐位构建数字来计数。在构建过程中,我们维护当前已构建部分的数位和,以及一个标志位来指示当前数字是否仍然受原始上限 n 的限制(即是否为“紧”状态)。

对于本问题,我们可以定义一个函数 DS(max_digit_sum, upper_bound_num),它返回在范围 [0, upper_bound_num] 中,数位和小于等于 max_digit_sum 的整数数量。

递归关系与状态定义

考虑计算 DS(max_s, N),其中 max_s 是允许的最大数位和,N 是一个字符串形式的上限数字。

我们可以将 N 拆解为最高位 D 和剩余部分 N'。例如,如果 N = 112,则 D = 1,N' = 12。

为了计算 DS(max_s, N),我们可以考虑所有可能的最高位 d:

  1. 当 d < D 时:当前数字的最高位小于 N 的最高位。这意味着从当前位开始,后续的数字位可以自由选择从 0 到 9,直到数字的末尾。此时,问题转化为计算一个长度比 N 少一位的“全9”数字(例如 99...9)的数位和计数,且允许的最大数位和为 max_s - d。
  2. 当 d == D 时:当前数字的最高位等于 N 的最高位。这意味着后续的数字位仍然受到 N 的剩余部分 N' 的限制。此时,问题转化为计算 DS(max_s - d, N')。

通过这种方式,DS(max_s, N) 可以分解为多个子问题的和。

示例解析:DS(5, 112)

我们以 DS(5, 112) 为例,来演示数位DP的分解过程。这里 max_s = 5,N = "112"。

  1. DS(5, "112")

    • N 的最高位 D = 1。

    • 遍历可能的最高位 d 从 0 到 min(max_s, D),即 0 到 1。

    • 当 d = 0 时

      • 当前最高位 0 小于 N 的最高位 1。
      • 问题转化为计算一个两位数(99)的数位和计数,最大数位和为 5 - 0 = 5。即 DS(5, "99")。
    • 当 d = 1 时

      社研通
      社研通

      文科研究生的学术加速器

      下载
      • 当前最高位 1 等于 N 的最高位 1。
      • 问题转化为计算 N 的剩余部分 "12" 的数位和计数,最大数位和为 5 - 1 = 4。即 DS(4, "12")。

    所以,DS(5, "112") = DS(5, "99") + DS(4, "12")。

  2. 计算 DS(5, "99")

    • N = "99",最高位 D = 9。
    • 遍历可能的最高位 d 从 0 到 min(5, 9),即 0 到 5。
    • 对于每个 d (从 0 到 5),由于 d < 9,问题都转化为计算一个一位数(9)的数位和计数,最大数位和为 5 - d。
    • DS(5, "99") = DS(5, "9") + DS(4, "9") + DS(3, "9") + DS(2, "9") + DS(1, "9") + DS(0, "9")。
  3. 计算 DS(max_s', "9") (一位数的情况,这是递归的基线条件):

    • 对于一位数 N = "9",其最高位 D = 9。
    • 遍历可能的最高位 d 从 0 到 min(max_s', 9)。
    • 对于每个 d,由于 d < 9,问题转化为计算一个零位数(空字符串)的数位和计数。通常,这表示计数为 1(代表一个有效的数字)。
    • 实际上,对于 DS(max_s', "9"),我们可以直接计算:d 可以取 0, 1, ..., min(max_s', 9)。所以结果就是 min(max_s', 9) + 1。
      • DS(5, "9") = min(5, 9) + 1 = 5 + 1 = 6 (数字 0, 1, 2, 3, 4, 5 的数位和都 <= 5)
      • DS(4, "9") = min(4, 9) + 1 = 4 + 1 = 5
      • DS(3, "9") = min(3, 9) + 1 = 3 + 1 = 4
      • DS(2, "9") = min(2, 9) + 1 = 2 + 1 = 3
      • DS(1, "9") = min(1, 9) + 1 = 1 + 1 = 2
      • DS(0, "9") = min(0, 9) + 1 = 0 + 1 = 1

    所以,DS(5, "99") = 6 + 5 + 4 + 3 + 2 + 1 = 21。

  4. 计算 DS(4, "12")

    • N = "12",最高位 D = 1。

    • 遍历可能的最高位 d 从 0 到 min(4, 1),即 0 到 1。

    • 当 d = 0 时

      • 当前最高位 0 小于 N 的最高位 1。
      • 问题转化为计算一个一位数(9)的数位和计数,最大数位和为 4 - 0 = 4。即 DS(4, "9")。
      • 我们已经知道 DS(4, "9") = 5。
    • 当 d = 1 时

      • 当前最高位 1 等于 N 的最高位 1。
      • 问题转化为计算 N 的剩余部分 "2" 的数位和计数,最大数位和为 4 - 1 = 3。即 DS(3, "2")。

    所以,DS(4, "12") = DS(4, "9") + DS(3, "2") = 5 + DS(3, "2")。

  5. 计算 DS(3, "2") (一位数的情况):

    • N = "2",最高位 D = 2。
    • 遍历可能的最高位 d 从 0 到 min(3, 2),即 0 到 2。
    • DS(3, "2") = DS(3-0, "") + DS(3-1, "") + DS(3-2, "")
    • 对于一位数 N = "2",d 可以取 0, 1, 2。
    • DS(3, "2") = min(3, int("2")) + 1 = 2 + 1 = 3 (数字 0, 1, 2 的数位和都 <= 3)。

    所以,DS(4, "12") = 5 + 3 = 8。

最终结果:DS(5, "112") = DS(5, "99") + DS(4, "12") = 21 + 8 = 29。

记忆化搜索的重要性

在上述递归过程中,我们可以看到像 DS(4, "9") 这样的子问题会被多次计算。为了避免重复计算,我们使用一个缓存(cache 或 memo)来存储已经计算过的状态的结果。当需要计算某个状态时,首先检查缓存;如果已存在,则直接返回;否则,计算并存储结果。这正是动态规划的核心思想之一。

Python实现

下面是基于上述数位DP思想的Python实现。

def count_digit_sums_up_to_x(n_str, x, cache):
    """
    计算在字符串表示的数字 n_str 范围内(从0到n_str),
    数位和小于等于 x 的整数数量。

    参数:
        n_str (str): 表示上限数字的字符串。
        x (int): 允许的最大数位和。
        cache (dict): 用于存储已计算状态的记忆化字典。
                      键为 (n_str, x),值为对应的计数。

    返回:
        int: 满足条件的整数数量。
    """

    # 基线条件:如果 n_str 只有一个数字
    if len(n_str) == 1:
        # 考虑从0到该数字的所有整数。
        # 例如,n_str="5", x=3,则数字可以是0,1,2,3,共4个。
        # 它们的数位和都小于等于3。
        # 但如果 x=0, n_str="5",则只有数字0满足,共1个。
        # 所以是 min(x, int(n_str[0])) + 1
        return min(x, int(n_str[0])) + 1

    # 检查缓存
    if (n_str, x) in cache:
        return cache[(n_str, x)]

    # 获取当前数字的最高位
    top_digit = int(n_str[0])

    # 构建一个与 n_str 长度相同但除最高位外全为9的字符串,
    # 用于处理当前位小于 top_digit 的情况
    nines_suffix = '9' * (len(n_str) - 1)

    current_count = 0
    # 遍历当前位可能的数字 d
    # d 的范围是从 0 到 min(x, top_digit)
    for d in range(min(x, top_digit) + 1):
        if d < top_digit:
            # 情况1: 当前位 d 小于 top_digit
            # 此时,后续位可以取 0-9,形成一个长度为 len(n_str)-1 的“全9”数。
            # 剩余的数位和上限为 x - d。
            current_count += count_digit_sums_up_to_x(nines_suffix, x - d, cache)
        else: # d == top_digit
            # 情况2: 当前位 d 等于 top_digit
            # 此时,后续位仍然受 n_str 剩余部分的限制。
            # 剩余的数位和上限为 x - d。
            current_count += count_digit_sums_up_to_x(n_str[1:], x - d, cache)

    # 将结果存入缓存
    cache[(n_str, x)] = current_count
    return current_count

def solve(n, x):
    """
    主函数,调用数位DP函数并处理输入。

    参数:
        n (int): 范围上限,例如 112。
        x (int): 允许的最大数位和,例如 5。

    返回:
        int: 在 [0, n] 范围内数位和小于等于 x 的整数数量。
    """
    n_str = str(n)
    return count_digit_sums_up_to_x(n_str, x, {})

# 示例测试
print(f"DS(112, 5) = {solve(112, 5)}") # 预期输出 29

代码解析

  1. count_digit_sums_up_to_x(n_str, x, cache) 函数
    • n_str:当前要处理的数字上限,以字符串形式传入,方便逐位操作。
    • x:当前允许的剩余最大数位和。
    • cache:一个字典,用于存储 (n_str, x) 状态的计算结果,实现记忆化。
  2. 基线条件 if len(n_str) == 1:
    • 当 n_str 只剩一位时(例如 "5"),表示我们正在计算个位数。
    • 结果是 min(x, int(n_str[0])) + 1。这表示从 0 到 min(x, n_str[0]) 的所有数字都满足条件。例如,如果 n_str="5", x=3,那么 0, 1, 2, 3 这四个数字的数位和都小于等于3,且它们都小于等于5。
  3. 记忆化 if (n_str, x) in cache:
    • 在每次递归调用前,检查当前状态 (n_str, x) 是否已在缓存中。如果存在,直接返回缓存结果,避免重复计算。
  4. 循环 for d in range(min(x, top_digit) + 1):
    • top_digit 是 n_str 的当前最高位。
    • d 遍历当前位可以放置的数字。d 的上限是 top_digit(因为不能超过 n_str 的限制),同时也不能超过剩余允许的最大数位和 x。所以 d 的取值范围是 0 到 min(x, top_digit)。
  5. 递归调用
    • d < top_digit:当前位 d 小于 n_str 的最高位。这意味着后续的位可以自由选择 0-9。因此,我们递归调用 count_digit_sums_up_to_x,将 n_str 的剩余部分替换为一个由 len(n_str) - 1 个 9 组成的全9字符串(nines_suffix),并更新剩余数位和为 x - d。
    • d == top_digit:当前位 d 等于 n_str 的最高位。这意味着后续的位仍然受到 n_str 剩余部分的限制。因此,我们递归调用 count_digit_sums_up_to_x,传入 n_str[1:](n_str 的剩余部分),并更新剩余数位和为 x - d。
  6. cache[(n_str, x)] = current_count
    • 在所有子问题计算完毕并累加到 current_count 后,将结果存入缓存。

复杂度分析

  • 状态数量:n_str 的长度最多为 log10(N) (对于 N=10^12,长度约为 13)。x 的最大值对于 N=10^12,最大数位和为 9 * 12 = 108。因此,状态数量大约是 log10(N) * X。
  • 每个状态的计算:在一个状态中,循环 d 的次数最多为 10 次(从 0 到 9)。每次循环都是一次递归调用或简单的加法。
  • 总时间复杂度:O(log10(N) * X * 10),可以简化为 O(log10(N) * X)。
    • 对于 N=10^12 (约13位),X=108:13 * 108 * 10 约为 14040 次操作。这相比于 10^12 次

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1570

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

1249

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

1206

2024.04.29

go语言字符串相关教程
go语言字符串相关教程

本专题整合了go语言字符串相关教程,阅读专题下面的文章了解更多详细内容。

194

2025.07.29

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

4

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号