0

0

Java字符串压缩算法优化:处理末尾字符序列的策略

花韻仙語

花韻仙語

发布时间:2025-10-08 10:53:01

|

152人浏览过

|

来源于php中文网

原创

Java字符串压缩算法优化:处理末尾字符序列的策略

本文深入探讨了字符串压缩算法,旨在将连续重复字符替换为字符加计数。我们将分析在实现此类算法时常见的末尾字符序列处理遗漏问题,并提供一个优化后的Java解决方案,确保所有字符序列都能被正确压缩,从而实现如“abbbccccc”到“ab3c4”的准确转换。

理解字符串压缩需求

字符串压缩是一种常见的数据处理技术,其目标是将连续重复的字符序列替换为该字符及其重复次数。例如,将字符串 "abbbccccc" 压缩为 "ab3c4"。这种技术在日志处理、数据存储和网络传输中都有应用,有助于减少数据量。

原代码分析及问题定位

我们来看一个尝试实现此功能的Java代码示例:

public class Test12CompressString {
    public static String getCompressedString(String str) {
        String newString = "";
        int count = 1;
        int len = str.length()-1; // len 是字符串最后一个字符的索引
        for (int i = 0; i <= len ; i++) {
            if(i != len) { // 仅当不是最后一个字符时执行此块
                // System.out.println(i); // 调试输出
                if(str.charAt(i) == str.charAt(i+1)) {
                    count++;
                    continue; // 字符相同,计数增加,跳过当前循环剩余部分
                } 
                // 字符不同时,或达到最后一个字符前一个字符时
                if(count == 1) {
                    newString = newString+str.charAt(i); // 如果只出现一次,直接添加字符
                } else {
                    newString = newString+str.charAt(i)+count; // 添加字符和计数
                }
                // 以下代码块逻辑存在问题,且与前一个if/else重复,实际不会被有效执行
                // if ( str.charAt(i) != str.charAt(i+1)) {
                //     count = 1;
                //     continue;
                // }
            } 
        }
        return newString;
    }

    public static void main(String[] args) {
        String str = "abbbccccc";
        String ans = getCompressedString(str);
        System.out.print(ans); // 预期输出: ab3c4, 实际输出: ab3
    }
}

当输入字符串为 "abbbccccc" 时,预期输出是 "ab3c4",但实际输出却是 "ab3"。问题出在代码对字符串末尾字符序列的处理上。

问题根源分析:

  1. if(i != len) 条件限制: 循环体内的核心逻辑被 if(i != len) 包裹。这意味着当 i 等于 len(即处理到字符串的最后一个字符时),整个条件块内的代码都不会被执行。
  2. 依赖字符变化触发输出: 代码只有在当前字符与下一个字符不同时 (str.charAt(i) != str.charAt(i+1)),或者当前序列的计数达到 count > 1 时,才会将字符及其计数添加到 newString 中。对于字符串末尾的连续字符序列(例如 "ccccc"),由于其后没有不同的字符,这个条件永远不会满足,导致最后一个序列("c4")永远不会被添加到结果字符串中。
  3. 冗余且错误的逻辑: 内部的 if (str.charAt(i) != str.charAt(i+1)) 块是多余的,且其 continue 语句会导致逻辑中断,但由于前面的 if/else 已经处理了字符不同时的逻辑,实际上这块代码的执行路径非常有限且容易混淆。

简而言之,原代码在处理到字符串的倒数第二个字符时,如果它与最后一个字符相同,会正确地增加 count。但当循环到达最后一个字符时,由于 i == len,所有输出逻辑都被跳过,导致最后一个字符序列无法被处理。

立即学习Java免费学习笔记(深入)”;

优化算法思路

要解决这个问题,我们需要确保在以下两种情况下将当前字符及其计数添加到结果中:

英特尔AI工具
英特尔AI工具

英特尔AI与机器学习解决方案

下载
  1. 当前字符与下一个字符不同时(即一个字符序列的结束)。
  2. 循环遍历到字符串的最后一个字符时(此时当前序列也必然结束)。

为了提高字符串拼接的效率,我们应该使用 StringBuilder 而不是 String 的 + 操作符。

实现优化后的字符串压缩

以下是修正并优化后的Java代码:

public class CompressedString {

    public static String getCompressedString(String str) {
        if (str == null || str.isEmpty()) {
            return ""; // 处理空字符串或null的情况
        }

        StringBuilder compressedString = new StringBuilder();
        int count = 1;

        for (int i = 0; i < str.length(); i++) {
            // 检查当前字符是否与下一个字符相同,且未超出字符串边界
            if (i + 1 < str.length() && str.charAt(i) == str.charAt(i + 1)) {
                count++; // 字符相同,计数增加
            } else {
                // 字符不同,或者已经到达字符串的末尾
                compressedString.append(str.charAt(i)); // 添加当前字符
                if (count > 1) {
                    compressedString.append(count); // 如果计数大于1,添加计数
                }
                count = 1; // 重置计数器为1,为下一个字符序列做准备
            }
        }
        return compressedString.toString();
    }

    public static void main(String[] args) {
        String str1 = "abbbccccc";
        System.out.println("Original: " + str1 + ", Compressed: " + getCompressedString(str1)); // 预期: ab3c4

        String str2 = "a";
        System.out.println("Original: " + str2 + ", Compressed: " + getCompressedString(str2)); // 预期: a

        String str3 = "aaabbc";
        System.out.println("Original: " + str3 + ", Compressed: " + getCompressedString(str3)); // 预期: a3b2c

        String str4 = "";
        System.out.println("Original: " + str4 + ", Compressed: " + getCompressedString(str4)); // 预期: (空字符串)

        String str5 = "abc";
        System.out.println("Original: " + str5 + ", Compressed: " + getCompressedString(str5)); // 预期: abc
    }
}

代码逻辑解释:

  1. 空字符串处理: 首先检查输入字符串是否为 null 或空,如果是则直接返回空字符串,避免后续错误。
  2. StringBuilder 初始化: 使用 StringBuilder 替代 String 进行拼接,以提高性能。
  3. 循环遍历: 循环 i 从 0 到 str.length() - 1,确保每个字符都被访问到。
  4. 条件判断:
    • if (i + 1
    • else 块:如果上述条件不满足,说明当前字符是其所在连续序列的最后一个字符(因为下一个字符不同,或者它已经是字符串的最后一个字符)。此时,我们将:
      • compressedString.append(str.charAt(i)): 将当前字符添加到结果中。
      • if (count > 1) { compressedString.append(count); }: 如果 count 大于 1(表示有重复),则将计数也添加到结果中。
      • count = 1;: 重置 count 为 1,为处理下一个可能的新字符序列做准备。
  5. 返回结果: 循环结束后,compressedString.toString() 将 StringBuilder 的内容转换为最终的 String 返回。

通过这种方式,无论字符序列在字符串的哪个位置,包括末尾,都能被正确地处理和压缩。

关键点与注意事项

  • 边界条件处理: 在处理字符串时,尤其要注意循环的边界条件以及对字符串长度的检查(如 i + 1
  • StringBuilder 的使用: 在循环中进行字符串拼接时,使用 StringBuilder 比直接使用 String 的 + 运算符效率更高,因为 String 的 + 操作会创建大量中间字符串对象,而 StringBuilder 则是在内部可变数组上操作。
  • 代码可读性 保持代码逻辑清晰,避免复杂的嵌套条件,可以提高代码的可读性和维护性。
  • 空字符串/单字符处理: 良好的算法应该能优雅地处理各种边缘情况,例如空字符串、只包含一个字符的字符串或没有重复字符的字符串。

总结

字符串压缩是一个典型的考察循环逻辑和边界条件处理能力的编程问题。通过分析原始代码的不足,我们发现未能正确处理字符串末尾字符序列是导致压缩不完整的主要原因。优化后的解决方案通过在字符序列结束或到达字符串末尾时统一处理字符及其计数,并结合 StringBuilder 提高了效率和健壮性。这强调了在设计算法时,对所有可能情况,特别是边界条件的全面考虑至关重要。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

463

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

237

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

458

2024.03.01

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1502

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

232

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

87

2025.10.17

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

779

2023.08.22

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

198

2023.11.20

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

14

2026.01.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3万人学习

C# 教程
C# 教程

共94课时 | 8万人学习

Java 教程
Java 教程

共578课时 | 53.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号