0

0

Java字符串压缩:实现重复字符计数编码

聖光之護

聖光之護

发布时间:2025-10-08 11:20:27

|

526人浏览过

|

来源于php中文网

原创

Java字符串压缩:实现重复字符计数编码

本教程详细讲解如何使用Java实现字符串的重复字符计数压缩(Run-Length Encoding)。通过分析一个常见的编码错误,即忽略字符串末尾字符及其计数的问题,我们将展示如何编写一个健壮的算法,确保所有连续重复的字符序列都能被正确压缩,并提供完整的示例代码和注意事项。

字符串重复字符计数压缩(Run-Length Encoding)原理

字符串重复字符计数压缩(run-length encoding, rle)是一种简单的数据压缩算法,其核心思想是将字符串中连续重复出现的字符序列替换为字符本身加上其重复的次数。例如,字符串 "aaabbc" 经过rle压缩后变为 "a3b2c"。这种方法在处理包含大量连续重复字符的数据时非常有效。

常见实现思路与陷阱

实现RLE通常涉及遍历字符串,统计连续相同字符的个数。当遇到不同的字符或到达字符串末尾时,将之前统计的字符和其计数添加到结果字符串中。然而,在这个过程中,一个常见的陷阱是未能正确处理字符串末尾的字符序列。

考虑以下一个尝试实现RLE的Java代码片段:

public class Test12CompressString {
    public static String getCompressedString(String str) {
        String newString = ""; // 使用String进行拼接效率较低
        int count = 1;
        int len = str.length()-1; // 最后一个字符的索引
        for (int i = 0; i <= len ; i++) {
            if(i != len) { // 避免越界访问str.charAt(i+1)
                // System.out.println(i); // 调试输出
                if(str.charAt(i) == str.charAt(i+1)) {
                    count++;
                    continue; // 继续统计
                } 
                // 字符不同时,将之前的字符和计数添加到结果
                if(count == 1) {
                    newString = newString+str.charAt(i);
                } else {
                    newString = newString+str.charAt(i)+count;
                }
                // 这里的条件判断是多余的,且可能导致逻辑混乱
                if ( str.charAt(i) != str.charAt(i+1)) {
                    count = 1; // 重置计数
                    continue; // 继续下一轮循环
                }
            } 
        }
        return newString;
    }

    public static void main(String[] args) {
        String str = "abbbccccc";
        String ans = getCompressedString(str);
        System.out.print(ans); // 预期输出: ab3c4, 实际输出: ab3
    }
}

上述代码尝试压缩 "abbbccccc",但实际输出是 "ab3",丢失了末尾的 "c4"。其根本原因在于:

  1. 循环条件与边界处理不当: for (int i = 0; i
  2. 依赖字符变化触发添加: 代码逻辑中,字符及其计数的添加 (newString = newString+str.charAt(i)+count;) 发生在 str.charAt(i) != str.charAt(i+1) 时。对于字符串末尾的字符序列(如 "ccccc"),当循环处理到最后一个 c 时,由于后面没有字符来触发“字符变化”的条件,这个 c 及其统计的 count 永远不会被添加到 newString。

为了解决这个问题,我们需要确保无论字符是否发生变化,或者是否到达字符串末尾,当前累积的字符和计数都能够被正确地添加到结果中。

立即学习Java免费学习笔记(深入)”;

I-Shop购物系统
I-Shop购物系统

部分功能简介:商品收藏夹功能热门商品最新商品分级价格功能自选风格打印结算页面内部短信箱商品评论增加上一商品,下一商品功能增强商家提示功能友情链接用户在线统计用户来访统计用户来访信息用户积分功能广告设置用户组分类邮件系统后台实现更新用户数据系统图片设置模板管理CSS风格管理申诉内容过滤功能用户注册过滤特征字符IP库管理及来访限制及管理压缩,恢复,备份数据库功能上传文件管理商品类别管理商品添加/修改/

下载

正确的实现方法

一种更健壮的RLE实现方法是,在循环中始终检查当前字符与下一个字符的关系。如果它们相同,则继续计数;如果不同或已到达字符串末尾,则将当前字符和其计数添加到结果中,并重置计数器。

import java.lang.StringBuilder; // 导入StringBuilder类

public class StringCompressor {

    /**
     * 对给定字符串执行Run-Length Encoding (RLE) 压缩。
     * 将连续重复的字符替换为字符本身及其重复次数。
     * 例如:"abbbccccc" -> "ab3c4"
     *
     * @param str 待压缩的原始字符串。
     * @return 压缩后的字符串。
     */
    public static String compressString(String str) {
        // 处理空字符串或null输入
        if (str == null || str.isEmpty()) {
            return "";
        }

        // 使用StringBuilder提高字符串拼接效率
        StringBuilder compressedString = new StringBuilder();
        int count = 1; // 记录当前字符的连续重复次数

        // 遍历字符串的每个字符
        for (int i = 0; i < str.length(); i++) {
            // 检查当前字符是否与下一个字符相同,并且确保i+1不会越界
            if (i + 1 < str.length() && str.charAt(i) == str.charAt(i + 1)) {
                count++; // 如果相同,则增加计数
            } else {
                // 如果字符不同,或者已经到达字符串的末尾
                // 将当前字符添加到结果中
                compressedString.append(str.charAt(i));
                // 如果计数大于1,则将计数也添加到结果中
                if (count > 1) {
                    compressedString.append(count);
                }
                // 重置计数器为1,准备统计下一个字符序列
                count = 1;
            }
        }
        return compressedString.toString(); // 返回最终的压缩字符串
    }

    public static void main(String[] args) {
        // 测试用例
        String str1 = "abbbccccc";
        System.out.println("Original: \"" + str1 + "\", Compressed: \"" + compressString(str1) + "\""); // 预期: "ab3c4"

        String str2 = "aabbcc";
        System.out.println("Original: \"" + str2 + "\", Compressed: \"" + compressString(str2) + "\""); // 预期: "a2b2c2"

        String str3 = "abc";
        System.out.println("Original: \"" + str3 + "\", Compressed: \"" + compressString(str3) + "\""); // 预期: "abc"

        String str4 = "aaaaa";
        System.out.println("Original: \"" + str4 + "\", Compressed: \"" + compressString(str4) + "\""); // 预期: "a5"

        String str5 = "";
        System.out.println("Original: \"" + str5 + "\", Compressed: \"" + compressString(str5) + "\""); // 预期: ""

        String str6 = "z";
        System.out.println("Original: \"" + str6 + "\", Compressed: \"" + compressString(str6) + "\""); // 预期: "z"
    }
}

代码解析

  1. 空字符串/Null处理: 函数首先检查输入字符串是否为 null 或空,如果是,则直接返回空字符串,避免后续操作的错误。
  2. StringBuilder: 使用 StringBuilder 而不是 String 的 + 运算符进行字符串拼接。这是因为 String 的 + 运算会创建大量中间字符串对象,导致性能下降,而 StringBuilder 可以在原有对象上进行修改,效率更高。
  3. 循环遍历: for (int i = 0; i
  4. 条件判断:
    • if (i + 1
    • 如果相同,说明是连续重复的字符,count 递增。
    • else 块:如果字符不同,或者 i 已经是字符串的最后一个索引(此时 i + 1
    • compressedString.append(str.charAt(i)):将当前字符添加到结果中。
    • if (count > 1) { compressedString.append(count); }:如果 count 大于1,说明字符重复了多次,将重复次数也添加到结果中。如果 count 等于1,则不添加数字(例如,"a" 压缩后仍为 "a",而不是 "a1")。
    • count = 1;:重置 count 为1,为下一个字符序列的统计做准备。

这种实现方式能够正确处理所有情况,包括字符串末尾的字符序列。

注意事项

  • 边界条件测试: 在开发任何字符串处理函数时,务必测试各种边界条件,包括空字符串、单字符字符串、所有字符都相同、所有字符都不同等情况。
  • 性能优化: 对于频繁的字符串拼接操作,应优先考虑使用 StringBuilder 或 StringBuffer(线程安全版本),而不是 String 的 + 运算符。
  • 算法复杂度: 此RLE算法的时间复杂度为O(N),其中N是字符串的长度,因为它只需要单次遍历字符串。空间复杂度为O(N)(最坏情况下,没有字符重复,结果字符串与原字符串长度相同)。
  • 字符集: 此算法适用于任何字符集,因为它只是比较和拼接字符。

总结

实现字符串的重复字符计数压缩(RLE)是一个常见的编程练习,它强调了在循环中正确处理边界条件的重要性。通过仔细设计循环逻辑,特别是在字符序列结束或到达字符串末尾时如何处理累积的字符和计数,可以避免常见的逻辑错误。同时,采用 StringBuilder 进行字符串构建是Java中优化字符串操作的良好实践。掌握这些原则有助于编写出高效且健壮的字符串处理代码。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

422

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

235

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

437

2024.03.01

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1498

2023.10.24

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

231

2024.02.23

php三元运算符用法
php三元运算符用法

本专题整合了php三元运算符相关教程,阅读专题下面的文章了解更多详细内容。

87

2025.10.17

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

775

2023.08.22

counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

198

2023.11.20

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

9

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

相关下载

更多

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.9万人学习

C# 教程
C# 教程

共94课时 | 7.7万人学习

Java 教程
Java 教程

共578课时 | 51.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号