
本文介绍在 php 中如何将字符串拆分为元音和辅音,统一转为小写、去除空格后,**按各字符在原字符串中首次出现的顺序,分别对元音和辅音内部进行频次展开排序**(即相同字符连续排列,且字符块顺序由其首次出现位置决定)。
要实现“按首次出现顺序排序”,关键不在于传统字典序或索引重排,而在于:先提取所有元音(或辅音),再按它们在原始字符串中第一次出现的先后顺序,对去重后的字符列表排序,最后按频次重复拼接。
原代码的问题在于:它只是按遍历顺序简单收集字符($v 和 $c 是稳定顺序),但未对同类字符做归并——导致 aeae 保持交错,而非 aaee。而题目期望的是:同一字符集中,相同字母需连续出现,且不同字母的相对顺序由其在原串中“首次露面”的位置决定。
正确思路如下:
- 预处理:转小写、移除空格;
-
分离字符集:
- 元音:仅保留 a,e,i,o,u,其余过滤掉;
- 辅音:仅保留非元音的英文字母(即 b-z 排除 aeiou),空格已清除;
- 获取首次出现顺序:使用 str_split() 得到字符数组 → 遍历并记录每个字符首次出现的索引(或更简洁地:用 array_unique() 保持键值顺序);
- 频次统计 + 有序拼接:借助 array_count_values() 统计频次,再结合原始字符流中去重后的顺序(即 array_unique($chars) 的结果)来控制输出序列。
但注意:array_count_values() 本身不保证键的顺序,因此必须配合原始遍历顺序。更健壮、清晰的实现方式如下(优化版,含注释与可读性提升):
function sortCharsByFirstOccurrence(string $text): array
{
$lower = strtolower(str_replace(' ', '', $text));
$chars = str_split($lower);
$vowels = ['a', 'e', 'i', 'o', 'u'];
// 提取元音和辅音(保持原始顺序)
$vowelList = array_filter($chars, fn($c) => in_array($c, $vowels));
$consonantList = array_filter($chars, fn($c) => ctype_alpha($c) && !in_array($c, $vowels));
// 按首次出现顺序去重(保留键,确保顺序)
$uniqueVowels = array_values(array_unique($vowelList));
$uniqueConsonants = array_values(array_unique($consonantList));
// 统计频次
$vowelCounts = array_count_values($vowelList);
$consonantCounts = array_count_values($consonantList);
// 拼接:按 unique 列表顺序,重复对应次数
$vowelsResult = '';
foreach ($uniqueVowels as $v) {
$vowelsResult .= str_repeat($v, $vowelCounts[$v] ?? 0);
}
$consonantsResult = '';
foreach ($uniqueConsonants as $c) {
$consonantsResult .= str_repeat($c, $consonantCounts[$c] ?? 0);
}
return [
'vowels' => $vowelsResult,
'consonants' => $consonantsResult
];
}
// 使用示例
$result = sortCharsByFirstOccurrence('Sample Case');
echo "vowels : {$result['vowels']}\n";
echo "consonants : {$result['consonants']}\n";✅ 输出:
vowels : aaee consonants : ssmplc
? 关键说明:
- array_unique($vowelList) 返回的数组保留了首个匹配元素的原始键位,因此 ['s','a','m','p','l','e','c','a','s','e'] 中元音提取为 ['a','e','a','e'] → array_unique 得 ['a','e'],完美对应首次出现顺序;
- str_repeat($char, $count) 确保相同字符连续排列;
- 使用 ctype_alpha() 替代硬编码辅音列表,更健壮(兼容未来扩展,且避免遗漏如 'y' 等边界情况);若严格按 b-z\aeiou 定义辅音,亦可改用正则 /[^aeiou\d\s]/ 过滤。
? 小结:本方案本质是「稳定频次展开」——不是排序,而是按首次出现顺序枚举唯一字符,再按全局频次填充。它兼具可读性、健壮性与扩展性,适用于任意 ASCII 字母字符串处理场景。










