for-of循环遍历JavaScript字符串时按Unicode码点逐个返回字符,能正确处理代理对;其迭代器由[Symbol.iterator]提供,每次next()返回{value: 字符, done: 布尔}。

JavaScript字符串在for-of循环中会自动使用其内置的迭代器,按**Unicode码点(code point)** 逐个遍历字符,而非按UTF-16代码单元(code unit)。这意味着它能正确处理代理对(surrogate pairs),如emoji或部分中文古字等超出BMP(基本多文种平面)的字符。
字符串迭代器返回的是真正的字符,不是UTF-16单元
ES2015+ 中,字符串的[Symbol.iterator]方法返回一个迭代器,每次next()调用返回一个{ value, done }对象,其中value是单个字符(即一个Unicode码点)。这与for(let i=0; i<str.length i>有本质区别——后者遍历的是UTF-16代码单元,可能把一个代理对拆成两个“乱码”项。</str.length>
-
"a".length === 1,for-of产出"a" -
"?".length === 2(它是U+20BB7,由两个UTF-16单元组成),但for-of只产出一次"?" -
"??".length === 4(含多个代理对和ZWJ连接符),for-of通常产出一个完整emoji(取决于具体实现和Unicode版本,但现代引擎按规范视为单个码点序列)
for-of循环隐式调用字符串的迭代器
当你写for (const ch of str) { ... }时,JavaScript引擎会:
- 检查
str[Symbol.iterator]是否存在(字符串原型上已定义) - 调用它获取迭代器对象
- 反复调用
iterator.next(),直到done: true - 每次将
value绑定给ch
等价于手动展开:
立即学习“Java免费学习笔记(深入)”;
const it = str[Symbol.iterator]();<br>let res;<br>while (!(res = it.next()).done) {<br> const ch = res.value;<br> // ...<br>}注意:空字符串和非字符串值的行为
空字符串""的迭代器立即返回{ value: undefined, done: true },因此for-of体不会执行。
- 若
str为null或undefined,会抛出TypeError(无法读取Symbol.iterator) - 若
str是其他类型(如数字),会先尝试ToString();若转换失败(如Symbol(1)),也抛错 - 可安全使用的前提是确保
str是字符串或可转为字符串的原始值
扩展:自定义字符串迭代行为(不推荐覆盖,但可理解原理)
你可以通过重写String.prototype[Symbol.iterator]来改变所有字符串的for-of行为(仅用于学习或特殊沙箱环境):
String.prototype[Symbol.iterator] = function* () {<br> for (let i = 0; i < this.length; i += 2) {<br> yield this.slice(i, i + 2); // 每次返回两个字符<br> }<br>};但此举破坏标准语义,影响兼容性与可维护性,生产环境应避免。










