最稳方案是先用 parse_url() 提取 host,再用 strtok($host, ':') 去端口、explode('.', ...) 拆分并 array_filter() 清空值;识别主域名须依赖公共后缀列表(如 php-domain-parser),不可硬编码。

用 parse_url() 提取域名再拆分最稳
直接用 parse_url() 解析完整 URL,比手动 substr() 或正则切域名更可靠——它天然处理协议、端口、路径干扰,且兼容 IPv6 和国际化域名(IDN)的编码格式。
常见错误是只对原始字符串做 explode('.', $domain),结果遇到 https://user:pass@example.co.uk:8080/path 就漏掉用户信息、端口,还可能把 co.uk 错拆成 ['co', 'uk']。
实操建议:
- 始终先传完整 URL 给
parse_url(),取$parsed['host'],别自己拼接或截取 - 如果输入只有域名(如
example.com),也建议补上http://前缀再解析,避免返回false - 注意
parse_url()对纯 IP 或带端口的域名(如127.0.0.1:8000)仍能正确提取 host,但后续拆分需跳过端口部分
用 explode('.', $host) 拆分时要过滤空值和端口
拿到 $host 后直接 explode('.', $host) 看似简单,但容易在边缘场景出错:比如 host = ''、host = '.'、或带端口的 example.com:8080。
立即学习“PHP免费学习笔记(深入)”;
典型错误现象:var_dump(explode('.', 'example.com:8080')) 得到 ['example', 'com:8080'],而不是想要的 ['example', 'com']。
实操建议:
- 先用
strtok($host, ':')去掉端口部分,再拆分 - 用
array_filter($parts, 'strlen')清掉空字符串(防..example.com这类异常) - 别依赖
count($parts) > 2判断是否为子域名——localhost是单段,dev.example.co.uk是四段,但都是合法 host
需要识别主域名(e.g. co.uk)?别硬写规则
想把 blog.example.co.uk 拆成 ['blog', 'example', 'co.uk'] 而不是 ['blog', 'example', 'co', 'uk'],说明你在处理公共后缀(Public Suffix)。PHP 标准库不内置这个能力,硬靠 in_array($tld, ['co.uk', 'gov.uk']) 维护列表极易过期或漏判。
常见错误是写死几个后缀然后递归匹配,结果遇到 github.io、herokuapp.com 就失效。
实操建议:
- 用现成的
jeremykendall/php-domain-parserComposer 包,它基于 Mozilla Public Suffix List,更新及时 - 若不能引入外部依赖,至少从 publicsuffix.org 下载最新列表,转成 PHP 数组缓存,别每次读文件
- 注意:即使识别出主域名,
parse_url()+explode()仍是前置必要步骤,PSL 只负责归并末端
性能和兼容性:别在循环里反复解析
如果要批量处理几千个 URL,每个都调 parse_url() + explode() + array_filter(),会明显拖慢响应。尤其 parse_url() 内部有状态重置开销,不是纯计算函数。
另一个坑是 PHP 版本差异:PHP 5.4.7+ 才支持 parse_url() 正确解析 IPv6 地址(如 [::1]),旧版本直接返回 false。
实操建议:
- 批量场景下,提前把域名字段单独取出,统一预处理;避免在 foreach 里重复调用
parse_url() - 用
filter_var($host, FILTER_VALIDATE_DOMAIN, FILTER_FLAG_HOSTNAME)快速校验 host 合法性,比parse_url()轻量得多 - 如果确定输入全是标准域名(无协议/路径),可考虑用
preg_match('/^([a-z0-9](-?[a-z0-9])*\.)+[a-z]{2,}$/i', $host)配合explode(),比全量parse_url()快 2–3 倍
真正麻烦的从来不是“怎么拆”,而是“拆完怎么定义哪一段算‘主域’”。不同业务对 example.co.uk 和 example.github.io 的归属判断可能完全相反,得看你的路由、Cookie 作用域或权限模型怎么定——这部分没法靠函数自动解决。











