
golang默认编码为utf-8,但网页中会有各种格式像常见的"gb2312","gbk"等。处理这些编码的网页时就会出现头大的乱码.golang没有自带的编解码包,需要借助第三方包处理。推荐:golang教程
第三方包
code.google.com/p/mahonia
使用简介
立即学习“go语言免费学习笔记(深入)”;
code貌似托管在谷歌的服务器上,国内用户可能要翻墙,我在github上fork了一个mahonia.
先判断是否支持你想要的编码格式,不支持的话,返回值为nil
Destoon B2B网站管理系统是一套完善的B2B(电子商务)行业门户解决方案。系统基于PHP+MySQL开发,采用B/S架构,模板与程序分离,源码开放。模型化的开发思路,可扩展或删除任何功能;创新的缓存技术与数据库设计,可负载千万级别数据容量及访问。 系统特性1、跨平台。支持Linux/Unix/Windows服务器,支持Apache/IIS/Zeus等2、跨浏览器。基于最新Web标准构建,在
func GetCharset(name string) *Charset
if mahonia.GetCharset(char) == nil {
return nil, fmt.Errorf("%s charset not suported \n", char)}创建特定编码格式的decoder
func NewDecoder(name string) Decoder
dec := mahonia.NewDecoder(char)
接着直接解码:常用的有直接从字符串解码及从io流解码
func (d Decoder) ConvertString(s string) string
func (d Decoder) NewReader(rd io.Reader) *Reader
这里用的是io流,因为下面还用到类似于jquery的一个工具包,便于连贯陈述
rd := dec.NewReader(resp.Body)









