Python输入中文的问题
迷茫
迷茫 2017-04-18 09:02:59
[Python讨论组]

我写了一个爬乌云漏洞库的爬虫,其URL形式为http://www.wooyun.org/corps/公司名称/page/1,程序最后raw_input处输入公司名称即可跑出该公司的漏洞。现在的问题是中文编码的问题没解决好,如果公司的名称是英文如RiSing就可以,如果是中文就报错。求各位大大指点

# coding=utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import urllib
import urllib2
import re

 
 
 
def getPage(pageNum):
    try:
        url = 'http://www.wooyun.org/corps/' + corpName + '/page/' + str(pageNum)
        request = urllib2.Request(url)
        response = urllib2.urlopen(request)
        return response.read().decode('utf-8')
    except urllib2.URLError, e:
        if hasattr(e,u"reason"):
            print u"error",e.reason
            return None
 
def getContent(page):
    pattern = re.compile('.*?(.*?).*?(.*?)',re.S)
    items = re.findall(pattern,page)
    for item in items:    
        print item[0],'http://www.wooyun.org'+item[1],item[2]

def getPageNum(page):
    pattern = re.compile('

(.*?)(.*?)

迷茫
迷茫

业精于勤,荒于嬉;行成于思,毁于随。

全部回复(1)
巴扎黑
from urllib import quote

print quote('百度')
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号