VB.net 2010 视频教程 VB.net 2010 视频教程 python基础视频教程
SQL Server 2008 视频教程 c#入门经典教程 Visual Basic从门到精通视频教程
当前位置:
首页 > Python基础教程 >
  • python中文乱码问题大总结(2)

 

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import sys  
reload(sys)  
sys.setdefaultencoding('utf-8')  #修改默认编码方式,默认为ascci 
print sys.getdefaultencoding()
  
content= getPageContent("http://www.oschina.net/")
print content.decode('utf-8').encode('gb2312')
#!/usr/bin/env python
#coding=utf-8
#python version:2.7.4
#system:windows xp
import httplib2
def getPageContent(url):
    '''
    使用httplib2用编程的方式根据url获取网页内容
    将bytes形式的内容转换成utf-8的字符串
    '''
    #使用ie9的user-agent,如果不设置user-agent将会得到403禁止访问
    headers={'user-agent':'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)',
            'cache-control':'no-cache'}
    if url:
         response,content= httplib2.Http().request(url,headers=headers)
         
         if response.status== 200 :
            return content

 

1
2
3
4
5
6
import sys
reload(sys)
sys.setdefaultencoding('utf-8')  #修改默认编码方式,默认为ascci
print sys.getdefaultencoding()
content= getPageContent("http://www.oschina.net/")
print content.decode('utf-8').encode('gb2312')

相关教程