123,123

當前位置：首頁 > 范文|應用文 > IT技術專欄 > 腳本欄目

python中使用urllib2偽造http報頭的2個方法

來源：易賢網(wǎng) 閱讀：1696 次日期：2016-06-29 09:10:20

溫馨提示：易賢網(wǎng)小編為您整理了“python中使用urllib2偽造http報頭的2個方法”,方便廣大網(wǎng)友查閱！

這篇文章主要介紹了python中使用urllib2偽造http報頭的2個方法,即偽造http頭信息,需要的朋友可以參考下

在采集網(wǎng)頁信息的時候，經(jīng)常需要偽造報頭來實現(xiàn)采集腳本的有效執(zhí)行

下面，我們將使用urllib2的header部分偽造報頭來實現(xiàn)采集信息

方法1、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#filename:urllib2-header.py

import urllib2

import sys

#抓取網(wǎng)頁內(nèi)容-發(fā)送報頭-1

url= http://www.xxx.net

send_headers = {

'host':'www.xxx.net',

'user-agent':'mozilla/5.0 (windows nt 6.2; rv:16.0) gecko/20100101 firefox/16.0',

'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'connection':'keep-alive'

}

req = urllib2.request(url,headers=send_headers)

r = urllib2.urlopen(req)

html = r.read() #返回網(wǎng)頁內(nèi)容

receive_header = r.info() #返回的報頭信息

# sys.getfilesystemencoding()

html = html.decode('utf-8','replace').encode(sys.getfilesystemencoding()) #轉(zhuǎn)碼:避免輸出出現(xiàn)亂碼

print receive_header

# print '####################################'

print html

方法2、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#filename:urllib2-header.py

import urllib2

import sys

url = 'http://www.xxx.net'

req = urllib2.request(url)

req.add_header('referer','http://www.xxx.net/')

req.add_header('user-agent','mozilla/5.0 (windows nt 6.2; rv:16.0) gecko/20100101 firefox/16.0')

r = urllib2.urlopen(req)

html = r.read()

receive_header = r.info()

html = html.decode('utf-8').encode(sys.getfilesystemencoding())

print receive_header

print '#####################################'

print html

上一篇：js實現(xiàn)分享到隨頁面滾動而滑動效果的方法

下一篇：javascript中變量聲明有var和沒var的區(qū)別

易賢網(wǎng)手機網(wǎng)站地址：python中使用urllib2偽造http報頭的2個方法

由于各方面情況的不斷調(diào)整與變化，易賢網(wǎng)提供的所有考試信息和咨詢回復僅供參考，敬請考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇剩?/div>

相關閱讀腳本欄目

Bottle框架中的裝飾器類和描述符應用詳解10月30日

Python探索之SocketServer詳解10月30日

Python探索之實現(xiàn)一個簡單的HTTP服務器10月30日

python探索之BaseHTTPServer-實現(xiàn)Web服務器介紹10月30日

13個最常用的Python深度學習庫介紹10月30日

深入理解Python中的*重復運算符10月30日

python logging日志模塊詳解10月30日

System表空間不足的報警問題淺析10月22日

Android開發(fā)自定義TextView省略號樣式的方法10月22日

MySQL 清除表空間碎片的實例詳解10月22日

Ubuntu下MySQL安裝及配置遠程登錄教程10月22日

Python 2.x如何設置命令執(zhí)行的超時時間實例10月22日

windows 64位下redis安裝教程10月22日

Android 自定義 HorizontalScrollView 打造多圖片OOM 的橫向滑動效果10月22日

淺談Node Inspector 代理實現(xiàn)10月22日

java web開發(fā)之購物車功能實現(xiàn)示例代碼10月22日

Android開發(fā)中GridView用法示例10月22日

Django ORM框架的定時任務如何使用詳解10月22日

SpringMail使用過程中的報錯解決辦法10月22日

Android 使用自定義RecyclerView控件實現(xiàn)Gallery效果10月22日

易賢網(wǎng)移動網(wǎng)站

最新信息

2025年西南林業(yè)大學招聘編外工作人員公告（三）

2025年10月西雙版納州景洪市綜合行政執(zhí)法局招聘人員公告

2025年云南弘基建設工程有限公司招聘公告

2025年昭通市改革發(fā)展研究中心選調(diào)工作人員職業(yè)素質(zhì)測評通告

2025年昭通市綏江縣職業(yè)高級中學招聘編外緊缺臨聘數(shù)學教師公告

2025年中共怒江州委宣傳部招聘公益性崗位公告

2025年麗江市玉龍縣退役軍人事務局公益性崗位招聘公告

2025年迪慶州香格里拉市政法委招聘公益性崗位公告

2025年西雙版納州紅十字會招聘公益性崗位人員公告

2025年西雙版納州勐臘縣緊密型縣域醫(yī)共體招聘編外人員公告

公考類

云南公務員貴州公務員四川公務員廣西公務員各省公務員國家公務員選調(diào)遴選

招聘類

事業(yè)單位教師招聘特崗教師三支一扶志愿者銀行招聘國企招聘

各類考試

學歷升學會計考試職業(yè)資格外語考試醫(yī)學考試工程考試教師資格

版權(quán)所有:易賢網(wǎng)

<cite id="ciae8"></cite>