• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >编程问答 > Python爬虫post参数包含重复键

Python爬虫post参数包含重复键

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2017-06-07

佚名通过本文主要向大家介绍了python 爬虫 post,python 爬虫框架,python爬虫课程,网络爬虫 python,python爬虫等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题:Python爬虫post参数包含重复键
描述:

我在写Python爬虫的时候,pycharm一直提示包含重复键,但程序可以运行。但是运行结果只爬了一部分内容下来。

三个“Pu00021_Iuput.content"只能运行一个。我试过设置参数for循环,都不行。求教!

coding=utf-8

''' author:Chenwentao
date:2016-2-26
function:
抓取指定网页数据
'''
import urllib
import urllib2
import xlwt
import time
import sys
from bs4 import BeautifulSoup

头设置

loginHeaders = {

'Host':'www.dce.com.cn',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:35.0) Gecko/20100101 Firefox/35.0',
'Referer': 'http://www.dce.com.cn/PublicWeb/MainServlet?action=Pu00011_search',
'Content-Type': 'application/x-www-form-urlencoded',
'Connection': 'Keep-Alive'

}

参数设置\

post = {

  'action': 'Pu00021_result',
  'Pu00021_Input.trade_date': '20160425',
  'Pu00021_Input.content': ['0', '1', '2'],
  'Pu00021_Input.variety': 'a',
  'Pu00021_Input.trade_type': '0',
  'Pu00021_Input.contract_id': 'a1609',

}
reload(sys)
sys.setdefaultencoding('utf8')

url = 'http://www.dce.com.cn/PublicWeb/MainServlet'
postData = urllib.urlencode(post)
request = urllib2.Request(url, postData, loginHeaders)
opener = urllib2.build_opener()
response = opener.open(request)
content = response.read().decode('gbk')

soup = BeautifulSoup(content, 'xml')

print content


解决方案1:

发三个请求。你现在的做法相当于重新赋值两次。

解决方案2:

在python里面,如果key相同以最后一次出现的key为准,也就是说你只运行了value为2

你可以考虑这样写
post = {

'Pu00021_Input.content': ['0', '1', '2']

}
对value进行循环


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • python爬虫(python)DjangoPOST表单错误?
  • python爬虫:用requestspost提交表单抓取异步ajax信息失败
  • Python爬虫post参数包含重复键

相关文章

  • 2017-06-07 (python)类似“%22%3A%22”这样的字符串怎么解码?
  • 2017-06-07 (python)a=[1,2,3,4,5],b=a和b=a[:],有区别么?
  • 2017-06-07 一个非常奇怪的问题,能得到用户,却无法登陆
  • 2017-06-07 python有哪些方法可以获取到文件的创建时间
  • 2017-06-07 flask如何获取全部GET查询参数?
  • 2017-06-07 jboss配置问题?
  • 2017-06-07 jboss50GA发布EAR异常
  • 2017-06-07 如何获取GIF图片的第一帧作为预览图,但是是静态的
  • 2017-06-07 mac/usr/local/bin这个目录是文件可以删除吗?是什么目录?
  • 2017-06-07 七牛能不能做斜体文字水印

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • pythonwatchdog如何检测一个文件创建完成
    • flask-sqlalchemy两张未设置外键的表,如何联表查询?
    • url编码分块上传API的请求Url是什么?
    • (flask)python让列表倒序输出
    • 关于MemcachedCAS协议
    • jboss一运行一大堆的异常啊,
    • WebMagic爬虫怕您github粉丝的名字
    • (python)Requests爬取不到自己想要的网页代码。
    • osx下vagrantcentos6lnmp环境下,为什么PHP也有类似缓存的情况?
    • java代码上传图片到七牛服务器失败

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有