重写start_requests遇到的一个怪问题？

作者：佚名字体：[增加减小] 来源：互联网时间：2017-06-07

佚名通过本文主要向大家介绍了start requests,start requests self,requests,python requests,python requests模块等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

问题：重写start_requests遇到的一个怪问题？
描述:

背景：scrapy

介绍：

#items.jl和spider放在同一目录下。
def start_requests(self):
        with open('items.jl','rb') as urls:
          for url in urls:
             print url
             link=eval(url)
             yield Request(link['url'],d

items.jl文件是一个json数据：
{"url": "http://onlinelibrary.wiley.com/getIdentityKey?redirectTo=http%3A%2F%2Fonlinelibrary.wiley.com%2Fdoi%2F10.1002%2Fanie.201509111%2Ffull%3Fwol1URL%3D%2Fdoi%2F10.1002%2Fanie.201509111%2Ffull&userIp=112.65.190.171&doi=10.1002%2Fanie.201509111"}

问题：

   url死活打印不出来，貌似一直进不到循坏中。

补充：

#items.jl和spider放在同一目录下。
with open('items.jl','rb') as urls:
              for url in urls:
                 print url
                 
这样，url是能打印出来的。

.............补充（代码参考来源）...............................
http://stackoverflow.com/questions/9322219/how-to-generate-the-start-urls-dynamically-in-crawling/10379463#10379463

解决方案1:

你这是定义了个生成器啊

要

for i in start_requests(): pass

才可以

分享到：QQ空间新浪微博腾讯微博微信百度贴吧 QQ好友复制网址打印

您可能想查找下面的文章:

2017-06-07 java获得一个String字符串中第一个数字的下标，并截取后面的6位和前面的地区
2017-06-07 新浪微博如何私信(python)如何得到新浪微博的热门话题前十
2017-06-07 「C自动补全插件」sublimeclang的编码问题
2017-06-07 (python)如何对Django的每一个URL请求进行处理
2017-06-07 七牛的工单入口藏的太深了
2017-06-07 Redis通过Sentinel可以实现主从切换，客户端怎么实现自动切换？
2017-06-07 laravel关联模型查询
2017-06-07 一个关于STL的内存问题，不懂了
2017-06-07 ipcamera直播云如何接入ipcamera？
2017-06-07 Python爬取网页，？

重写start_requests遇到的一个怪问题？

您可能想查找下面的文章:

相关文章

文章分类

最近更新的内容