1. 首页
  2. 软文投稿

python爬取网页伯乐在线封面图,并保存到相对路径

python爬取网页伯乐在线封面图伯乐在线 python伯乐在线 python,并保存到相对路径

首先得对settings.py进行设置:

ITEM_PIPELINES = {
   'ArticleSpider.pipelines.ArticlespiderPipeline': 300,
    'scrapy.pipelines.images.ImagesPipeline':1,
}
#注意IMAGES_URLS_FIELD(下面那个也一样) 不能写错,否则图片存不到images的
IMAGES_URLS_FIELD = "front_image_url"
#获取当前文件所在路径,这里是相对路径
project_dir = os.path.abspath(os.path.dirname(__file__))
#设置存放图片的路径
IMAGES_STORE =os.path.join(project_dir ,'images')

第一个 报错 ImportError: No module named ‘PIL’

解决方法:pip install pillow

这样安装比较慢,那咱可以利用豆瓣镜像进行下载:pip install -i https:pypi.douban.com/simple pillow

第二个报错:

报错原因:

在ImagesPipeline中会将 IMAGES_URLS_FIELD = "front_image_url"中的front_image_url当做数组处理,而我们在jobbole.py中传进来的front_image_url不是数组,因此会报错

此时是因为在jobbole.py中有个变量front_image_url。

解决方案:在这个变量上加上[]

actcle_item['front_image_url'] = [front_image_url]

这时你的图片就会存在这个目录下面

代码以后会给出。。。。现在还正在写中

posted @ 2017-09-22 14:52那时的吻狠陶醉阅读(…)评论(…)编辑

【本文作者】:亿闻天下网,商业用途未经许可不得转载,非商业用途转载注明出处原文链接:https://cqsoo.com/ruanwen/2942.html

【版权与免责声明】:如发现内容存在版权问题,烦请提供相关信息发邮件至 kefu@cqsoo.com ,

并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。反馈给我们

本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。

发表评论

登录后才能评论
Copyright 2007-2019 亿闻天下网 / 渝ICP备89217412123号-1  / 本站由wordpress、阿里云、群英、百度云提供驱动力
QR code