博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python爬取爱奇艺【老子传奇】评论数据
阅读量:6322 次
发布时间:2019-06-22

本文共 1957 字,大约阅读时间需要 6 分钟。

# -*- coding: utf-8 -*-import requestsimport osimport csvimport timeimport randombase_url = 'http://api-t.iqiyi.com/feed/get_feeds?authcookie=97RRnhwyZA35LUddm35Yh4x5m2Vv9DJtUOuFHAeFVinDJg17wOO5Em1Se5vGm2vqn8SoSb24&device_id=a35b964e5084125fb7dfab30205fe32b&m_device_id=969312df66b3063f0ad005ebce2181f1&agenttype=118&wallId=214740047&feedTypes=1%2C7&count=20&top=1&hasRecomFeed=1&needTotal=1&baseTvId=646605300&version=1&qypid=01010011010000000000&isVideoPage=true&tvid=646605300&categoryid=2&albumid=206289501&upOrDown=1&snsTime={snstime}&t={t}&'cookies = {
'Cookie':'xxx'}headers = {
'User-Agent':'xxx'}resp = requests.get(base_url.format(t=int(time.time()*1000), snstime=int(time.time())), headers=headers, cookies=cookies)jsondata = resp.json()data = jsondata.get("data")feeds = data.get('feeds')feedId = ''path = os.getcwd()+"/laozichuanqi.csv"csvfile = open(path, 'a+', encoding='utf-8', newline='')writer = csv.writer(csvfile)writer.writerow(('name', 'description'))feedId = ''for feed in feeds: feedId = feed.get("feedId") name = feed.get("name") description = feed.get("description") print(name+"--"+description) writer.writerow((name, description))# print(feedId)url = base_url+"feedId={feedId}"for i in range(105): realurl = url.format(feedId=feedId, t=int(time.time()*1000+random.random()*1000), snstime=int(time.time()+random.random()*100)) resp = requests.get(realurl, headers=headers, cookies=cookies) jsondata = resp.json() data = jsondata.get("data") feeds = data.get('feeds') print(feedId) print(len(feeds)) print(realurl) time.sleep(15) # exit() if data.get("counts") == 0: break for feed in feeds: feedId = feed.get("feedId") print(feedId) name = feed.get("name") description = feed.get("description") print(name + "--" + description) writer.writerow((name, description))csvfile.close()

 

以上代码有些问题:

例如,爬取会循环,不再继续往下爬。

 问题查找中。。。

 

未完待续。。。

 

转载地址:http://bwvaa.baihongyu.com/

你可能感兴趣的文章
Linux在应用层读写寄存器的方法
查看>>
【转】 Class.forName()用法及与new区别 详解
查看>>
ubuntu 删除自带软件的方法
查看>>
复杂可编程逻辑器件CPLD的基本结构
查看>>
mybatis下的分页,支持所有的数据库
查看>>
Spring AOP中级——应用场景
查看>>
扩展Microsoft Graph数据结构(开放扩展)
查看>>
BZOJ 4236~4247 题解
查看>>
maven学习(上)- 基本入门用法
查看>>
《算法导论》读书笔记(二)
查看>>
可设置指定时间自己主动消失的 MessageBox实现
查看>>
Two Heads Are Often Better Than One
查看>>
Expo大作战(四)--快速用expo构建一个app,expo中的关键术语
查看>>
java okhttp发送post请求
查看>>
分享个好玩的算法游戏
查看>>
自学Java-数据类型
查看>>
cisco认证追踪,认证查询
查看>>
如何格式化日期显示
查看>>
thinkphp控制器获取参数
查看>>
cloudera-manager和CDH5.6.1升级到5.13.0
查看>>