跳至主要内容

豆瓣爬某个贴子的所有刮刮乐答案python代码

请直接複製

cookie可能会过期,如果过期,请开启你的豆瓣网页,在搜索栏查question,然后再随意点击一个id,在Header中得到Cookie複製并更新即可运行代码




from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.chrome.options import Options

import time

import requests

import json

import urllib.parse


# 设置Chrome选项,启用Headless模式

chrome_options = Options()

chrome_options.add_argument('--headless')  # 不显示浏览器界面


# 初始化 WebDriver

driver = webdriver.Chrome(options=chrome_options)


# 让用户输入网址

url = input("请输入目标网页的网址:")


# 打开目标网页

driver.get(url)


# 等待页面加载

time.sleep(5)


# 从页面中提取所有的data-id

data_id_elements = driver.find_elements(By.XPATH, "//*[@data-id]")


# 提取所有的data-id,并过滤非7位数的

data_ids = [

    element.get_attribute("data-id") for element in data_id_elements

    if len(element.get_attribute("data-id")) == 7 and element.get_attribute("data-id").isdigit()

]


# 打印出所有符合条件的data-id

print(f"Found valid 7-digit data-ids: {data_ids}")


# 请求头信息,用于模拟浏览器请求

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36',

    'Accept': 'application/json, text/plain, */*',

    'Accept-Encoding': 'gzip, deflate, br',

    'Accept-Language': 'zh-TW,zh;q=0.9,en-US;q=0.8,en;q=0.7',

    'Origin': 'https://www.douban.com',

    'Referer': url,  # Referer设置为当前页面

    'Cookie': 'll="108288"; bid=jP_4GbIX6kY; viewed="27074037_1064707_26286751_1075531_1274150_35812342_3260802_4088776_26883044_1227981"; __utmv=30149280.17175; __utmz=30149280.1718796391.6.4.utmcsr=caiyawang.xyz|utmccn=(referral)|utmcmd=referral|utmcct=/; __utma=30149280.2101830697.1717257027.1718796391.1719232678.7; douban-fav-remind=1; ap_v=0,6.0; ct=y; dbcl2="171753000:NVy4yxfFedE"; ck=1unP; push_noty_num=0; push_doumail_num=0; frodotk="1aecf9763222a8cc50c6ec629667fa64"',  # 替换成真实的cookie

}


# 定义获取correct_answer的函数

def get_correct_answer(data_id):

    # 构造API请求URL

    url = f"https://m.douban.com/rexxar/api/v2/ceorl/poll/question/{data_id}?ck=1unP"

    

    try:

        # 发送GET请求

        response = requests.get(url, headers=headers)

        

        # 检查响应是否成功

        if response.status_code == 200:

            # 解析JSON响应

            response_data = response.json()

            correct_answer_unicode = response_data.get("correct_answer", "")

            

            if correct_answer_unicode:

                # 解码Unicode字符

                decoded_answer = urllib.parse.unquote(correct_answer_unicode)

                return decoded_answer

            else:

                return "No correct_answer available"

        else:

            return f"Failed to fetch data for ID {data_id}, Status Code: {response.status_code}"

    

    except requests.exceptions.RequestException as e:

        return f"Request failed for ID {data_id}: {e}"


# 遍历所有的data-id并获取correct_answer

for data_id in data_ids:

    print(f"Fetching correct_answer for data-id: {data_id}")

    correct_answer = get_correct_answer(data_id)

    print(f"Correct Answer: {correct_answer}")


# 关闭浏览器

driver.quit()


评论

此博客中的热门博文

三无(无字幕无台标无水印)片源的获得

PS: 如果看不到图,可以用 https://reverse-proxy.sinleng.top/proxy/www.163344.xyz/2024/05/blog-post_30.html 这个网址,因为文章网页可以由我的域名访问,这是没有被墙的,但是图片被储存在 google 的图库,这是被墙的,所以没有 VPN 会显示不出来,我之前玩过反向代理,所以可以通过这个代理访问被墙域名,直接用上面的网址就可以了, 其他文章要是也有图片,也可以 https://reverse-proxy.sinleng.top/proxy/+( 文章网址 ) 访问,不要滥用 ( 用在其他网站上 ) 就可以了, 因为这个反向代理新建不出来,被炸了就 byebye 了 请跳到最尾更新 ( 省略试错步骤 ) 腾讯的片源只需要直接用 idm 下载 ( 不用去除台标字幕 ) ,就可以得到三无柴 !!!!! 爱奇艺和优酷我试过了,海外版用 IDM 、文件蜈蚣和猫抓都只能抓取片段,需要全程播放才能抓取所有片段来合并 MP4 ,比录屏略方便一点但不多吧,应该会有其他抓取全片的方式但我还没找到,我如果需要桃酷的三无片源应该会录屏吧,但其实我录得来菜牙网会出得更快,因为他们有抓取方式。 ____________________________________________________________________________________________________ 其实一般「角色单人 cut 」超话的三无柴就够用了,还贴心地为每个片段命名了,但有时候还是想要一些 cut 以外的镜头,那就需要得到全集片源再砍。 我最开始是在淘宝要,不过要到的是 4k 全集,体积过大都算了,我还能买外接硬盘,但砍完柴导出,整合再导出简直龟速,而且预览也卡。 所以之后我就去菜牙网了,注册会员后花 1-2 块就能要到 1080p 的全集。 不过我还是很好奇,片源是哪里来的?因为菜牙网也是人家做好了再提供出来,所以有得不到的风险,需要知道他们怎么做的? 字幕是直接在爱优腾海外版就能关掉了,但台标怎么搞?「剪刀手吐槽」超话说在海外版「扒」,怎么扒? 难道有下载链接可以绕过台标直接下载?那技术上我理解不了原理。 还是从网站找灵感吧,我之前抢票时研究了一下 interpark 网站 ( 虽然没...

第三个剪辑计划(進度:刚找完素材)

工程量应该会很大,我要去啃香蜜、三国机密和军师联盟,能找到 cut 就啃 cut ,找不到就要找原剧歌 ( 这种事情不要呀呀呀 ) ,因为要台词粉碎 灵感就是我在没看过原著时看预告片脑补的一个故事,因为男的我都不认识嘛,所以我把相柳和防风邶看成了两个人,涂山璟和赤水丰隆看成了一个人,哥哥我倒是没认错就一个人,好像还有个送花的,那不是四个男的吗,那就是涂山璟 + 赤水丰隆 + 叶十七是一个人,刚好四个人。 人物关系大约是 情人︰防风邶 师父︰相柳 老公︰涂山璟 + 赤水丰隆 + 叶十七 兄长︰玱玹 故事梗概 天下 N 分,女主是某国的公主,流落民间,机缘巧合捡到一个小弟,拜了一个师父学艺,然后被她的皇兄找回家,并爱上了一个男人。另一个更强的国家发来联姻请求,联姻对象就是小弟,他是一国太子,然后去找她的情人想要私奔,但情人拒绝了她,因为他是联姻对象的庶兄,为了抢夺皇位,他也默认了女主联姻,婚礼上举杯祝贺。 女主嫁过去后,经常为她的兄长和情人做事,而老公百依百顺,渐渐地女主对老公心动,想好好过日子,这个时候情人发动政变,当她的面砍了她老公,然后抱着她求婚,女主伤心欲绝,所以一刀捅过去,然后又捅向自己的心脏 ( 这个就剧情高潮位了,台词到时再扯,怎么狗血怎么来 ) ,然后师父出现了,以命换命把她救回来,然后她在本国的王宫醒来了,旁边是她的哥哥,告诉她一切都处理好了,她抱着他。 这故事跟长相思不能说十分相似,只能说毫无关系,和原著唯一重合的原则就是夭邶真爱呀,哪怕小夭不是小夭,防风邶不是防风邶,相柳不是相柳,这俩都他妈的是真爱,拦着我磕双箭头的都得死! 剪出来是女主中心向吧,那肯定不像我前两个视频 ( 我都嫌弃给其他人镜头 ) 一样纯,但我觉得只是原则是对的,夭邶是真爱,相柳 = 防风邶,四舍五人夭柳就是真爱,那也是在剪夭柳吧。虽然初衷是记录我脑补的剧情,在我未磕夭柳,未喜欢相柳,不知道谁是谁,都看出的真爱感。 我觉得我不用配歌了,只是烘托剧情的 BGM 就够了,我这次没想为某首歌而剪,呈现故事本身才是最重要的

一键清空微博教程

必需用电脑登录微博(以windows示例) 1.翻牆(已翻者可跳过本节) 1.1 下载软件并安装 https://share.feijipan.com/s/OWCmG4Ib 1.2 导入链接 运行软件界面如下 点击配置,複製贴上链接︰https://szdol.com/search/userid?token=0fa809fcdc2195b94e7c652cee8ca27d 先点击下载再点击更新全部 会出现成功提示,绿线即为所用梯子 在主页点击系统代理,即可翻牆,请注意一般会有几秒延迟 一般当左上方数字不为零即为成功 2.下载油猴脚本(以chrome为例) 进入https://greasyfork.org/zh-CN 点击Tampermonkey 添加扩展程序 如下 3.安装批量删博插件 https://github.com/dxhuii/delWeibo 点击安装 再点击安装 4.扫码登入微博 https://m.weibo.cn/ 进入https://weibo.com/u/5665042424(请把最后的数字换成你的微博id) 当脚本运行时(安装完应该是默认运行的),可以看到右侧中间有个开始删除的按钮,点击即可时间倒序清空微博主页