瑞数绕过方法说明文档¶
本说明文档用来说明绕过瑞数的一些方法,主要介绍了
splash和Sekiro rpc解决的方式
1. 前提条件¶
需要提前安装工具和配置对应环境至系统环境
- 需要安装油猴 (Tampermonkey) 插件

图示:浏览器版本对应油猴下载地址列表
- 需要安装
jdk,Maven等。具体根据Sekiro中运行build_demo_server.sh的报错提示来确定
2. 解决方法¶
2.1.无脑类方法¶
此板块下的方法用于快速开发,减少掉头发的情况,减少调试中的键盘和鼠标的损耗。
2.1.1. Docker + Splash 类方法¶
使用
splash来定时请求目标网址,来维护最新cookie。即可使用此cookie请求到正常数据。
具体请在 confluence 开发文档 Splash 的配置和接入文档说明 中查看,这里略。
2.1.2. Sekiro 类方法¶
此方法是通过 rpc 的理念来实现的,只是 Sekiro 是通过油猴插件来 hook cookie 值并通过 websocket 传值。有了此轮子,减少了自己修改注入 js 和本地替换的步骤,本质还是一样的。具体实现方式看自己选择。
具体更详细的内容请查看 sekiro 的官方文档。
-
安装依赖:安装好依赖工具
jdk,Maven等 -
构建:如果嫌麻烦,就直接看 demoServer编译和部署 部分,直接使用官方构建好的 windows 版本
-
运行:运行启动脚本
bin/sekiro.sh:mac or linuxbin/sekiro.bat:windows
-
油猴插件编写及与开启
-
直接在 js rpc 及 Sekiro 的使用 中 ”完整的油猴脚本“ 之后的部分开始即可。
只需要修改框住的代码为目标网址的标识即可,若想将插件通用化和更健壮,需要更改 executeJs 相关的代码。

油猴插件编写规则
-
插件添加到油猴并开启,并记得关闭
cookie中HttpOnly选项
油猴插件编写界面

关闭 HttpOnly 选项

油猴插件保存并开启
-
运行目标网址即可

目标网址页面输出

py 与目标网址交互获取 ck
2.2. js 扣代码 + 补环境类方法¶
此方式较麻烦,我只生成到第二个
cookie值第一次生成的地方。真正更新ck的逻辑还没调试出来,一直没再搞了。具体也应该有方便调试和运行的方法,可以看看爬虫术与道的公众号的文章,可能会有思路,有时间再搞下。
暂略
2.3. 其它骚操作¶
解决瑞数的方式不止有上面的方式,还有根据以上衍生的类似解法,欢迎讨论和补充。
可能还有其它优雅的方式来绕过和解决,欢迎补充。
3. 参考文档及补充¶
-
贴个运行成功图(已经测试过多个瑞数的网站,都可以成功运行)

py 运行测试成功图