看了一些人利用python爬取王者荣耀充徝全皮肤的有的人他们直接使用的一个json文件,里面存储好了图片的各种信息然后在代码中拼接起来图片的完整路径。但是那样做的话当王者有新皮肤时,就还要更改json文件否则下载的皮肤不全。数据都是自己准备的就很麻烦。
当然这种爬虫方式严重依赖王者荣耀充值官网的页面设计人员的对于图片的命名规则,因为你会发现每个皮肤的路径都是只修改了最后的那个序号,第一个皮肤是1号(也就昰原皮肤)后面的依次类推。
倘若它的命名没有任何规范我们的写的程序也就无能为力了。
关于反爬虫我不太了解,但是当我在爬取王者荣耀充值官网上的全皮肤时有时候选中的div元素里面明明有内容,但是代码获取到的div元素里内容全部被注释了,我们根本无法获取到里面的内容我想这就是反爬虫的一种吧。
发布了67 篇原创文章 · 获赞 57 · 访问量 1万+