下你所需,载你所想!
汇集开发技术源码资料

图片全自动采集优化速度整理规划目录源码

:9.815KB :1 :2019-12-21 07:28:37

部分简介

修复:上次的问题修复!
1·增加 回调下载 ,编写了 命令插件代码 快速下载。
2·修复了 创建文件夹 的 特殊字符 失败问题。
3·不会更新了…… 2.1GB 十几多分钟采集完成! 849个文件夹 共计图片超过6000张 其中 PNG格式 占多数~

网页 = 编码_URL解码 (到文本 (返回网页), 真)
正则.创建 (#网页正则, , )
结果 = 正则.搜索全部 (网页, )
.计次循环首 (取数组成员数 (结果), b)
调试输出 (结果 [b].取子匹配文本 (1), 结果 [b].取子匹配文本 (2))
' 暂停 ()
返回网页 = HTTP读文件 (域名 + 结果 [b].取子匹配文本 (1))
网页 = 编码_URL解码 (到文本 (返回网页), 真)
调试输出 (域名 + 结果 [b].取子匹配文本 (1))
' /pic/chinacos/2018/0104/59120.html
二级 = 取文本左边 (结果 [b].取子匹配文本 (1), 倒找文本 (结果 [b].取子匹配文本 (1), “/”, , 假))
页 = 取中间 (网页, “共”, “页”)
页数 = 取中间 (网页, “下一页”, 真)
调试输出 (页, 页数)
ss = 分割文本 (页数, “_2”, 2)
' “59120_2.html”
目录 = 保存目录 + 结果 [b].取子匹配文本 (2) + “\”
创建多级目录 (目录)
调试输出 (目录)
.计次循环首 (到整数 (页), c)
.如果 (c = 1)
返回网页 = HTTP读文件 (域名 + 二级 + ss [1] + ss [2])
.否则
返回网页 = HTTP读文件 (域名 + 二级 + ss [1] + “_” + 到文本 (c) + ss [2])
.如果结束
' 暂停 ()
图片地址 = 取中间 (到文本 (返回网页), “ image = HTTP读文件 (域名 + 图片地址)
.判断开始 (取字节集左边 (image, 4) = 到字节集 (“塒NG”))
后缀 = “.png”
.默认
后缀 = “.jpg”
.判断结束
写到文件 (目录 + 到文本 (c) + 后缀, image)
处理事件 ()
.计次循环尾 ()
处理事件 ()
.计次循环尾 ()
处理事件 ()

图片全自动采集优化速度整理规划目录源码

热门推荐

相关文章