为编程爱好者分享易语言教程源码的资源网
好用的代理IP,游戏必备 ____广告位招租____ 服务器99/年 ____广告位招租____ ____广告位招租____ 挂机,建站服务器
好用的代理IP,游戏必备 ____广告位招租____ 服务器低至38/年 ____广告位招租____ ____广告位招租____ 挂机,建站服务器

网站首页 > 易语言相关 > 网络相关源码 正文

小说站点html解析模块源码

三叶资源网 2019-02-22 13:15:15 网络相关源码 2901 ℃ 6 评论

1.模块说明

本小说解析模块,调用海绵宝宝elss6.01引擎(论坛搜elss即可)进行html解析(采用xpath表达式)

封装了一些处理小说站点html网页信息的子程序,

可以利用本模块来轻松制作一个可换源的阅读软件。


2.模块子程序自定义类型数据介绍以及制作阅读软件简单设计思路

这里将处理小说站点html信息的采集规则叫书源

书源的成员大致可分为以下几大类(具体成员名参见附件里面的【说明文件.txt】)

书源名称、书源网址、搜索网址、搜索页处理规则,书籍介绍页处理规则,目录页处理规则,章节内容页处理规则

目前采用json格式文本保存书源。(参见附件里面的【书源default.txt】)


首先在解析html前需要导入书源

也就是调用书源初始化()

通过组合框根据站点名切换书源

然后在软件搜索框输入关键字

程序根据当前书源的搜索网址,通过搜索页处理()得到搜索页信息(具体成员名参见附件里面的【说明文件.txt】)

然后双击选择某本书籍通过书籍页处理()得到书籍页,同时通过目录页处理()得到目录页信息(也就是章节名称和章节链接)

最后根据章节链接进行内容页处理()可以变成纯净的在线阅读或者根据章节链接直接下载(比如鱼刺多线程下载)

@zl2017

小说站点html解析模块源码

文件下载


来源:三叶资源网,欢迎分享,公众号:iisanye,(三叶资源网⑤群:21414575

已有6位网友发表了看法:

  • 易语言

    易语言  评论于 [2020-04-25 12:47:13]  回复

    小说网站源码html

  • 按钮

    按钮  评论于 [2020-06-05 23:40:32]  回复

    书源制作群

欢迎 发表评论:

百度站内搜索
关注微信公众号
三叶资源网⑤群:三叶资源网⑤群

网站分类
随机tag
cleverQQ机器人插件万能快递单打印MiniBlinkphp自学要多久一键备份HOOKUDP源码视频解析同程APPsign算法Linux复数计算超级编辑框上传视频百度推广引流软件快手黑话校验车辆识别号进销存系统json是用来干嘛的e2ee支持库
最新评论