将Jsoup请求得到的Document中的相对路径转换为绝对路径
在后端开发时经常在HTML页面使用相对路径,然而这个对于爬虫来说有时候却很难受,虽然Jsoup提供了.attr("abs:href")用来来获取绝对路径,但还是不够方便。 在HTML中href跟src是这两个属性是用来填url的,也是我们需要处理的地方,相对路径一般是/,./,....
阅读(192)评论(1)赞 (0)
在后端开发时经常在HTML页面使用相对路径,然而这个对于爬虫来说有时候却很难受,虽然Jsoup提供了.attr("abs:href")用来来获取绝对路径,但还是不够方便。 在HTML中href跟src是这两个属性是用来填url的,也是我们需要处理的地方,相对路径一般是/,./,....
阅读(192)评论(1)赞 (0)
Spring框架中提供了一个用于HTML字符转义的工具类org.springframework.web.util.HtmlUtils,使用方式如下代码:
阅读(180)评论(0)赞 (0)
在基于SpringBoot开发时经常使用<skipTests>true</skipTests>跟<maven.test.skip>true</maven.test.skip>跳过单元测试,如下: 二者的根本区别在于<skipT...
阅读(165)评论(0)赞 (0)
@supports:起源 不同的浏览器对Web页面的解析都是不一样,为了让Web页面在这些浏览器下渲染达到基本一致的情况,给用户更好的体验,我们必须为他们写不同的样式代码。 不同特征的检测方法我们早期都是依赖于javascript来检测,后来通过第三方js库Modernizr来完...
阅读(140)评论(0)赞 (0)
阅读(213)评论(0)赞 (0)
主要是用到了bat当中的goto跟for这两个命令,goto实现死循环,for实现遍历bat所在文件夹下的jar文件并启动,以下代码实现了一直运行所在文件夹下的Fuck*.jar,如果要用指定的jre运行jar包,可以将call %~dp0\jre\bin\java.exe -j...
阅读(144)评论(0)赞 (0)
可用于获取随机id,端口号等场景。
阅读(201)评论(0)赞 (0)
在做网银爬虫时用swt处理密码控件,做成web服务供外部调用,时间一长总会跪掉,控制台显示 org.eclipse.swt.SWTError no more handles然后java进程就没了,这个错误,注意是错误,不是异常!!!翻译过来就是句柄用完了,那么如何让程序知道自己到...
阅读(149)评论(0)赞 (0)
在Idea中使用效果: 具体settings.xml代码: 我是用aliyun跟huawei做的例子,可以根据自己的需要去改,我是公司内网repository+aliyun这样不在公司时便可以使用aliyun
阅读(151)评论(0)赞 (0)
NextCloud官方提供了docker镜像,官方GitHub:https://github.com/nextcloud/docker ,我使用的是如下命令: 我是用了SQLITE,官方还支持环境变量配置MYSQL跟PostgreSQL、设置NextCloud用户信息等。 在服务...
阅读(139)评论(0)赞 (0)