JJsoupUtil

编程开发

将Jsoup请求得到的Document中的相对路径转换为绝对路径

在后端开发时经常在HTML页面使用相对路径,然而这个对于爬虫来说有时候却很难受,虽然Jsoup提供了.attr("abs:href")用来来获取绝对路径,但还是不够方便。 在HTML中href跟src是这两个属性是用来填url的,也是我们需要处理的地方,相对路径一般是/,./,../三种形式开头,所以我们要选出所有带以/,./,../开头的href或src属性的元素,这个操作可以浓缩成一个cssS...

阅读(4859)评论(1)赞 (0)