• 当前标签:正则替换

程序开发 js正则表达式 URL格式匹配 http替换成https

URL格式: protocol :// hostname[:port] / path / [;parameters][?query]#fragment [;parameters]没见过 这里就不做相关匹配了 代码: 'use strict'; { // URL地址匹配格式: protocol :// hostname[:port] / path / [;parameters][?query]#fragment // [;parameters]:这都没见过这东西,就不匹配了。 let url = [ 'https://www.baidu.com/', 'http://192.168.1.1', 'http://192.168.1.1:8080', 'https://news.163.com/18/1224/15/E3Q6EJDA0001875N.html#top', 'https://baidu.com:80/?wd=wq&url=ksks#ddsx2', 'http://192.168.1.1/p/#name', 'https://neets.cc/subcriberlist?recommendInventoryId=QNZfMjCRQtS4z8MQrFa7qo' ] , result = null , matcht = /^(https?:\/\/)([0-9a-z.]+)(:[0-9]+)?([/0-9a-z.]+)?(\?[0-9a-z&=]+)?(#[0-9-a-z]+)?/i , info = ['完整URL', '协议', '地址', '端口', '路径', '查询', '锚点'] url.forEach((value) => { result = matcht.exec(value); console.log('---------------------------------------------------------------------------------'); for (let i = 0; i < result.length; i++) { console.log(`${info[i]} = ${result[i]}`); } }) } 协议匹配规则 常见URL协议有http、https等等,所以这里就做针对http和https的匹配。 匹配规则 :^(https?:\/\/) 主机名匹配规则 主机名格式为:xxx.xxx.xxx 或 xxx.xxx 2种形式 由字母或数字组成。 如:www.baidu.com baidu.com 127.0.0.1 匹配规则为:([0-9a-zA-z.]+) 端口匹配 端口部分是由冒号开头后接数值两部分组成而且web默认端口80是不显示在后面的,所以就有2种情况存在或不存在。 如:127.0.0.1:8080 127.0.0.0 匹配规则为:(:[0-9]+)? 路径匹配 路径是由字母、数字、斜杠、点组成。在访问网站首页时后面没有路径地址,所以这块如果存在就匹配。 如:/xxx/xxxx/xxx.html 、 /xxx/xxx 匹配规则为:([/0-9a-zA-Z.]+)? 查询字符串匹配 查询字符串的格式为:?xxx=1&ddd=2 或 ?xx=2。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。 匹配规则为:(\?[0-9a-zA-Z&=]+)? 信息片断匹配 信息片断是由#、字母、数值组成。由于这块不是必须项所以在匹配时,如果存在就匹配,不存在就算了。 匹配规则为:(#[0-9-a-zA-Z]+)?   匹配替换http为https: function urlConversion(path) { let reg = /^(https?:\/\/)([0-9a-z.]+)(:[0-9]+)?([/0-9a-z.]+)?(\?[0-9a-z&=]+)?(#[0-9-a-z]+)?/i path = path.replace(reg, "https://$2$3$4$5$6"); return path } 其中url地址根据需要匹配 文章来自:破壳而出的蝌蚪

2019-03-17 11:58:57 216 0 0
阅读详情
  • 1
前往