Python如何实现转换URL详解

脚本专栏 2024/11/16 佚名

3 1 2

设计一个算法，将URL转换成5部分，分别是：schema、netloc、path、query_params、fragment。

问题

URL的中文名叫统一资源定位符，就是咱们常说的网址，设计一个算法，将URL转换成5部分，分别是：schema、netloc、path、query_params、fragment。

<scheme>://<netloc>/<path>"text-align: center">
应用场景


在实际应用场景中，有些聚合网站会把URL里面netloc提取出来。

分析


这里没有什么特别复杂的算法，因为每部分都有一个特别的字符，所以，如果你熟练Python的字符串操作和正则表达式使用的话那么就很简单。
知识点


字符串的常用方法split、find、join、lower、切片的使用，re模块下面的常用方法。另外还有关于如何使用 namedtuple 定义一个简单类的操作
实现


第一种方式使用字符串提供的方法，就是根据关键字符进行切分。整体思路是利用字符串的切片功能不断进行切分，代码稍显复杂。


URL = namedtuple("URL", ["schema", "netloc", "path", "params", "fragment"])
def url_parse1(url):
assert url.startswith("http")
# 初始化每部分为空
schema = netloc = params = fragment = path = None
# 从 :// 切分 url，前面部分是shema
i = url.find('://')
if i > 0:
schema = url[:i]
url = url[i + 3:]
# 获取netloc
for c in "/": # 三个分隔符的顺利很重要
a = url.find(c)
if a > 0: # 只要有三个字符中的任意字符，立即切分，前部分就是netloc，剩下的部分进行后续处理
netloc, url = url[0:a], url[a:]
break
else:
netloc, url = url, '' # 如果三个分隔符都不在url中，那么这是一个只包含
# 同样的方式获取path
for c in "":
a = url.find(c)
if a > 0:
path, url = url[0:a], url[a:]
break
else:
path, url = url or None, ''
if "#" in url:
url, fragment = url.split("#", 1)
if '"htmlcode">

def url_parse2(url):
rex = r'^(http[s]"_blank" href="https://regexr.com/" rel="external nofollow" >在线调试正则表达式


Python中正则表达式介绍, 这是一篇比较完整介绍Python中正则表达式的文章，如果你能读懂里面的每句话，并且实践后，你一定能写出上面这样的表达式出来。


当然，你也可以直接使用urlparse模块中现成的方式来实现。
以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

                                
                                
                                    python,转换URL 
                                华山资源网 Design By www.eoogi.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

华山资源网 Design By www.eoogi.com

评论“Python如何实现转换URL详解”

暂无评论...

www.eoogi.com 华山资源网

120,135影音资源

344,641技术资源

22,817软件资源

435,032站长资源

最新文章

发烧女声Méav《美芙的祈祷》发烧女声 [WAV+

2024/11/16

雷婷《我的爱回不来》紫银合金AQCD [WAV+C

2024/11/16

群星 DTS《天籁之音·唱醉了草原》2CD[WAV分

2024/11/16

魔兽世界wlk毁灭术一键输出宏是什么 wlk毁灭

2024/11/16

三国志8重制版无法与武将交流怎么办无法与

2024/11/16

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/16

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。

首次推出的GDDR7内存模块密度为16GB，每个模块容量为2GB。其速度预设为32 Gbps（PAM3），但也可以降至28 Gbps，以提高产量和初始阶段的整体性能和成本效益。
据三星表示，GDDR7内存的能效将提高20%，同时工作电压仅为1.1V，低于标准的1.2V。通过采用更新的封装材料和优化的电路设计，使得在高速运行时的发热量降低，GDDR7的热阻比GDDR6降低了70%。

更新日志

2024年11月16日

Python如何实现转换URL详解

python pandas时序处理相关功能详解

在linux下实现 python 监控usb设备信号

评论“Python如何实现转换URL详解”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

Python如何实现转换URL详解

python pandas时序处理相关功能详解

在linux下实现 python 监控usb设备信号

评论“Python如何实现转换URL详解”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存