吴思奇的个人博客(⁄ ⁄•⁄ω⁄•⁄ ⁄)~

分类 Python 下的文章

07月 13

Python利用winreg模块获取Windows的桌面路径

最近想把爬虫的数据保存在桌面。

Windows的桌面路径一般为 C:\Users\你的用户名\Desktop
直接拷贝绝对路径的话,考虑到如果换了电脑或者把代码给别人运行,用户名或者盘符不一样而导致路径无效的问题。所以还是不能图方便把路径写死。
winreg作为Python内置的注册表操作库,将Windows注册表API暴露给了python,根据注册表进行获取桌面路径。

关于winreg,可以参考:

https://docs.python.org/zh-cn/3/library/winreg.html

import winreg
def get_desktop_path():
  key = winreg.OpenKey(winreg.HKEY_CURRENT_USER,r'Software\Microsoft\Windows\CurrentVersion\Explorer\Shell Folders')
  return winreg.QueryValueEx(key, "Desktop")[0]
print("当前桌面路径为:",get_desktop_path())
执行结果如下:

111.jpg

07月 13

Python爬虫UA伪装

1. User-Agent是什么

简称UA,中文名为用户代理。它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。网站可以通判断 UA 来给不同的操作系统、不同的浏览器发送不同的页面,对于爬虫来说,UA就是标明身份的第一层标识。User-Agent是请求头的一部分。会告诉网站服务器,访问者是通过什么工具来请求的,如果是爬虫,一般网站会认为是非法请求,直接会拒绝访问,如果是用户浏览器,就会正常应答。

UA伪装:让爬虫对应的请求载体身份标识伪装成某一浏览器。

以Edge浏览器为例,Edge的User-Agent为

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.5060.53 Safari/537.36 Edg/103.0.1264.37

获取Edge的User-Agent也很简单,地址栏输入edge://version/ 就能看到。
edge-ua.jpg

阅读全文 >>