怎么建设自己网站的后台,川沙网站建设,竞价单页网站制作,网络营销论文5000字【从零开始制作 bt 下载器】一、了解 torrent 文件写作背景了解 torrent 文件认识 bencodepython 解析 torrent 文件解密 torrent 文件结尾写作背景
最先开始是朋友向我诉说使用某雷下载结果显示因为版权无法下载#xff0c;找其他的下载器有次数限制#xff0c;于是来询问我…
【从零开始制作 bt 下载器】一、了解 torrent 文件写作背景了解 torrent 文件认识 bencodepython 解析 torrent 文件解密 torrent 文件结尾写作背景
最先开始是朋友向我诉说使用某雷下载结果显示因为版权无法下载找其他的下载器有次数限制于是来询问我是否能自己制作一个 bt 下载器。
都问到门儿上来了是男人就不能退缩。我答应下来并开启这个专栏。让我们一点点解开 P2P 的面纱制作一个属于自己的 bt 下载器吧
因为能力有限所以如果出现 措辞不当 、解释不通 等 情况烦请各位大佬在评论区指出
了解 torrent 文件
首先让我们来看看传说中的 torrent 文件中都包含了什么信息随便找了个举例子直接 ‘rb’ 读取如下图所示。 我们可以发现一些规律文件都是以 d 开头后边数字然后冒号再一些字符这就是 bencode 。
认识 bencode
bencode 编码用来进行信息描述包括四种数据类型以 python 数据类型作为参照来说就是 strintlistdict 。
str 字符类型格式是 【Length】:【String】 就是这个字符串的长度一个冒号该字符串。我们就很容易读取字符串如果碰到数字后边跟了个冒号那么就读取这个数字长度即为我们要的字符串。int 整数类型格式是 i【int】e 就是以字符 i 开头e 结尾中间是数字而其中的数字即为所求。list 列表类型格式类似于整数类型和整数类型的差别就在于是以 l 开头而其中的内容可以是字符串、整数、嵌套列表可以在读取到 l 、判断为列表时对其中的内容进行递归获取列表中的每一个元素。dict 字典类型格式也类似于列表类型只不过是以 d 开头其中的内容就要以键值对的形式读也就是先读到的元素作为键后边一个元素作为值然后再开启下一个键值对。
python 解析 torrent 文件
看过了 bencode 是不是觉得很简单那现在就用 python 对 torrent 文件进行解析吧看看里边都有什么内容。
倒是有现成的库 bencode 但我尝试后发现每个元素都是 bytes 类型也有可能是我哪里没有设置导致的吧我还是想将可以转化的都转化一下所以最后决定自己写一个。
直接上代码。
def tdecode(fread, dtypeNone):# 初始化变量length bif dtype in [str, int]:data belif dtype list:data []elif dtype dict:key bdata {}elif dtype is None:passelse:raise ValueError(fInput param dtype {dtype} is invalid, valuable: [str, int, list, dict].)# 对文件进行读取while True:# 每次读取一个字符c fread.read(1)# 以特定字符作为起始的较为特殊的类型d_list {bi: int, bl: list, bd: dict}if c in d_list or c b::# 如果属于上述特殊类型则进行递归并获取递归结果# 否则为字符串类型直接读取 length 字节current tdecode(fread, d_list[c]) if c in d_list else fread.read(eval(length))length b# 将字节转为字符串其余类型不变# 也可能碰到 hash 值无法解码直接存储字节流try:current current.decode() if isinstance(current, bytes) else currentexcept:pass# 如果当前类型是字符串或者整数类型直接返回if dtype in [str, int]:return current if dtype str else eval(current)# 列表类型直接加入列表elif dtype list:data.append(current)# 字典类型需要判断是否有键没有的话就设置有的话将键值对加入字典elif dtype dict:if not key: key currentelse:data[key] currentkey b# 针对所有数据为一个大字典如果变量 data 不存在则返回变量 currentelse: return data if data in locals().keys() else current# 如果是数字 0-9 或者数字的负号则记录到 length 变量中可能代表字符串的长度也可能代表整数类型elif 48 ord(c) 57 or (c b- and dtype int):length c# 类型结尾符整数类型就 eval 后返回列表和字典直接返回elif c be:if dtype int: return eval(length)else: return dataelse:pass这个函数接受两个参数
第一个就是使用 open 函数以 rb 模式打开的 _io.BufferedReader 对象注意一定要是 rb 打开因为其中存储的 hash 值无法解码直接使用 r 读取会报错。第二个就是当前要读取的元素的类型初始的话 None 就好了。
P.S. 先开始我想的是构造一些变量对当前读取到的元素进行存储四种类型都要存储但因为有嵌套关系的存在我放弃了直接拿同一变量存储很多元素因为很多时候不知道会嵌套多少层写起来比较麻烦所以就写了个函数利用函数递归来区分不同层次的元素。
解密 torrent 文件
我们这时候就可以比较方便地看看 torrent 文件中到底存储了什么数据。下面是开头那两个 torrent 文件解析后的结果。 可以看到键有 announce-listcommentinfo 等等info 又是一个字典包含了一些信息这些都在后边的文章中解释有什么作用。
这样解码的工作就完成了。 结尾
有想要一起学习 python 的小伙伴可以 私信我 进群哦。
以上就是我要分享的内容因为 学识尚浅会有不足还 请各位大佬指正。 有什么问题也可在评论区留言。