写点什么

【Python 实战】Python 采集情感音频

作者:BROKEN
  • 2023-05-01
    安徽
  • 本文字数:1609 字

    阅读完需:约 5 分钟

【Python实战】Python采集情感音频

成年人的世界真不容易啊


总是悲伤大于欢喜


爱情因为懵懂而快乐


却走进了复杂和困惑的婚姻

前言

我最近喜欢去听情感类的节目,比如说,婚姻类,我可能老了吧。我就想着怎么把音乐下载下来了,保存到手机上,方便我们业余时间去听。

发送请求

首先,我们要确定我们的目标网址,我们想要获取到每一个音频的地址。



我们发送请求,获取网页源代码。我们相信大家这里的代码都会写了。


url = 'https://www.ximalaya.com/album/37453303'
headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',}
res = requests.get(url,headers=headers)
复制代码


requests 是 Python 的一个内置模块,用于发送 HTTP 请求。在这个例子中,我们使用 requests.get() 函数向 https://www.ximalaya.com/album/37453303 发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。

获取数据

info_list = re.findall('"tracks":[(.*?)]', res.text)[1]print(info_list)
复制代码


re.findall() 函数用于在字符串中查找所有匹配的子字符串。在这个例子中,我们使用 re.findall() 函数查找了响应体中的 tracks 字符串,并使用切片 [1] 取出了子字符串列表。


子字符串列表中的第一个元素就是我们要找的 tracks 字符串。我们将其存储在 info_list 变量中,并使用 print() 函数输出。



我们发现,我们想要的数据,就在我们匹配的内容中。里面包含了每一个音乐的标题和其 id,我们接下来把这个获取下来。


注意,这里,不是 json 数据,所以,我们只能正则去匹配。


解析数据

我们通过对比 url 发现,我们只需要拿到 uid,就可以直接访问到音频。这里就不多解释。


audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'
复制代码


我们只需要把 trackID 换掉,就可以了。请求上面的 url,就可以拿到音频的地址。接下来,我们写代码。


for trackId, title in zip(trackIds, titles):    audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'    print(audio)    audio_res = requests.get(audio, headers=headers)    audio_url = audio_res.json()['data']['src']    print(audio_url)
复制代码


zip() 函数用于将两个列表合并成一个列表。在这个例子中,我们使用 zip() 函数将 trackIds 和 titles 两个列表合并成一个列表,并将其存储在 trackIds 变量中。


然后,我们将 trackId 和 title 转换为字符串格式,并将其存储在 audio 变量中。


接下来,我们使用 requests.get() 函数向 audio 发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。最后,我们使用 json() 方法将响应体中的 data 字段转换为 JSON 格式,并使用 ['data']['src'] 取出了 src 属性,即 audio_url 的值,并将其存储在 audio_url 变量中。

保存数据

music_content = requests.get(audio_url, headers=headers).content
with open('music//' + f'{title}' + '.mp3', mode='wb') as filename: filename.write(music_content) print(title, '保存成功')
复制代码


接下来,我们请求这个网页,保存二进制到本地。with open() 语句用于自动关闭文件,确保文件在使用完毕后被正确关闭。在这个例子中,我们使用 with open() 语句打开一个名为 music// + title + .mp3的文件,并将其保存到变量filename 中。


然后,我们使用 write() 方法将音频内容写入文件中。

总结

这是一个关于如何下载音乐并保存到手机的 Python 代码实战。我们首先确定我们的目标网址,然后使用requests.get()函数向该网址发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。


在请求成功后,我们使用json()方法将响应体中的 data 字段转换为 JSON 格式,并使用['data']['src']取出了 src 属性,即 audio_url 的值,并将其存储在 audio_url 变量中。


我们请求网页,保存二进制,就可以保存了。

发布于: 刚刚阅读数: 2
用户头像

BROKEN

关注

还未添加个人签名 2022-08-02 加入

还未添加个人简介

评论

发布
暂无评论
【Python实战】Python采集情感音频_三周年连更_BROKEN_InfoQ写作社区