【Python 实战】Python 采集情感音频
成年人的世界真不容易啊
总是悲伤大于欢喜
爱情因为懵懂而快乐
却走进了复杂和困惑的婚姻
前言
我最近喜欢去听情感类的节目,比如说,婚姻类,我可能老了吧。我就想着怎么把音乐下载下来了,保存到手机上,方便我们业余时间去听。
发送请求
首先,我们要确定我们的目标网址,我们想要获取到每一个音频的地址。
我们发送请求,获取网页源代码。我们相信大家这里的代码都会写了。
requests
是 Python 的一个内置模块,用于发送 HTTP 请求。在这个例子中,我们使用 requests.get()
函数向 https://www.ximalaya.com/album/37453303
发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。
获取数据
re.findall()
函数用于在字符串中查找所有匹配的子字符串。在这个例子中,我们使用 re.findall()
函数查找了响应体中的 tracks
字符串,并使用切片 [1]
取出了子字符串列表。
子字符串列表中的第一个元素就是我们要找的 tracks
字符串。我们将其存储在 info_list
变量中,并使用 print()
函数输出。
我们发现,我们想要的数据,就在我们匹配的内容中。里面包含了每一个音乐的标题和其 id,我们接下来把这个获取下来。
注意,这里,不是 json 数据,所以,我们只能正则去匹配。
解析数据
我们通过对比 url 发现,我们只需要拿到 uid,就可以直接访问到音频。这里就不多解释。
我们只需要把 trackID 换掉,就可以了。请求上面的 url,就可以拿到音频的地址。接下来,我们写代码。
zip()
函数用于将两个列表合并成一个列表。在这个例子中,我们使用 zip()
函数将 trackIds
和 titles
两个列表合并成一个列表,并将其存储在 trackIds
变量中。
然后,我们将 trackId
和 title
转换为字符串格式,并将其存储在 audio
变量中。
接下来,我们使用 requests.get()
函数向 audio
发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。最后,我们使用 json()
方法将响应体中的 data
字段转换为 JSON 格式,并使用 ['data']['src']
取出了 src
属性,即 audio_url
的值,并将其存储在 audio_url
变量中。
保存数据
接下来,我们请求这个网页,保存二进制到本地。with open()
语句用于自动关闭文件,确保文件在使用完毕后被正确关闭。在这个例子中,我们使用 with open()
语句打开一个名为 music//
+ title
+ .mp3
的文件,并将其保存到变量filename
中。
然后,我们使用 write()
方法将音频内容写入文件中。
总结
这是一个关于如何下载音乐并保存到手机的 Python 代码实战。我们首先确定我们的目标网址,然后使用requests.get()
函数向该网址发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。
在请求成功后,我们使用json()
方法将响应体中的 data
字段转换为 JSON 格式,并使用['data']['src']
取出了 src
属性,即 audio_url
的值,并将其存储在 audio_url
变量中。
我们请求网页,保存二进制,就可以保存了。
版权声明: 本文为 InfoQ 作者【BROKEN】的原创文章。
原文链接:【http://xie.infoq.cn/article/39a136deae09f306839e4ed23】。文章转载请联系作者。
评论