Skip to content

1368129224/NeteaseCloudMusicSpider

Repository files navigation

NeteaseCloudMusicSpider

初学Python时期的代码,逻辑流程语法皆有不足,请谅解。

初学Python时期的代码,逻辑流程语法皆有不足,请谅解。

初学Python时期的代码,逻辑流程语法皆有不足,请谅解。

网易云音乐爬虫

使用NeteaseCloudMusicApi+requests原生爬虫,数据存入MySql,并进行简单的数据分析及可视化。

网易云音乐网页端是动态网页需要使用Selenium/PhantomJS进行爬取。由于时间和技术问题,项目直接从API爬取数据。采用第三方API服务,它对官方API进行了整理及封装,方便使用,API文档

感谢NeteaseCloudMusicApi项目及项目贡献者。


食用指南

  1. 安装node js
  2. git clone https://github.com/Binaryify/NeteaseCloudMusicApi
  3. git clone https://github.com/1368129224/NeteaseCloudMusicSpider
  4. 取消NeteaseCloudMusicApi\util\request.js第42行注释。
  5. 在NeteaseCloudMusicSpider目录中pip install -r packages.txt
  6. 复制NeteaseCloudMusicSpider\config.sample.py为config.py,并按实际修改。
  7. python run.py

爬取成果

数据库

50张评论表、歌手粉丝表、歌手表、热门歌曲表。

167705的评论

由于网易云音乐官方API限制,每首歌只能获取最新和最旧各5100条评论,每首歌大约10k条评论。

5771的粉丝信息

歌手粉丝表

5771的热门歌曲

热门歌曲表

幻听词云

幻听 词云

粉丝分布热力图

粉丝分布热力图

About

网易云音乐爬虫

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published