Bilibili用户爬虫
知乎专栏地址:https://zhuanlan.zhihu.com/p/24434456
本文所使用的数据可视化为 infogr.am
该爬虫仅供学习使用
bilibili_user.py
:爬虫文件bilibili_user_info.sql
:数据库文件get_face.py
:用户头像下载器演示地址:http://ursb.me/bilibili-reportGitHub:https://github.com/airingursb/bilibili-report
跪求Star Orz...
转自我的博客 B站2000万用户分析
这个男女比例是有点出乎个人预料的,接近1:1。其实之前初步抓了2013年暑假之前的数据,男女比例当时还在3:1这样。
可见明确性别的群体还是比较少的,只占了总数据的 15% 左右。
更多的分析日后再做。
具体数据不放了,简单看一下统计结果吧。
主要用户分布在93-00年的用户(大概16-23周岁),其中97年(19岁)用户占了绝对的主导地位。
事实证明,B站小学生并不多,而是高中生、大学生比较多。
90后用户占主体,但是用户年龄段正在不断后移。毕竟,是一个年轻人的网站。
主要用户分布在:广东、江苏、北京、上海、浙江等地区。都是一些经济很发达的沿海地区。
由于16年才过去2个多月,所以少一点,不过可以预见其发展必将远超2015年。自2009年开站以来,每年用户几乎都是以指数级增长。
由于B站有经验等级规则,用户的活跃度可以依据等级判断。
等级为0,就是只注册未登陆过的用户。等级为1或2,为非活跃用户。等级为3以上,就是活跃用户。其中等级为5或6的,为投稿数特别特别多、视频特别火爆的用户,为B站的主干用户(约5000人)。
关于留存率等数据,日后再统计分析。
哎- -,我也是有2个粉丝的人!
以下是B站TOP20用户。很多人都非常的眼熟哈。
注意:仅用于测试,禁止非法使用 python代码 在所在文件夹创建文件夹download 暂时只支持bv号 下载文件是flv格式的,如需转成mp4可以用ffmpeg 要安装requests模块 pip安装 pip install requests import json import requests import time import os def get_url_bv(bv): h
获取系列视频信息:(名称+请求地址) urls = [] names = [] bv_num = "这里是需要下载视频的BV值" def get_tilt(): http = "https://www.bilibili.com/video/%s?p=%s" try: url = "https://www.bilibili.com/video/%s" % bv_num response
9月28日更新 b站视频失效已经有一段时间了,非常抱歉一直没有处理。前段时间将视频全部上传了阿里云盘,在b站动态发布了,但是似乎看动态的人不多。更新一下 GitHub ,先暂时顶着吧,体验和b站无异,只是没有弹幕 �� 阿里云盘链接 https://www.aliyundrive.com/s/d3WQCUgj1L2 �� 对 b 站视频 的附带资料(如课件、源代码等)进行备份,防止云盘链接失效。
Bilibili Evolved 是一个强大的哔哩哔哩增强脚本。在此查看功能。 安装 需要浏览器装有 Tampermonkey 或 Violentmonkey 插件, 下方表格中挑一个链接安装。 注意事项 做好觉悟, 脚本开启后不能使用弹幕点赞和举报, 全景视频不能用鼠标拖拽视角(只能用键盘操作), 对性能也有较大影响. 新版本一旦正式发布, 就不再对旧版本做任何技术支持. 使用外部网站的链接时(
Bilibili-Night 是 Bilibili 网页端的深色模式 Chrome 扩展程序(插件),适用于 [Chromium](https://www.chromium.org/) 内核的所有浏览器(Google Chrome、QQ浏览器、360浏览器、搜狗浏览器......),欢迎 Star & Fork 参与贡献! 计划 目前本插件的深色模式适配任务量重大,单靠我一人完成将是一件非常困难的
An Unofficial Bilibili Android Client Screenshots UpdateLog Version update log viewer Thanks to the open source project RxJava RxAndroid RxBinding RxLifecycle okhttp retrofit ijkplayer DanmakuFlameMas
1.自我介绍 2.实习拷打 3.讲讲你对java的认识吧 4.jvm怎么垃圾回收的 5.讲讲你对mysql的认识 5.讲讲mysql优化吧 6.索引失效的情况 7.讲讲你对redis的认识 8.redis你咋用的 9.redis集群模式有哪些区别 10.打开一个网页的过程 11.静态资源怎么获取 12.CDN 13.你知道网络攻击吗 14.DDOS如何避免 15.除了ddos还有什么 16.大ke
做的卷子是: 后端开发工程师-基础架构方向第一批(数开) 选择题都挺简单的,有道防御攻击手段的不是很确定。 三道问答一道编程 问答1.Hbase+索引 问答2:寻找宝藏问题,之前做过类似的(AC) 问答3:蓄水池抽样 编程:求自然数最小因子和AC 总的来说这次挺简单的,应该是第一批的原因。 #bilibili笔试#