Bilibili用户爬虫
知乎专栏地址:https://zhuanlan.zhihu.com/p/24434456
本文所使用的数据可视化为 infogr.am
该爬虫仅供学习使用
bilibili_user.py
:爬虫文件bilibili_user_info.sql
:数据库文件get_face.py
:用户头像下载器演示地址:http://ursb.me/bilibili-reportGitHub:https://github.com/airingursb/bilibili-report
跪求Star Orz...
转自我的博客 B站2000万用户分析
这个男女比例是有点出乎个人预料的,接近1:1。其实之前初步抓了2013年暑假之前的数据,男女比例当时还在3:1这样。
可见明确性别的群体还是比较少的,只占了总数据的 15% 左右。
更多的分析日后再做。
具体数据不放了,简单看一下统计结果吧。
主要用户分布在93-00年的用户(大概16-23周岁),其中97年(19岁)用户占了绝对的主导地位。
事实证明,B站小学生并不多,而是高中生、大学生比较多。
90后用户占主体,但是用户年龄段正在不断后移。毕竟,是一个年轻人的网站。
主要用户分布在:广东、江苏、北京、上海、浙江等地区。都是一些经济很发达的沿海地区。
由于16年才过去2个多月,所以少一点,不过可以预见其发展必将远超2015年。自2009年开站以来,每年用户几乎都是以指数级增长。
由于B站有经验等级规则,用户的活跃度可以依据等级判断。
等级为0,就是只注册未登陆过的用户。等级为1或2,为非活跃用户。等级为3以上,就是活跃用户。其中等级为5或6的,为投稿数特别特别多、视频特别火爆的用户,为B站的主干用户(约5000人)。
关于留存率等数据,日后再统计分析。
哎- -,我也是有2个粉丝的人!
以下是B站TOP20用户。很多人都非常的眼熟哈。
注意:仅用于测试,禁止非法使用 python代码 在所在文件夹创建文件夹download 暂时只支持bv号 下载文件是flv格式的,如需转成mp4可以用ffmpeg 要安装requests模块 pip安装 pip install requests import json import requests import time import os def get_url_bv(bv): h
获取系列视频信息:(名称+请求地址) urls = [] names = [] bv_num = "这里是需要下载视频的BV值" def get_tilt(): http = "https://www.bilibili.com/video/%s?p=%s" try: url = "https://www.bilibili.com/video/%s" % bv_num response
9月28日更新 b站视频失效已经有一段时间了,非常抱歉一直没有处理。前段时间将视频全部上传了阿里云盘,在b站动态发布了,但是似乎看动态的人不多。更新一下 GitHub ,先暂时顶着吧,体验和b站无异,只是没有弹幕 �� 阿里云盘链接 https://www.aliyundrive.com/s/d3WQCUgj1L2 �� 对 b 站视频 的附带资料(如课件、源代码等)进行备份,防止云盘链接失效。
Bilibili Evolved 是一个强大的哔哩哔哩增强脚本。在此查看功能。 安装 需要浏览器装有 Tampermonkey 或 Violentmonkey 插件, 下方表格中挑一个链接安装。 注意事项 做好觉悟, 脚本开启后不能使用弹幕点赞和举报, 全景视频不能用鼠标拖拽视角(只能用键盘操作), 对性能也有较大影响. 新版本一旦正式发布, 就不再对旧版本做任何技术支持. 使用外部网站的链接时(
Bilibili-Night 是 Bilibili 网页端的深色模式 Chrome 扩展程序(插件),适用于 [Chromium](https://www.chromium.org/) 内核的所有浏览器(Google Chrome、QQ浏览器、360浏览器、搜狗浏览器......),欢迎 Star & Fork 参与贡献! 计划 目前本插件的深色模式适配任务量重大,单靠我一人完成将是一件非常困难的
An Unofficial Bilibili Android Client Screenshots UpdateLog Version update log viewer Thanks to the open source project RxJava RxAndroid RxBinding RxLifecycle okhttp retrofit ijkplayer DanmakuFlameMas
做的卷子是: 后端开发工程师-基础架构方向第一批(数开) 选择题都挺简单的,有道防御攻击手段的不是很确定。 三道问答一道编程 问答1.Hbase+索引 问答2:寻找宝藏问题,之前做过类似的(AC) 问答3:蓄水池抽样 编程:求自然数最小因子和AC 总的来说这次挺简单的,应该是第一批的原因。 #bilibili笔试#
2022.09.20 45min 自我介绍 java中有goto关键字吗?为什么 final 线程同步执行方法 join() 线程池 泛型 泛型与Object区别 集合 HashSet怎么保证有序 jvm内存模型 activity生命周期 显式启动 隐式启动 fragment recyclerView requestlayout retrofit以及使用的设计模式 HTTPS和HTTP区别,有什么