整理了最近参加的游戏数分笔试题以及朋友给我的题目~
我所笔试的游戏公司的题目分为2个SQL题+5道业务题
第一题:
table:log_user_cons:用户金币花费表
uid int 用户id ;ts datetime 产生数据的时间;gold int 消耗的金币数量;type int 消耗类型
问题:请查询每天每个类别消耗的最大的前两个玩家id。
窗口函数用法的考察,并且涉及到子查询。
第二题:
table:user_basic:用户登入表
uid int 用户id; regdate date 注册日期; login_date date 登入日期;todayamount float 登入日充值金额
次留定义:注册日期的第二天还有登入,比如2022-01-01的注册用户,在2022-01-02还有登入行为;
LTV定义:sum(新增前N天的充值)/sum(账号数),比如2022-01-01的新增用户,计算LTV1就是sum(2022-01-01的新增用户在当日的总充值)/sum(2022-01-01新增用户数);
LTV2就是sum(2022-01-01的新增用户在2022-01-01,2022-01-02两日的总充值)/sum(2022-01-01新增用户数)
问题:请输出结果:注册时间,注册人数,次留人数,LTV1,LTV2,LTV3.
注册人数可以count(uid) group by 日期;
次留人数sum(if(登入日期-注册日期 = 1,1,0))
LTV计算DateDiff(logindate,regdate) as diff;然后再sum(amount),123分别对应diff in (1,2,3)
一层层套娃,感觉心累啊!
第三题:
请列举三款你玩的最深入的游戏,介绍其中一款你喜欢的原因(从玩法,产品定位,用户画像等方面来阐述);(除了王者荣耀,吃鸡,LOL以外的游戏)
我写的率土之滨,三国志战略版,阴阳师(没玩过但是听说很火)
介绍的是氪金类手游:三国志战略版。因为自己是三国的忠实爱好者!(弃坑原因是游戏平衡性太差了!)
玩法:在三国背景下,用户通过选择出身地,招募英雄,开垦荒地,结交盟友,攻城掠池,不断扩充自己的实力。
产品定位:三国题材的氪金类手游(喜欢三国故事,爱玩养成类游戏)
用户画像:男性用户偏多,学生党,以及有经济能力的青年群体。(用户画像应该从用户的基础属性(年龄,身高等)+用户的行为属性(每日游戏时长,氪金数额等)一起描述)
第四题:
请说明,玩家为什么会选择玩这个游戏,从选择到离开会经历哪几个阶段,以及总结为什么会流失的原因?
玩家玩这个游戏可能通过以下渠道:1.广告的推广 (明星代言,渠道推广)2.自己搜索某类型游戏推荐/选择下载 3.朋友推荐
从选择到离开会经历4个阶段:进入阶段、成长阶段、成熟阶段、衰退期(考察的用户的生命周期)
每个阶段可能流失的原因:https://zhuanlan.zhihu.com/p/40008695?ivk_sa=1024320u
第五题:
假设一个excel工作薄里有两个工作表
1.请将表2中的姓名匹配到表1末尾,请写出对应的公式或者操作方式
2.请在表2的末尾,用函数计算每个人的总计的充值金额
第一问考的vlooup函数?但是具体参数我不记得了(只能在excel按提示才能做出来)。。。
第二问聚合了(精确定位到每个身份证号)之后再sum求和。
(还能这样考察excel?我真的栓Q)
第六题:
某日的在线数据与前一天的在线数据如下图所示,图里边可能发生了什么问题?
从图中可以发现,21点时间段较前一日在线人数数据有明显的下降。
在确定数据异常不是因为统计口径或者数据报表异常所导致的情况下。
定位问题的原因:可以通过计算各环节DAU的变动系数 = (该环节下异常前DAU-该环节下异常后DAU)/该环节下异常前DAU,
选择变动系数较大的环节,对其进行分析。(抓大头,定位主要环节)
其次从运营侧还可以考虑比如新老人群,各年龄段的一个变动情况。看看在线用户数据是因为新用户下降,还是老用户流失。
从产品侧还可以考虑是否是版本的变动(更新)而影响的;从技术侧可以考虑是否是游戏页面卡顿闪退。
外部可以从政策和竞品的角度找原因。
第七题:
你觉得游戏数据分析需要具备什么能力?你自己的性格对于做游戏数分有啥优势?
1.数学与统计能力 2.掌握编程和分析工具 3.游戏业务的理解
4.数据分析思维 5.出色的沟通能力 6.解决问题的能力
我是个有上进心和责任感的人,肯钻研,肯吃苦,善于从数据中发掘规律
对游戏领域的热爱(其实我总觉得沉迷游戏=玩物丧志,适当游戏充实生活吧)。。。
下面是朋友给我反馈她做的游戏数分笔试题
询问了她的意见,很感谢她能够同意我把这份笔经分享出来!(有幸秋招求职过程中交到了一些志同道合的小伙伴啊!)
1.K-means的原理
K表示聚类的个数,Means表示每个簇以该簇内所有样本的均值为质心来代表该簇。
K-means算法先随机选取k个样本作为初始化的k个簇的质心,
然后计算所有样本到这k个质心的距离,对于每个样本,将其划分到距离最近的质心所在簇类,并更新簇的质心
2.对于一个语音交友app,可以利用房间的哪些信息,来优化房间的推荐机制?
没玩过语音交友app,还有房间?好奇想试试了。。。
推荐阅读:https://baijiahao.baidu.com/s?id=1692579127106485755&wfr=spider&for=pc
3.公司上新了一个新产品,发现用户留存同比下降5个百分点,从哪些方面进行分析?
同上,分环节,分用户特征,分内外部原因
4.计算不同性别中每个爱好的人数
Lateral view explode函数对某列拆分。
参考:https://blog.csdn.net/weixin_38753213/article/details/115364880
5.计算最高同时在线人数
颗粒度竟然精确到秒。。。
要恶补SQL知识了啊!!!
估计要用到sum的窗口函数以及嵌套子查询。
参考:https://zhuanlan.zhihu.com/p/434962806
求职路漫漫,吾将上下而求索!!!
#23届秋招笔面经##数据分析##数据分析师##秋招##校招#