和@贱贱同学认识好久了(整整12天),对贱贱同学的博学,有趣,高产深深的吸引,带着对贱贱同学的无比崇拜之情(以上皆为假客套),我自费请了一个会汉语的法(fà)国小哥,叫作农德基艾斯,花了整整一晚上的时间,帮我整理出了一份贱贱同学的个人知乎数据。
数据是周六晚上(2018-01-20)整理出来的,感谢农德同学的辛苦,欠你的工资等下个月发工资了一定还你。
共整理出 关注者75,426人,关注的人1,921人,回答881篇,文章44篇,共获赞同数201,529(包含已折叠的回答),总评论数98,240(不包含想法的评论和已折叠的评论)。
其中,第一篇回答,诞生于2017年建军节的零点,我想知道建军节那天到底发生了什么,让你决定开始来知乎分享你刚编的故事。
刚又看了一下(2018-01-22),关注者为75,843人,回答892篇,获得赞数203,051。这个增长量。。不得不说。。贱贱大哥真是高产似。。。
假装一不小心打多了一个"似"。
男女比例
先简单看下男女比例:
{
"option": {
"title": {
"text": "关注者男女比例",
"x": "center"
},
"series": [
{
"type": "pie",
"data": [
{
"value": 30645,"name": "未知"
},
{
"value": 16118,"name": "女"
},
{
"value": 28663,"name": "男"
}
]
}
]
}
}
{
"option": {
"title": {
"text": "关注的人男女比例",
"x": "center"
},
"series": [
{
"type": "pie",
"data": [
{
"value": 90,"name": "未知"
},
{
"value": 425,"name": "女"
},
{
"value": 1406,"name": "男"
}
]
}
]
}
}
不管是关注者还是关注的人,汉子都是半边天啊。看来不管是撩汉子还是被汉子撩,贱贱哥都很有一手啊。不知道贱贱哥什么时候有空,我们一起去gay吧坐坐。
其中互相关注的有1916人。如图:
{
"option": {
"legend":{"show":false},
"series": [
{
"type": "pie",
"radius": [0, "65%"],
"label": {
"position": "inner",
"align": "left",
"verticalAlign": "top",
"formatter": "{b}:{c}({d}%)"
},
"data": [
{"value": 5, "name": "非互相关注","labelLine":{"show":false}},
{"value": 1916, "name": "互相关注"}
]
},
{
"type": "pie",
"radius": ["60%", "80%"],
"data": [
{"value": 5, "name": "非互相关注","label":{"show":false},"labelLine":{"show":false,"emphasis":{"show":false}}},
{"value": 1404, "label":{"formatter":"男:1404(73.27%)"},"tooltip":{"formatter":"互相关注-男:1404(73.27%)"}},
{"value": 423, "label":{"formatter":"女:423(22.08%)"},"tooltip":{"formatter":"互相关注-女:423(22.08%)"}},
{"value": 89,"label":{"formatter":"未知:89(4.65%)"},"tooltip":{"formatter":"互相关注-未知:89(4.65%)"}}
]
}
]
}
}
这TM什么情况?!忍不住感慨一句: 卧槽 !
怎么还有剩下5个人没有互相关注? 统计了一下,剩下五个人的关注者总人数为:1,034,235。平均每人206,847。嗯。。可能这五个人觉得贱贱哥的咖位还不够吧。
最后,希望多点热爱自然科学的妹子关注@贱贱,也希望@贱贱也多关注点热爱自然科学的妹子,哈哈。
关注度分析
通过关注度,对用户做一个简单的分级:
- 普通用户 10人以下(包含)
- 初级用户 300人以下(包含)
- 中级用户 1,000人以下(包含)
- 高级用户 3,000人以下(包含)
- 小V用户 10,000人以下(包含)
- 中V用户 30,000人以下(包含)
- 大V用户 30,000人以上
分别看下关注的人和关注者的用户情况:
{
"option": {
"title": {
"text": "关注的人",
"x": "left"
},
"series": [{
"type": "pie",
"radius":"75%",
"data": [
{"value": 470,"name": "初级用户"},
{"value": 717,"name": "中级用户"},
{"value": 378,"name": "高级用户"},
{"value": 191,"name": "小V用户"},
{"value": 94,"name": "中V用户"},
{"value": 64,"name": "大V用户"},
{"value": 7,"name": "普通用户"}
]
}]
}
}
{
"option": {
"title": {
"text": "关注者",
"x": "left"
},
"series": [{
"type": "pie",
"radius":"75%",
"data": [
{"value": 15437,"name": "初级用户"},
{"value": 899,"name": "中级用户"},
{"value": 416,"name": "高级用户"},
{"value": 206,"name": "小V用户"},
{"value": 101,"name": "中V用户"},
{"value": 68,"name": "大V用户"},
{"value": 58299,"name": "普通用户"}
]
}]
}
}
其中,关注的人当中,关注度最高的为902,167; 关注者当中(相互关注的除外),关注度最高的为208,871。
对比这两个图,至少可以说明,贱贱哥的占比99.7%的相互关注也许大概可能并不是逢人就点的。。
而在关注的人当中,大部分处于中级用户,我个人猜测,很有可能处在这个阶段的知乎用户是最活跃的,而很多大V用户现在基本不怎么活跃了,所以曝光度不是很高。所以很有可能整个知乎,在回答的产出上,也是这个区间的人是最活跃的。
以上这个观点纯属瞎猜,如果你也这么觉得,那么。。你一定也是瞎猜。
@贱贱,看我这么认真的揣测你。来评论区说下你点关注的原则呗。
活跃度分析
知乎是个很神奇的应用,刚来的时候,会感觉发现了一个新的世界,时间久了,也就主要是跟着带逛。
所以有的知乎账号,号还在,但人没了。对于这种没有灵魂的账号,称之为僵尸用户。那贱贱同学关注的人与关注者有多少僵尸用户呢?
所以,我又让农德同学统计了所有 关注的人和关注者 的动态。
根据最近一条动态的时间,对用户活跃程度做一个定义:
- 两个月内有动态的用户,称之为活跃用户,
- 两个月都没有产生新的动态,称之为僵尸用户,
- 未统计到动态,称之为未知用户。这部分不知道为什么没有动态,我猜要么是深度潜水,要么是注册没怎么玩就弃坑了。
同时对活跃用户,又细分为四个区间:
- 三天内有动态 (2018-01-18)
- 一周内有动态 (2018-01-14)
- 一个月内有动态 (2017-12-20)
- 两个月内有动态 (2017-11-20)
关注者的活跃度如图:
{
"option":{
"legend": {"show": false},
"series": [
{
"type": "pie",
"radius": [0, "75%"],
"label": {
"position": "inside",
"formatter": "{b}:{c}({d}%)"
},
"data": [
{"value": 72104, "name": "活跃用户"},
{
"value": 3120,
"name": "僵尸用户",
"label": {"padding": [20, 30, 0, 0]}
},
{
"value": 202,
"name": "无动态",
"label": {"padding": [0, 0, 30, 30]}
}
]
},
{
"type": "pie",
"radius": ["70%", "100%"],
"data": [
{
"value": 43286,
"label": {"formatter": "3天内:43286(60.03%)"},
"tooltip": {"formatter": "3天内:43286(60.03%)"}
},
{
"value": 10923,
"label": {"formatter": "1周内:10923(15.15%)"},
"tooltip": {"formatter": "1周内:10923(15.15%)"}
},
{
"value": 14251,
"label": {"formatter": "1月内:14251(19.76%)"},
"tooltip": {"formatter": "1月内:14251(19.76%)"}
},
{
"value": 3644,
"label": {"formatter": "2月内:3644(5.05%)"},
"tooltip": {"formatter": "2月内:3644(5.05%)"}
},
{
"value": 3120,
"name": "僵尸用户",
"label": {"show": false},
"labelLine": {"show":false,"emphasis":{"show":false}}
},
{
"value": 202,
"name": "无动态",
"label": {"show": false},
"labelLine": {"show":false,"emphasis":{"show":false}}
}
],
"label": {"formatter": "{b}:{c}"}
}
]
}
}
从图看大部分用户还都是活跃用户,活跃用户总人数为72,104人。所有活跃用户的关注者数量为:11,394,799。
也就是说,贱贱哥回答一个问题后,获得的有效曝光度也就7万多人,而假设这7万人都点赞了,又可以间接的曝光给一千多万人。当然这一千万人中,可能也会有不少僵尸用户。
另外可以看到,已经产生了3,120个僵尸用户,如果贱贱哥真的是从第一篇回答才开始玩知乎的话,那从8月份到现在五个多月的时间,就流失了3000多个用户,个人感觉知乎用户的流失问题还挺严重的。
看下贱贱哥关注的人的活跃度情况:
{
"option": {
"legend": {"show": false},
"series": [
{
"type": "pie",
"radius": [0, "75%"],
"label": {
"position": "inner",
"align": "center",
"verticalAlign": "top",
"formatter": "{b}:{c}({d}%)"
},
"data": [
{"value": 1908, "name": "活跃用户"},
{"value": 13, "name": "僵尸用户","labelLine":{"show":false,"emphasis":{"show":false}}}
]
},
{
"type": "pie",
"radius": ["70%", "85%"],
"data": [
{"value": 1536,"label":{"formatter":"3天内:1536(80.5%)"},"tooltip":{"formatter":"3天内:1536(80.5%)"}},
{"value": 181, "label":{"formatter":"1周内:181(9.49%)"}, "tooltip":{"formatter":"1周内:181(9.49%)"}},
{"value": 160, "label":{"formatter":"1月内:160(8.39%)"}, "tooltip":{"formatter":"1月内:160(8.39%)"}},
{"value": 31, "label":{"formatter":"2月内:31(0.68%)"}, "tooltip":{"formatter":"2月内:31(0.68%)"}},
{"value": 13, "name": "僵尸用户", "label": {"show": false},"labelLine":{"show":false,"emphasis":{"show":false}}}
],
"label": {"formatter": "{b}:{c}"}
}
]
}
}
关注的人中,活跃度相对较高的一点,所以能不能假设活跃情况和用户的关注者人数可能是成正比的。
所以,将关注者的活跃度和关注度做一个对比,由于关注的人中,接近100%都是互相关注的,就不再统计了,如图:
{
"option":{
"legend": {"show": false},
"series": [
{
"type": "pie",
"radius": [0, "65%"],
"label": {
"position": "inner",
"align": "center",
"formatter": "{b}:{c}({d}%)"
},
"data": [
{"value": 375, "name": "小中大V用户", "label": {"padding": [0, 0, 10, 0]}},
{"value": 16752, "name": "初中高级用户", "label": {"padding": [20, 0, 0, 0]}},
{"value": 58299, "name": "普通用户"}
]
},
{
"type": "pie",
"radius": ["60%", "79%"],
"data": [
{"value": 373, "label": {"formatter": "活跃用户:373(99.47%)"}, "tooltip": {"formatter": "小中大V-活跃用户:373(99.47%)"}},
{"value": 2, "label": {"formatter": "僵尸用户:2(0.53%)"}, "tooltip": {"formatter": "小中大V-僵尸用户:2(0.53%)"}},
{"value": 16576, "label": {"formatter": "活跃用户:16576(98.95%)"}, "tooltip": {"formatter": "初中高级-活跃用户:16576(98.95%)"}},
{"value": 176, "label": {"formatter": "僵尸用户:176(10.51%)"}, "tooltip": {"formatter": "初中高级-僵尸用户:176(10.51%)"}},
{"value": 55155, "label": {"formatter": "活跃用户:55155(94.61%)"}, "tooltip": {"formatter": "普通-活跃用户:55155(94.61%)"}},
{"value": 2942, "label": {"formatter": "僵尸用户:2942(5.05%)"}, "tooltip": {"formatter": "普通-僵尸用户:2942(5.05%)"}},
{"value": 202, "label": {"formatter": "无动态:202(0.35%)"}, "tooltip": {"formatter": "普通-无动态:202(0.35%)"}}
],
"label": {"formatter": "{b}:{c}"}
}
]
}
}
可以看到,在大中小V这个区间里,僵尸用户占比是最小的,不过,我的数据量太小了,参展指标也有点单一,不太好说明两者到底存在哪些确定的关联。
接下来主要看下僵尸用户,查了一下僵尸时间的最后动态时间,
其中关注者中,最僵的用户僵在了2011年07月,关注的人中,最僵的用户僵在了2017年03月。
咦,11年,是不是有点懵逼。。那问题来了,一个不产生任何动态的用户和真正的僵尸用户有什么区别?
直观的看下关注者中僵尸用户的关注度情况:
{
"option": {
"series": [{
"type": "pie",
"data": [
{"value": 2942, "name": "普通用户"},
{"value": 168, "name": "初级用户"},
{"value": 10, "name": "中级及以上用户"}
]
}]
}
}
这个占比情况,大概也是符合预期的。而哪些是正经的僵尸用户哪些是深海潜水用户呢?
我觉得,最新的动态在贱贱哥第一篇回答之前的,都有可能只是潜水而已,搞不好哪一天会出来诈个尸。
所以就以贱贱哥的第一篇回答的时间作为起点,所有僵尸用户,僵在在2017年08月01日之前的404人,占比12.95%。话说回来,这四百多位潜水用户,对知乎和贱贱哥还真的是不求回报的默默的喜欢呢。
互动分析
另外,通过统计881篇回答和44篇文章中的所有点赞和评论,点赞最高的用户共赞了618次,评论最多的用户共评论了633条。
这些都还好,最可怕的是,贱贱哥的回复总共38,039条。可见贱贱哥对大家的评论还是很上心的。
通过点赞数,对关注者做一个定义:
- 忠实粉 : 点赞数≥200
- 普通粉 : 点赞数≥20
- 佛系粉 : 点赞数<20
- 路人粉 : 只关注不点赞
{
"option": {
"series": [{
"type": "pie",
"data": [
{"value": 11, "name": "忠实粉"},
{"value": 764, "name": "普通粉"},
{"value": 19738, "name": "佛系粉"},
{"value": 54913, "name": "路人粉"}
]
}]
}
}
哈哈,这个出乎意料,为什么这么多只关注不点赞的,贱贱哥你是不是应该反省一下。
由于我之前的一个回答,和很多人私信后了解到,因为关注者里有比较在意的人,好多人对于点赞都很慎重,因为会展示在别人的首页里。
所以,贱贱哥,大家都不给你点赞,你心里有点13数么?
另外对评论也做一个定义:
- 话痨 : 评论数≥200
- 活跃 : 评论数≥100
- 佛系 : 评论数≥50
- 普通 : 评论数≥20
- 冒泡 : 评论数<20
- 潜水 : 不评论
{"option":{
"series": [{
"type": "pie",
"radius":"73%",
"data": [
{"value": 224, "name": "普通"},
{"value": 7493, "name": "冒泡"},
{"value": 67624, "name": "潜水"},
{"value": 8, "name": "话痨"},
{"value": 20, "name": "活跃"},
{"value": 57, "name": "佛系"}
]
}]
}}
其中,潜水用户和路人粉重合人数为51,970。所以,贱贱哥,这么多人既不评论也不点赞,你心里是不是该有点13数了。
曝光度分析
其实我们每一个回答,很多时候并不是抱着求赞的心态,主要是希望解答别人的疑惑,或者带给别人一些思考和启发,只要有人觉得我的回答有意思或者有意义,就会觉得写下的这些文字没有白费(本文除外,赞我,使劲赞我!)。
之前我的一个回答,有人特意私信我说他觉得特别有意思,但是因为有比较在意的人关注了他,所以没有点赞。当时真的是蛮感动的(内心OS:那请注册小号点赞)。
不过可以量化的点赞数和感谢数,更容易对每一个回答者带来成就感(不然我回答干嘛)。
同时呢每一次点赞不仅仅是一种认可,也是一种传播,把你赞同的思想分享给每一个关注你的人。
好了,就是写到这里突然想感慨两句,手动分隔一下。
每个回答的曝光,主要有以下几个途径:
- 知乎推荐
- 提醒关注了该问题的人有了新回答
- 会展示给每一个关注者
- 点赞后,展示给点赞者的关注者
其中最简单粗暴直接有效的,就是点赞了,也可以说是最主要的途径。
所以计算出该问题下的点赞用户的关注者的总数,就可以粗糙的认为就是该问题的曝光次数。
由于回答和文章较多,这里就只看下曝光数top5的情况:
{
"option":{
"title": {"text": "文章","x": "left"},
"legend": {"data":["曝光度","点赞数"]},
"xAxis": [{
"type": "category",
"axisLabel": {"interval": 0, "rotate": 20},
"data": ["十年以...贬值", "201...”名", "从高校.....", "那些在...目录", "远离那...有毒"]
}],
"yAxis": [{"type": "value"}],
"series": [
{
"name": "点赞数",
"type": "bar",
"data": [1812, 287, 837, 547, 560]
},
{
"name": "曝光度",
"type": "bar",
"data": [1185390, 306273, 255410, 210235, 188856]
}
]
}
}
{"option":{
"title": {"text": "回答","x": "left"},
"legend": {"data":["曝光度","点赞数"]},
"xAxis": [{
"type": "category",
"axisLabel": {"interval": 0, "rotate": 20},
"data": ["如何看...A片", "求详细...等等", "如何解...成果", "如何看...控评", "如何看...死亡"]
}],
"yAxis": [{"type": "value"}],
"series": [
{
"name": "点赞数",
"type": "bar",
"data": [5207, 5201, 1467, 2369, 1750]
},
{
"name": "曝光度",
"type": "bar",
"data": [2107102, 1846931, 1300455, 1110441, 1042261]
}
]
}
}
文章的总曝光次数为3,726,264,获得总赞数为8,995,转化率为0.241%。
曝光次数最高为1,185,390(1812次点赞,转化率0.153%,链接),最低为106(7次点赞,转化率6.604%,链接),
转化率最高为:6.604%(106曝光,7次点赞,链接),最低为0.046%(124,974曝光,57次点赞,链接)。
回答的总曝光次数为49,475,714,获得总赞数为192,534,转化率为0.389%。
曝光次数最高为:2,107,102(5207次点赞,转化率0.247%,链接),最低为17(2次点赞,转化率21.07%,链接),
转化率最高的回答为:16%(25曝光,4点赞,链接),最低为0.012%(698,147曝光,82次点赞,链接)。
柱状图中点赞的高度基本需要拿着放大镜才能看到,出现这种情况也有可能是因为这个曝光度统计的很粗糙,在关注者中会存在大量的僵尸用户,同时也会有其他增加曝光的方式。所以感觉这里取名叫曝光度貌似也不是很合适。
而且通过统计最大值也可以发现,由于有的回答和文章曝光比较少,造成分母小,从而结果大。不过整体数据就比较粗糙,就不纠结这个小问题了。
最后呢,上个彩蛋,那就是@贱贱算不算是大V呢?按照微博金V的认证规则,需要阅读量超过1000万且粉丝量超过1万,首先粉丝量已经达标了,接下来看阅读量了。
在一个月的时间里(2017-11-20~2018-01-20),贱贱哥共新增222篇回答,6篇文章。回答共获赞66,323,文章共获赞468。新增非折叠评论4,339条。
按照以上计算曝光度的规则,新增的回答曝光度为15,264,245,新增的文章曝光度为278,967。
但是曝光不一定会点开阅读,再加上曝光度数据的粗糙性,这么算下来,搞不好贱贱哥还不算是个大V呢。
哈哈,希望贱贱哥加油,争取早日夺得大V称号!
相关链接
知乎文章: "为@贱贱写的文章"
知乎文章: "知乎半年杂记:答疑以及思考"