一份来自掘金社区的开发者报告

By liuzhijun, 2017-03-07, 分类: 数据分析

numpy

先需要声明两点:
这不是问卷调查,是一份基于用户数据分析生成的统计报告。
这不是一篇软文,我可没拿人家广告费滴。

在开始做数据分析前,掘金给我的直观感受是一个分享前端知识、Android 技术非常多的社区,不过今天有了一份数据作为参考,感受更为直接。

社区最热的语言是 JavaScript,接近3成的帖子是关于 JavaScript 的,而 Java 作为 Android、后端开发两个大方向出乎意料的排在次席。

分析其原因可能跟掘金的创始团队的技术背景有一定关系,CEO 阴明前端开发出身,后端主要依赖某云服务,估计网站创立初期可能聚集了一大批志同道合的前端种子用户在社区分享内容。

Swift 大步领先 Objective-C,这跟 TIOBE 的排名趋势基本接近。相信接下来 Objective-C 会进一步缩水,除了遗留系统之外,大家更愿意使用 Swift 进行新项目的开发。

Python 做为全能战士在 Web、爬虫、数据分析、量化交易、机器学习、AI等领域都有不俗的表现,排名第 4 乃实至名归。令人意外的是榜单里面没有 C# 的身影,微软系已经逐渐淡出人们的视线。

language.png

前端已经火了好几年了,从 Web 前端到后端 Node.js,再到移动端 ReactNative,好像 JS 贯穿云端直抵终端,大有一统天下之势。来看看他们都在玩什么框架。

jQuery 份额不断下降,但她的使命已经完成。Vue.js 、React.js、Angular.js 形成三国鼎立之势。当然还有各种小虾小米,前端生态可谓鱼龙混杂。问题是,新技术、新框架层出不穷、日新月异,你学得过来吗?我的建议是学好基础,挑一个行情好的学,技术都是相通的。

js_framework.png

从访问量来看,社区 Android 开发者的体量是最大的,Android 访问量是 iOS 的两倍多。据艾瑞网统计 Android 手机的市场占比已经达到了86%,这就不奇怪了。 而后端就不那么给力了,无论是访问量还是收藏数都不高,一个侧面例子:我跟一做 Java 后端的朋友聊起掘金的时候,他表示没听说过掘金。所以掘金的运营同学要给力了,多拉点后端开发者来玩。

category.png

什么类型的文章是大家最爱看的?我分析了阅读量前100条帖子,但凡讲面试、教程、微信开发、免费、资源、指南等字眼的文章更受欢迎。所以如果你是写作者,要写出10k+阅读量的文章,可以考虑这些方面去写。

juejin_title.png

密集恐惧症慎入!你们逛掘金每天看到的关键字无外乎是这些,发现一个亮点,在左下角有一个「全栈」,看来全栈概念基本上淡出了我们的视线,这说明我们更加务实了,不是喊喊口号就能自称全栈的。

juejin_wordcloud.png

不知你们是否关心这些图表从技术上是怎么实现的,这里可以简单介绍一下思路。

数据分析首要任务就是获取数据,如果你打开游览器按 F12,稍微法分析一下你就知道怎么去获取数据,不管是用爬虫还是其他方式都是手段,拿到数据才是目的。数据存储到本地后就要进行清洗加工,方便统计,那么这时就需要配合 numpy、pandas、matplotlib、plotly 等工具进行分析、计算、可视化。最后一张图是通过 jieba 分词处理后用 wordcloud 进行词云展示。

本来还想统计有多少女性开发者,遗憾的是没有渠道可以得到用户的性别,如果能用机器学习来分析某个用户是男性还是女性,我想这一定非常有趣。

所有数据的分析过程是在 Jupyter Notebook 环境下完成的,因此你可以看到每一步的数据统计详细过程,完整代码可以在公众号回复 "data"获取。下期要不要来个 Python 数据分析入门的教程?需要的请留言


关注公众号「Python之禅」(id:vttalk)获取最新文章 python之禅