PUB:20160623 72% Of The People I Follow On Twitter Are Men

@Flowsnow
This commit is contained in:
wxy 2016-08-18 00:38:12 +08:00
parent 83ef5767f9
commit a5d7d25e75

View File

@ -1,9 +1,9 @@
在推特上我关注的人72%都是男性
在推特上我关注的人 72% 都是男性
===============================================
![](https://emptysqua.re/blog/gender-of-twitter-users-i-follow/abacus.jpg)
至少,这是我的估计。推特并不会询问用户的性别,因此我 [写了一个程序][1] ,根据姓名猜测他们的性别。在我的那些关注者中性别分布甚至更糟83%的是男性。据我所知,其他的还不全都是女性。
至少,这是我的估计。推特并不会询问用户的性别,因此我 [写了一个程序][1] ,根据姓名猜测他们的性别。在那些关注我的人当中性别分布甚至更糟83% 的是男性。据我所知,其他的还不全都是女性。
修正第一个数字并不是什么神秘的事:我注意寻找更多支持我兴趣的女性专家,并且关注他们。
@ -11,13 +11,13 @@
### 我应该怎么估算呢
我开始估算我关注的人(推特的上的术语是“朋友”)的性别分布,然后这格外的难。[推特的分析][2]经常显示相反的结果。 一个我的关注者的性别估算结果
我开始估算我关注的人(推特的上的术语是“朋友”)的性别分布,然后发现这格外的难。[推特的分析][2]给我展示了如下的结果, 关于关注我的人的性别估算
![](https://emptysqua.re/blog/gender-of-twitter-users-i-follow/twitter-analytics.png)
因此,推特的分析将我的关注者分成了三类:男性、女性、未知,并且给我们展示了前面两组的比例。(性别二值化现象在这里并不存在——未知性别的人都集中在组织的推特账号上。)但是我关注的人的性别比例,推特并没有告诉我。 [而这就是可以改进的][3], 然后我开始搜索能够帮我估算这个数字的服务,最终发现了 [FollowerWonk][4] 。
因此,推特的分析将我的关注者分成了三类:男性、女性、未知,并且给我们展示了前面两组的比例。(性别二值化现象在这里并不存在——未知性别的人都集中在组织的推特账号上。)但是我关注的人的性别比例,推特并没有告诉我。 [而这就是可以改进的][3]然后我开始搜索能够帮我估算这个数字的服务,最终发现了 [FollowerWonk][4] 。
FollowerWonk 估算我关注的人里面有71%的都是男性。这个估算准确吗? 为了准确性我把FollowerWonk和Twitter对我关注的人的进行了估算,结果如下:
FollowerWonk 估算我关注的人里面有 71% 都是男性。这个估算准确吗? 为了评估一下,我把 FollowerWonk 和 Twitter 对我关注的人的进行了估算,结果如下:
**推特分析**
@ -32,15 +32,15 @@ FollowerWonk 估算我关注的人里面有71%的都是男性。这个估算准
| **我的关注者** | 81% | 19% |
| **我关注的人** | 72% | 28% |
FollowerWonk的分析显示我的关注者中81%的人都是男性很接近推特分析的数字。这个结果还说得过去。如果FollowerWonk 和Twitter 在我的关注者的性别比例上是一致的这就表明FollowerWonk对我关注的人的性别估算也应当是合理的。使用FollowerWonk我就能养成估算这些数字的爱好并且做出改进。
FollowerWonk 的分析显示我的关注者中 81% 的人都是男性很接近推特分析的数字。这个结果还说得过去。如果FollowerWonk 和 Twitter 在我的关注者的性别比例上是一致的,这就表明 FollowerWonk 对我关注的人的性别估算也应当是合理的。使用 FollowerWonk 我就能养成估算这些数字的爱好,并且做出改进。
然而使用FollowerWonk 检测我关注的人的性别分布一个月需要30美元这真是一个昂贵的爱好。我并不需要FollowerWonk 的所有的功能。我能很经济的解决只需要性别分布的问题吗?
然而,使用 FollowerWonk 检测我关注的人的性别分布一个月需要 30 美元这真是一个昂贵的爱好。我并不需要FollowerWonk 的所有的功能。我能很经济的解决只需要性别分布的问题吗?
因为FollowerWonk 的估算数字看起来比较合理我试图做一个自己的FollowerWonk 。使用Python和[一些好心的费城人写的Twitter API封装类][5]LCTT译Twitter API封装类是由Mike Taylor等一批费城人在github上开源的一个项目我开始下载我所有关注的人和我所有的关注者的简介。我马上就发现推特的比例限制是极少的,因此我随机的采样了一部分用户。
因为 FollowerWonk 的估算数字看起来比较合理,我试图做一个自己的 FollowerWonk 。使用 Python 和[一些好心的费城人写的 Twitter API 封装类][5]LCTT 译注Twitter API 封装类是由 Mike Taylor 等一批费城人在 github 上开源的一个项目),我开始下载我所有关注的人和我所有的关注者的简介。我马上就发现推特的速率限制是很低,因此我随机的采样了一部分用户。
我写了一个初步的程序在所有我关注的人的简介中搜索一个和性别相关的代词。例如如果简介中包含了“she”或者“her”这样的字眼可能这就属于一个女性如果简介中包含了“they”或者”then“那么可能这就是性别位置的。但是大多数简介中不会出现这些代词。对于这种简介,和性别关联最紧密的信息就是姓名了。例如:@gvanrossum的姓名那一栏是“Guido van Rossum”第一姓名是“Guido”这表明@gvanrossum是一个女的。当找不到代词的时候我就使用第一姓名来评估性别估算数字。
我写了一个初步的程序在所有我关注的人的简介中搜索一个和性别相关的代词。例如如果简介中包含了“she”或者“her”这样的字眼可能这就属于一个女性如果简介中包含了“they”或者“them”那么可能这就是性别未知的。但是大多数简介中不会出现这些代词。对于这种简介,和性别关联最紧密的信息就是姓名了。例如:@gvanrossum 的姓名那一栏是“Guido van Rossum”第一姓名是“Guido”这表明 @gvanrossum 是一个女的。当找不到代词的时候,我就使用名来评估性别估算数字。
我的脚本把每个名字的一部分传到性别检测机中去检测性别。[性别检测机][6]也有可预见的失败比如错误的把“Brooklyn Zen Center”当做一个名叫“Brooklyn”的女性但是它的评估结果与FollowerWonk和Twitter的相比也是很合理的
我的脚本把每个名字的一部分传到性别检测机中去检测性别。[性别检测机][6]也有可预见的失败比如错误的把“Brooklyn Zen Center”当做一个名叫“Brooklyn”的女性但是它的评估结果与 FollowerWonk Twitter 的相比也是很合理的:
| | 非男非女 | 男性 | 女性 | 性别未知的 |
| ----- | ---- | ---- | ---- | ----- |
@ -53,15 +53,13 @@ FollowerWonk的分析显示我的关注者中81%的人都是男性,很接近
### 了解你的数字
我想你们也能检测你们推特关系网的性别分布。所以我每月花费10美元将“Proportional”应用发布到PythonAnywhere这个便利的服务上
我想你们也能检测你们推特关系网的性别分布。所以我将“Proportional”应用发布到 PythonAnywhere 这个便利的服务上,每月仅需 10 美元
><www.proporti.onl>
这个应用可能会在速率上有限制否则会失败因此请温柔的对待它。github上放了源代码[代码][7] ,也有命令行的工具。
是谁代表了你的推特关系网?你还在忍受那些在过去几十年里一直在谈论的软件的不公平的分布组吗?或者你的关系网看起来像软件行业的未来吗?让我们了解我们的数字并且改善他们。
> <www.proporti.onl>
这个应用可能会在速率上有限制超过会失败因此请温柔的对待它。github 上放了源代码[代码][7] ,也有命令行的工具。
是谁代表了你的推特关系网?你还在忍受那些在过去几十年里一直在谈论的软件行业的不公平的男女分布吗?或者你的关系网看起来像软件行业的未来吗?让我们了解我们的数字并且改善他们。
--------------------------------------------------------------------------------
@ -69,7 +67,7 @@ via: https://emptysqua.re/blog/gender-of-twitter-users-i-follow/
作者:[A. Jesse Jiryu Davis][a]
译者:[Flowsnow](https://github.com/Flowsnow)
校对:[校对者ID](https://github.com/校对者ID)
校对:[wxy](https://github.com/wxy)
本文由 [LCTT](https://github.com/LCTT/TranslateProject) 原创编译,[Linux中国](https://linux.cn/) 荣誉推出