让平等不止于口号

以软件开发团队为例

Posted by Xiaozhe Yao on February 1, 2021

平权运动

自20世纪起,全世界的女性、少数族裔、性少数群体等掀起了平权运动。这其中有我们熟知的、马丁路德金博士的“我有一个梦想”的宣言,有社会主义的中国里“妇女能顶半边天”的口号,有“Black Lives Matter”的运动,也有“Be Proud”的 LGBT 群体的抗争。

190.jpg

这些一次次的运动逐渐让平权意识成为了社会的主流 —— 即使现在还不是,迟早有一天也会是。在这些运动、口号中,潜藏着人人生而平等,生而自由的潜台词。这样的潜台词早在 1776 年的《独立宣言》中就被提出了,但为何时至今日,人们仍然在为“人人生而平等”这一理念而奋斗?

潜规则

歧视无处不在,即使在瑞士这样号称“高度发展,高度平等”的社会。这种歧视并不会表现在表面上,而成为了一种潜意识。通常大家不会把这种歧视叫做歧视,而是“潜规则”。

最明显的一个例子便是,招聘时会“潜意识”里优先选择男性。这甚至被很多人认为是“合理”的,因为男性不会因为生育而要求产假,从而可以“提高工作效率”。其余的例子还有很多,例如一些工作会更不倾向于招聘有色人种,因为担心会对客户造成心理负担。我必须检讨,在很多年前我也曾因为打车遇到黑人司机而有潜意识里“提心吊胆”的感觉。

这种潜意识里的歧视要比明面上的歧视更难避免:人们并不会告诉你,不招聘你的原因仅仅是因为有一个男性候选者,而他不会要求产假。也不会告诉你不招聘你的原因是有一位白人候选者:这种潜意识的歧视已经深深扎根在脑海里,让人们认为只要招聘女性或是少数群体便一定带来负面作用。人们把它放在脑海里,表面上不去触碰它,实则在不断加强这种固有印象。

这种潜意识的歧视甚至已经出现在了计算机算法中。例如亚马逊公司的招聘算法被指责不喜欢女性

Amazon.com Inc’s machine-learning specialists uncovered a big problem: their new recruiting engine did not like women.

亚马逊的机器学习专家爆出一个大问题:该公司新的招聘工具不喜欢女性。

人们把对多样性的追求认为是一种“政治正确”。恶意地想的话,人们认为保持多样性,性别平衡是一种“正确而无用”的事,甚至有可能对公司造成负面影响。而“政治正确”并不能打消人们这种“正确而无用”的评价,因为它确实没有包含更多有用的信息。

这也是我们认为,对平等的追求时至今日仍然“前路漫漫”的主要原因:没有明显的好处。

一项调查

试图从理论上证明多样性有好处是很难的,甚至感到无从下手。我们只能从一些小例子中管中窥豹,进行一些粗浅的统计学分析。这也是我今天试图介绍的一项工作:Chen, Yingying, Weijie Niu and Xiaozhe Yao. Diversity in Open Source Software Community and its Impact on Software Quality (2019).

在这项工作中,我们试图从一个软件开发者的角度,从统计的角度证明:从软件开发的角度,招聘一个让你的团队更多样的候选者,要利大于弊。例如:女性开发者、出生于不同国家的开发者、经验不同的开发者。更具体地来说,我们在开源社区分析了 857 个较为优秀、受到较多关注的软件项目,并分析了它们的贡献者的来源和相应的代码质量/效率。我们使用不同的尺度来衡量多样性,例如 Blau Index。

我们以性别多样性和软件质量的为例来说明:

从上图中,我们可以比较清除地看到:尽管很多项目都是由同一性别,甚至是同一个人做出的,但更多样化的团队往往会带来更高质量的软件项目。两者是一个正相关关系。

这背后可能有很多原因,例如女性开发者和男性开发者的视角可能有所不同,对项目的关注点也不会完全一样。通常认为这种不同可能会导致沟通失调,从而拖慢进度,导致质量下降。但我们可以通过调查发现,恰恰相反,这种不同使得总的质量升高,缺陷的数目下降。我们完全认可这种不同可能导致争执甚至对抗,但是对于工作来说,它仍是利大于弊的。

批评声音

我们收到了很多的评论和批评。相比于罗列这些评论,我打算首先讨论一些我自己的想法和过程中的缺点:

  • 我所收到和认为的的最核心的评价是:平权本身应该是深入人心的理念,而不是一件“需要努力去证明”的事。我很难不赞同这个理论,甚至我本身也很支持。但是这个问题有些过于复杂,我将在附言中详细描述我的观点。
  • 我们的数据量太少太少了。我们只分析了 857 个单一语言(Go)的项目,因为这个语言我熟悉,且我了解它适合团队开发。这使得图中很多项目的质量都被过高地估计了。同时,我们本以为使用该语言,且较受欢迎、比较活跃的项目会比较多,可实际上的数目(857)远远低于我们的估计(2000+)。
  • 我们使用的分析工具并不能支持跨语言的分析,因此我们只能局限我们自己在单一语言。
  • 我们只分析了软件开发团队和开源软件项目。这在一定程度上可以反映现状,但并不是一个全景式的分析。具体的情况很有可能根据国家、地区有所不同。实际上,我认为这种现象很有可能也会出现在其他的领域和行业,这种调查在其他行业也会是大有裨益的。但圄于时间和专业性,这些工作还是需要更专业的人去做。
  • 这不是一个关于“政治正确”的分析。我们在一开始的目的是提供“政治正确”的补充,即从另一个角度的观察:多样性有实质性的帮助。我们收到了一些关于这篇文章“政治不正确”的评价,例如:“你这个调查的时候居然不允许第三种性别,这不正确”。谢谢你的建议,但我认为,仅允许第三种性别也是一种政治不正确,因为还可以有:“我虽然是个男性,但是我觉得我是个女性”等等种类。这会偏移我们的分析重心。

另外我们也收到了很多积极的评价和建议,例如:

image-20210204215755168

image-20210204215735864

在此一并对他们表示感谢。

最终总结

这篇文章的结论可能是不值一提的:它局限在一个很小的方面,用很小的数据得出了一个勉强的结论。更重要的是,我们希望通过计算机的算法来分析人类社会,并以此作为支撑来“使世界变得更好”。有时这是反人类直觉的。例如我们也曾分析了百万条 Twitter 上大家对 Covid-19 的情感变化,得出了“都是些机器人在说话”的结论。这也很正常,以人类的复杂,想通过几百数千条数据来证明一些观点实质上是不可能的,只能管中窥豹。

但这种尝试,至少我认为,又是很有意义的。这种尝试证明了,我们可以通过调查,统计,计算的方式来明确地发出声音:人人生而平等,君子和而不同!相比于 1776 年时人们有些乌托邦的理想,此时我们的声音更加有理性和数据的支撑,无疑会更加雄壮而有底气。

附言

平权本身应该是深入人心的理念,而不是一件“需要努力去证明”的事。我双手赞同、支持、庆祝这一观点。但很不幸,不是所有人都和我持有相同的观点。更不幸的是,持有反对观点的大多数情况下处于某种支配地位,例如 WASP,男性管理者等。我怀有恶意地想,他们不是不清楚、不了解这种想法,而是因为立场原因反对平权。

尽管可能是出于立场,我仍然尊重他们的这种想法——即使我不尊重,也没有更好的办法,除非打一架。在微博上,我几乎每天都能看到这种争执和对抗。但由于信息茧房的原因,大部分情况下都只是在无限加强固有的想法。所以我不认为再次试图让平权深入人心有太好的效果——立场问题的强度远远大于一件“政治正确”的事。即使从我个人的角度来看,让政治立场代替独立、深入、细致的思考和调查是一件十分恐怖的事,无论结果是正确还是不正确。我请读者朋友思考一个问题,我们因为政治立场而做出的决定,即使当时看来无比正确,结果都还好吗?

我更相信科学实证主义,即只有运用观察、调查、分类、统计得出的现象,获得的结果才是正确可信的。所以如果假设我是一个已经持有立场的人,我是断然不会仅仅因为政治正确而接受这种观点的(当然我也不会反对,一个没有科学依据的事儿,连对错都谈不上)。

Anyway,对于一个持有立场的人,试图通过政治正确来说服他我觉得是不太靠谱的(在我过去短暂的人生中进行过一些尝试,结果也是惨痛的)。相反地,如果有一个人可以拿着论据和资料糊我脸上,尽管可能有很多限制,至少也能达成一定程度的一致,或是至少可以讨论论据中的局限性。

这是需要妥协的。说道妥协,可能脑海里会闪过“政治是妥协的艺术”这句话。这句话的来源似乎是俾斯麦的:

Politics is the art of the possible, the attainable — the art of the next best.

政治是一种寻找可能的,可达成的,次优解的艺术。

所以,我承认对于平权来说,最优解或许是使得平权深入人心,成为一种无需赘述、证明、甚至讨论的观点。但可能我也要承认,我们距离这一最优解还是有一段距离的。当下的次优解,或许就是把每个人拉到一张理性的台面,在实证的基础上来探讨,让每个人都有发声的机会。