我曾经听过Google Research发表关于拍卖理论的演讲,特别是关于广告拍卖的数学基础的演讲。 他们介绍了一些拍卖算法,它们的优缺点以及如何衡量算法质量的元问题。
他们指出,好的拍卖必须容易解释且公平。 如果系统太复杂,广告商会认为他们被骗了。
与Cathy O’Neil的著作《数学毁灭性武器》中介绍的数据科学形成了鲜明的对比。我每一章都讲述了一个不同经济领域的故事,以及我们使用统计数据和机器学习的方式判断人的算法。 有以下章节:
- 营利性大学如何定位可以向其出售可疑学生贷款的人群
- 犯罪者的预测模型,以及犯罪行为如何影响警务和量刑政策
- 使用性格测验筛选求职者和筛选简历的趋势
在广告拍卖中,权力关系意味着广告商可以坚持公平和透明的基本水平。 奥尼尔(O’Neil)认为,在大多数情况下,我们使用统计数据来增加进行审判的人员与被审判的人员之间的权力不平衡。 没有这样的公平。
她重申了最严重罪犯的三大原则。
- 这些算法是不透明的。 有时,由于可疑的原因,他们被保密。 使用神经网络,我们不能总是有意义地解释算法正在做出的选择。
- 他们实现了某种垄断能力。 他们不能上诉。 人们学会了游戏占主导地位的算法。
- 它们的反馈循环不良或中断。 如果算法中存在错误,我们需要能够找到并修复它。 但是,某些正在使用的学习模型并没有很好的正确性度量,我们无法使用这些度量来修复它们。
例如,考虑我们可能用于犯罪预测AI的目标指标。 准确的指标可能是“谋杀人数”。但是,谋杀相对罕见,很难从中得出高质量的统计相关性。 作为数据科学家,我可能会添加第二个目标度量标准“更常见的逮捕次数”,以提供更多的统计能力。
糟糕! 我不小心创建了一个自我强化的反馈循环。 更多的逮捕令该模型向附近派出更多警察,然后由他们进行更多的低级骚扰逮捕。