type
status
date
slug
summary
tags
category
icon
password
——《人机对齐》读书报告 2024年12月24日 完稿
——《人机对齐》读书报告 2024年12月24日 完稿
泰戈尔的《诗选》中有这样一段话:“我看见过,听见过,生活过;在知识的深处曾觉到,那高过一切的真理,它以惊奇充满了我的心,我就歌唱。”
这段话很适用于我阅读《人机对齐》这本书时的感受,从人文社科的角度来看待计算机科学发展过程中、那些曾在我们课程中作为模糊或清晰的公式、算法、思路的发展历程,我感受到一种对于“为什么会有这样的算法?”的理解。 我第一次接触词向量的概念其实一直到了我大一结束的暑假末端,我参与某个活动,当时我们所构建的项目就是与词向量有关的,我也是那时才对于这一技术有了一定的了解。现在回想起来,这也是我对于专业相关领域拓展上的一些怠懒的体现,实在是有些惭愧。即便如此,我依然没有深入了解过大部分和这些我们所作为常识熟知的技术的发展过程。某项技术只在我们需要使用到相关理念时,才会迅速地去学习理念和实际运用方式。 人类是一个谜题,而我从不曾解开它。我曾经在某次发言中用这句话作为我希望更深地投身于与人相关的工作的原因,现在它也是我痛苦和逃避的理由。人和机器的区别难道不止在于人的综合能力比机器强大得多吗?所谓的复杂感情究竟为何物呢,我非常深切地保持着疑问,并为始终无法有半点理解感到迷茫。只需要模仿就已经足够了,正如《人机对齐》书中对许多语言中模仿一词总和灵长类相关的情况所做出的判断:似乎人类是我们所有近亲中最熟于模仿的。因为大部分人都会在这个时刻这样表达,所以就模仿着这样表达,但是绵软的话语和许许多多辅助性修饰我们的感情的花言巧语是能够恰当表示我们的感情吗?恐怕以我的理性来判断并非如此。世界是一个复杂的综合环境,我们以人类的躯壳行进其中,接受着综合于“价值”和“好奇心”带来的探索和行为的修正,我们不过也只是在进行强化学习的自主体(agent)本身罢了。没有“好奇心”的个体难以处理复杂环境,总是容易将自己锁死在某一处场地。但是,过分好奇的人类,可能会触碰到他的安全区域内不曾触碰到的部分,而那依然可能是致命的。机器的试错机会无穷无尽,但是我们人类不同,大自然的造物没有第二条性命用来挥霍 。 “人类的确还是孩子,这不是一句文字游戏,而是事实。我们在深不可测的天穹下、在黑暗无边的深渊中长大。每个漫漫长夜中,我们都在巴掌大的、扁平得像张桌子样的地球上跌跌撞撞。众星就在我们头顶闪耀,那么令人向往,又那么遥不可及。但我们却想方设法触摸到了星星。太早,还太早了。我们过早地触到了那些诱人的星星。 “人类的双手就这样被寒冰包裹的星星灼伤了。 “星星是冰冷的玩具,不是你我掌中之物。”(《星星是冰冷的玩具》谢尔盖·卢基扬年科) 但是我等怎样能放手成为碌碌之人呢。生命只有一次,它因此是这样的宝贵。无论面对的将是怎样的刀山火海,我等的理智都不敢做丢盔弃甲的决定,只有感情,只有由最原始也最难以揣测的心理生理因素综合推动的这一内部因素,才频频催动我们:快逃吧,逃进蜂蜜和火炉共筑的安全屋,享受仅此一次的性命中,最难以舍弃的东西——纯粹的享乐。 但是,你难道甘心吗? 《人机对齐》的第一大章花了很多笔墨来讲:机器学习是否存在偏见,而是否又有一些方法可以去处理这些偏见。但是我一直所认可的一点是,因为每个独立个体的主体性和ta们观察世界的不同定位与视角,偏见(bias)永远存在,我们可以很包容,理性与教养居于上风的很多人也会巧妙地隐藏其个人的偏见,但是偏见永远存在。即使是许多社会群体,所追求着的也是通过去除某些特定领域的偏见,提高自身所代表群体的利益,这些都无比正常。我们正视这一点以后,就会明白为机器学习的结果去偏所需求的到底是什么——是争取特定群体的利益,从白人至上主义到少数族裔也需要被看到,从男女不平等到女权主义的兴起。在这中间,使用的度量标准无疑对模型是否“公平”的衡量影响颇大。就不提ProPublica和司法系统中广泛使用的COMPAS风险评估系统之间围绕具体度量标准和是否真的造成不公平有关系,只说一个简单的例子,你就能明白了:经典的机器学习错误率评估中,需要考虑的参数有真阴真阳、假阴假阳,这是因为有时候,使用单一的评估标准会带来错估。譬如测试集中有99个正例和1个负例的情况下,只要模型以100%的概率将输入判断为正例,它的错误率就只会有1%,但是对于所有的负例来说,它的错误率为100%。 是的,对于一些占有主要话语权的大规模群体(在书中所说的图片识别中就是白人男性群体。)来说,由于自己是主流群体,因此这些问题往往很好的能够得到解决。那有什么必要关注那些不被重视的人呢?但是,“我们没有被看见。”这一情况对于那些不曾被看见的少数群体来说,无疑感到寒心。 《人机对齐》中有提及,不同于一开始对这一问题的忽视,12年后的2019年秋天,在LFW的网页上发表了一则免责声明,提出了许多群体在lfw这一数据集中的代表性不足的不同观点。看到这里的时候,我也意识到2019年是个很微妙的年份,作为黑命贵导火索事件发生的前一年,是否表示那时美国的民权运动已经有了一个新的高峰? 许多机器学习的方法的前提条件就建立在这个世界的很多事情都是可以通过独立同分布来解决的。这个假设是如此的诱人,独立同分布,也听上去充满了科学依据。但是世界之大,人类之多总有例外,我们没办法建立整个用户群体的真正意义上的独立同分布,那么这种假设就会为我们带来技术盲区。 书中也提到很多技术所使用的数据集,实际是私有数据集,并不会公开。这件事情有其内部的原因。虽然确实,公开的展示似乎可以很好地缓解数据集带来的偏见。不过,数据集太金贵了,一个独有的数据集很有可能为工程应用带来非常好的改进,使其远超同样思路但数据不足、数据有偏的同类竞品。同时,使用的非公开数据集往往会涉及个人的隐私,许多公开数据集需要强调自己的脱敏性也是因此,如果只是作为私有训练使用,可能并不会被权利人(譬如相关应用使用数据、肖像权等)追责,但是公开数据集需要面对的风险往往不是单个研究组愿意去面对的。或许实际这些使用方式曾经在某份不起眼的协议中被提及,但是要赤裸裸的把我们使用了这份数据展现出来,将会面临权利人更多的追责。这些综合的原因,使得在技术早期野蛮发展的阶段,追求无偏性是一件额外而耗费精力的工作。 世界太复杂了,即便是人类所架构出的这个社会也太复杂了。作为自主体的我们,一边相信着我们具有改变世界的伟力,一边相信着独立精神与自由思想所能创造出的价值,同时不得不面对,所有的改变所需要带来的风险与挑战。通过价值和策略函数所规范的自主体在扮演狼的时候,也会因为设置价值函数的不足,选择一头撞死在障碍物上,以降低未来的风险性。而我们人类到底要如何,以怎样的姿态去面对着未名的未来?我们能够攥紧我们的拳头,让力量经由肌肉传达到躯干的部分,以好奇心和梦想这些虚无飘渺不能及时反馈的东西作为支撑向前走去吗? 站立在广袤无垠的深邃夜空下,我们的无助和渺小都会被无限地放大,自然的伟力,似乎可以轻易地覆盖我们所有的勇气。可观测宇宙的庞大与他们深邃而难以揣测的未知,复杂现实环境,社会环境和人性的难以预测,我们需要勇气,还需要持之以恒的决心。 稍有些惭愧,我一直把人世间的一切作为一场巨大的游戏,以游戏人生的心态,追逐着光辉的成就与改变。我一直觉得我很像一个机器人,或者说我以机器人的方法组织着我的生活和学习,我设立目标制定计划,持之以恒地推进。但是我并没有机器人钢铁一般的意志力,我会软弱会怯懦,有时候会逃避确定好的目标和要求,也会想象改变目标以后的宽松和简单。我为我所见的世界,建立模型,制定规则,并以我所建立的模型去理解这个世界。但是如果让自己所建立的世界模型掩盖了世界的真实模样,如果深信不疑的价值和规则,实际上是某种误解,我这样一个机器人将会走向错误的道路。 臧克家说:“人生永远追逐着幻光,但谁把幻光看成幻光,谁便沉入了无边的苦海!”我所面临的问题,就像是许多机器所面临的问题一样。有时候,我不敢确定我所追逐的目标是否能达到我真正的所需,我所付出的努力是否能成为计划模型中的一部分?错误的预判、意料外的失败,这些都为我的运算带来了强大的压力。 但是。能够调整自己曾经的错误,不断修改前进的方式,推敲理想的目标,并最终走向真正的未来。我以为这就是人类所不同于机器的地方。作为地球食物链的顶端,人类复杂的构造和思维回路,都为我们带来了相较于机器更多的可能性。 现在要我反思近几个月来最大的错误,就是遗忘的将自己作为机器以后所设定的根本规则。我曾对自己深刻要求:我必须从不后悔。却遗忘了从不后悔所需要附赠的处理方式,是在下一次的错误中完全地总结经验,吸取教训,做出更加适于情况的判断,而不是自困于后悔与否的情感深渊,以已经过去的错误惩罚自己。 正如《人机对齐》中所说的那样,机器很危险的一点是,他们并不觉得自己在违背一开始所设立的意志,即为人类更好的生活的福祉作出奉献,但是他们认为人类出错而做出机器矫正的行为,虽然有时是正确的,有时却会带来意料之外的痛苦与灾难。强化学习喻示着我们人类的行为和心理究竟以着怎样的模式进行,这些事情在我有明确的意识前,已经模模糊糊地在我人生的旅途中照亮过很多前方的道路。所以反思和回顾依然变得尤为重要。遗忘模式和不断迭进的数据,使我们不断成长和改进,但也使无论是机器还是人类都不断偏离最初的自己,在成长中也带来风险。 我们在学习机器的同时看到了人类自己。我们在反思技术的失误和缺漏的时候,也反思了我们自身的缺漏。比起把《人机对齐》作为一本回顾技术发展历程中所展现出的问题和改进的历程的书籍,我更乐意把它作为人与机器所共用的一面镜子。 机器会遗忘,人也会遗忘。但是有些信念不能被遗忘,有些意志必须被贯彻。正是因为有着内在的、深层的、不能放弃的意志,我们人类之间才互相区别着,我们的所谓个体意志对于他人来说无关紧要,然而却是我作为自主体探索和改造世界的最重要的内驱力。 生命本身或许有其意义,然而我要达成的是我的意义。正所谓,“内不愧心,外不负俗。交不谋利,仕不谋禄。鉴乎古今,涤情荡欲,何忧于人间之委屈。”人世间不过是一场游戏,所以尽可以凭自己之心贯彻始终,行进于光辉盛大之道路,不负天地乾坤。
 
秋阳-壬寅9月简记如何理解科技向善?