作者:薛晖(奥创)

近日，阿里巴巴人工智能治理与可持续发展研究中心(AAIG)负责人薛辉在2021年中国人工智能产业年会安全人工智能论坛上发表了题为人工智能治理与可持续发展的实践与思考的主题演讲，分享了阿里巴巴过去几年的思考与探索。

一、AI技术发展和存在的问题

技术发展

在过去的几年里，人工智能在应用和技术本身方面取得了发展和进步。

第一个例子是自动驾驶。以阿里巴巴为例，小蛮驴在日常物流配送、双11促销期间物流支持、疫情期间上海物资保供配送等方面发挥了积极作用；新一代研发的大蛮驴，即无人驾驶卡车，在浙江省德清县获得第一名L4级路测牌照。

第二个例子是城市大脑。目前，城市大脑已在全球23个城市建设，在交通拥堵控制、公共安全和城市管理中发挥了重要作用。今年6月，四川省成都市成宜云智能高速公路实现了157公里全线覆盖车路协调

第三个例子是AI for Science。我们也看到过去一两年，AI它在帮助生命科学、物理和数学方面取得了显著的成就。过去，我们基础学科研究的主要范式是理论推导和实验分析；如今，人工智能的出现带来了新的可能性，预计将大大提高研究人员的效率，使他们能够到达更远的无人区。

然而，深度学习仍然存在瓶颈和局限性。纽约大学的Gary Marcus2018年发表的论文《Deep Learing：A Critical Appraisal》提出了十个问题，很多还没有有效解决。前段时间，OpenAI和Google在基于海量数据预训练的生成模型上投入大量精力，Dalle-2和Imagen它也取得了许多令人惊叹的结果，但似乎仍然无法区分一些基本概念。例如，人类可以很容易地区分骑马的宇航员和骑马的马，但对于AI很难区分这两个概念。

创造更强大、通用的人工智能的方向很多，例如继续将现有的深度学习和神经网络做强做大，或是引入符号处理，建立世界模型等等，当下的我们还很难断言哪一条道路才是对的。唯一明确的一点是，这条路不容易走，可能需要一代人甚至几代人来探索。然而，人工智能引发的问题和争议足以引起重视，迫切需要解决这些问题。

技术缺陷

首先，智能系统存在安全隐患，可能造成重大事故。

第一个案例是关于自动驾驶的。根据美国交通管理部门发布的数据，过去自动驾驶造成的事故并不少见，而且大多是严重事故。原因是目前基于数据驱动的人工智能仍然相对脆弱，我们往往无法预测和解释所有的现场情况。例如，当我们遇到白色车厢时，车辆上的传感器可能会被误认为是天空。

第二个案例是关于对话模型的。智能扬声器在对话中被曝光，说服病人放弃治疗或自杀。由于数据质量不均匀，模型训练就像一个黑盒子，使用大量的数据来监督和学习大型模型（如GPT-3)也可能存在不确定性，结果可能难以预测和控制。

第三个案例是关于图像恢复的。FaceApp它是一种流行的社交产品，具有包含图像增强算法的功能，可以将低分辨率图像变成高清图像，但当输入黑色图像时，输出结果变成白人。尽管许多媒体指责涉嫌种族歧视，但主要问题可能是由于训练过程中有意识或无意识的数据偏见。

技术滥用

其次，如果我们过于强调一项技术在某一方面的功能优势，但不考虑可能用于非正义用途，一旦大规模推广，就容易滥用。

第一个案例是关于个人隐私和数据安全。在Facebook剑桥分析违反了对用户隐私协议的承诺，向第三方公司披露了约8700万用户数据，并用于支持美国前总统的竞选。

第二个案例是关于深度合成的信息传播。通过Deepfake技术改变面部和声音以伪造身份和欺诈的情况并不少见。从最初的对抗网络和自编码器到最新的高分辨率扩散模型，深度合成的效果越来越逼真，但防御和对抗的手段仍然相对滞后。

第三个案例是关于深度学习的能耗。大型模型的参数从最初的数亿到数十亿到现在的数万亿甚至数十万亿。虽然识别和生成效果有了相当大的提高，但在训练和推理阶段需要消耗的额外资源不容忽视。谷歌和伯克利的研究人员也研究了模型参数和碳排放之间的关系，谷歌的技术伦理研究人员也提出谨慎对待大型模型，部分因素是能耗。在训练阶段提高模型的再利用率，在推理阶段选择更高效、更实用的适应方式，是建立良好模型生态的方向。

AI 潜在的社会问题

最后，还应考虑人工智能应用带来的潜在社会问题。

第一个案例是关于个性化推荐中的信息茧房。在现代社会生活中，我们花越来越多的时间在手机上，手机对我们的影响越来越深，甚至可能主导我们获得的信息。

第二个案例是关于外卖骑手的调度决策。2020年，一篇题为《外卖骑手，被困在系统里》的文章被热搜，反映了我们应该如何妥善处理系统与人之间的关系，特别是在一个高度自动化的决策场景中，尤其是在这个场景中被人类自己决定的时候？

第三个案例是关于目前流行的虚拟空间。从Meta如何规范虚拟世界中的不道德行为？现实世界的法律规范和道德伦理能否用于数字孪生世界？在大步走向虚拟空间的同时，我们也需要足够的时间去思考这些问题。

二、人工智能治理

也许有人会想AI缺陷、滥用和社会影响远离我们，更危言耸听。当我们每天处理问题时，我们总是期待AI它可以表现得更好，但事实上，这些问题确实存在。以电子商务平台风险控制管理为例：

1)平台不允许销售保护动植物，因此需要识别这些类别，但它们在外观上往往与非禁止销售的类别非常相似，甚至没有专业知识的人也很难区分。如何将专家知识注入感知系统，从而形成真正的认知视觉，是一个值得探索的问题。

2)在安全风险控制场景中，新发现的风险类型往往需要紧急处理，通常缺乏足够的样本或足够的时间来标记样本。该模型对少样本和开放域识别提出了很高的要求。

3)在安全风险控制场景中，AI它将面临恶意的对抗和攻击。以输入数据为例，面对精心准备的、扰动的对抗样本，或使用深度伪造技术合成的虚假数据，我们的系统和识别算法需要具备更强的鲁棒性。

4)千万商家，十亿消费者，每个角色都有自己的利益诉求，同时也面临着黑灰生产的攻击，在这种动态变化的环境中保证公平，定义什么是公平，也是一件极具挑战性的事情。

在看到这些问题后，我们近年来也特别提倡好技术的概念一是建立负责任的技术体系；二是实践人人受益、责任担当、开放共享”的好科技。

建设负责任的技术体系

在我看来，负责任的技术体系就是建立一个可用、可靠、可信、可控的智能化系统。

首先是可用的技术，即技术本身必须要符合国家法律规范和公共政策，例如隐私安全和未成年人保护等等；

其次是可靠的技术，具备在未知或对抗环境的鲁棒性，在金融风控和自动驾驶等特殊场景这一点尤为重要；

再次是可信的技术，必须具备公平性和可解释性的特点，能够被人类所信任，只有这样才能得到大范围的应用和推广；

最后是可控的技术，我们应尽力避免算法失控，为自动化决策系统增加人工干预的能力。

践行“人人受益、责任担当、开放共享”的好科技

除了要建设负责任的技术体系外，我们也希望持续践行“人人受益、责任担当、开放共享”的好科技。

1）人人受益：阿里巴巴一直把“客户第一”作为内部第一的价值观，不仅关注当下服务的消费者和商户，更加会关注到每一个人，尤其是其中弱势群体。例如，我们围绕信息无障碍做了大量的工作，目前阿里巴巴旗下的12款主流APP都添加了无障碍功能。优酷中就提供了子女可以帮助父母远程点播视频的功能；各个APP都经过了增大字体和图标、减少广告等适老版改造；对于视障群体我们提出了“读光计划”，利用端侧的OCR技术、带方言功能的语音能力，对手机屏幕进行播报，方便这一类消费者使用我们的产品，这背后的核心是让数字服务不产生数字鸿沟。

2）责任担当：利用科技服务国家重要方向和重点战略，是科技企业应尽的职责。过去几年，阿里巴巴在反诈、农业、环保、抗灾，双碳等方面都有参与，也取得了一定的成果。例如，阿里巴巴积极响应了减碳、双碳战略，在去年发布了《阿里巴巴碳中和行动报告》[01]，在报告中介绍了绿色物流、商品回收、采用更加清洁的能源和更少能耗的计算体系等相关举措和技术，借此在2030年前实现自身业务运营的碳中和目标。

3）开放共享：数字化的道路上不能只有一家或几家公司跑在前面，“授人以鱼不如授人以渔”，这是阿里巴巴一直贯彻的理念。在算法技术开放方面，阿里巴巴持续在操作系统、数据库、大数据&AI等多个领域启动自主开源项目，拥有超过3万名贡献者，位列中国企业开源活跃度榜首。

例如在隐私计算方面，我们开源了两项高质量开源工作，一项是达摩院研发的一套可支持大规模、高效率的联邦学习异步训练引擎Federated Scope [02]；另一项是阿里安全研发的猎豹 [03] 两方计算引擎，性能比之前业界最好工作还要快5倍以上。众所周知，数据是人工智能的最关键要素，在确保隐私保护和数据安全的前提下进行数据流通是社会各界都非常关注的点。我们将这两项技术开源，也是希望通过隐私计算技术的开放共享，推动数据在安全可控的前提下开放共享，最终促使数字经济的高质量发展。

三、建设负责任的技术体系

建设可用、可靠、可信、可控的负责任技术体系，将是今后我们的主要工作。

可用技术

具体来说，技术的可用性是前提。以之前颁布的《互联网信息服务深度合成管理规定（征求意见稿）》为例，其中明确提出，无论是作为深度合成的服务提供者还是服务使用者，都需要履行主体责任，包括需具备对合成内容的识别和追溯能力。阿里巴巴在深伪识别和数字水印两方面都有长期的布局和多年的投入。在深度伪造识别方面发表过多篇论文，例如在CVPR2021的这篇文章中，我们发现在相位上原图和不同的变换方法更具区分性，相关技术也帮助我们在中国人工智能竞赛的视频伪造检测赛道中获了A级证书。数字水印是解决合成内容溯源的有利武器，这方面阿里安全也深耕多年，是国内少数几家通过严苛的国际认证的企业之一，其水印的抗攻击鲁棒性和视觉不可见性也都非常领先。

可靠技术

技术的可靠性是负责任的重要体现，因为在某些关键场景中，技术失败的后果往往难以承受。我们在攻击和防御上都有一些代表性工作，例如在CVPR 2021上发表的论文，提出了一种利用激光笔干扰物理世界摄像头的攻击方法，并分析了其错误发生的成因和机理。在防御方面，我们在CVPR 2022上提出了一种可以和Transformer有机结合的、更加鲁棒的视觉模型架构。从图中可看出来，这种RVT的方法在干净数据集上的效果可以与最新的技术相媲美，在鲁棒性测试上则体现了巨大的优势，这部分工作我们也已开源，大家有兴趣可以关注该项目 [04]。

可信技术

关于可信技术，这里重点谈谈公平性问题。过去，大部分学术界关于公平的讨论，还是限定在一个简单的、静态的环境中，例如多以就业和信贷为场景，研究在性别、民族等少数几个关键属性上的结果差异。

然而真实的场景和问题要复杂得多，我们来看一个例子：

以电商平台为例，我们既需要解决消费侧的信息茧房问题，又需要解决供给侧的马太效应问题。此外，经济利益也会驱使一部分不法商家利用作弊等手段获取非正常的流量，这将导致平台经济体系的公平性被打破。

因此淘宝的搜索和推荐业务配备了一支相当规模的、非常专业的反作弊团队，建设相关的系统，通过对线上网络世界的操作行为进行分析发现异常，并结合线下真实世界的位置聚集和变化规律发现团伙嫌疑，构建多视角的图神经网络，打击不法商家和黑色产业链的违法行为。

可控技术

最后是技术可控，我们在使用“高度自动化决策算法”时应该慎之又慎。以“骑手困在系统里”这一问题为例：

1）当下出现“骑手困在系统中”的问题，其实原因并不是像很多人所理解的算法过于强大，而恰恰是算法还不够先进。不同于在传统的车间、厂房去定制工作计划，在这样一个开放、复杂、动态的工作环境下依靠人工去调度决策劳动力的分配是不现实，必须坚持靠技术和算法，一是需要纳入和考虑更多的数据，例如恶劣天气、交通拥堵和用餐高峰等；二是需要设计更加强大的算法，能够对异常情况做更好的判断和处理。

2）我们不应让算法主导所有重大决策，还需要业务专家和伦理专家对产品设计和奖惩规则进行评审，例如坚决落实“算法取中”、匹配灵活配送时长等；同时，在关键链路上增加人工干预的机制，例如对意外不可抗力造成的延误采取人工补时等操作。

3）作为这套系统中主要角色的劳动者，要有反馈的通道，例如根据实际状况调节背单量，对用户的差评和超时能够进行申诉，并得到妥善的处理等等。

详细内容可以参考《2022蓝骑士发展与保障报告》。[05]

人工智能治理是一门综合多个学科、智力密集型的工作，也是一门社会科学，需要政府的指导，和社会公众的监督。阿里巴巴一直提倡多元协同治理机制，未来也希望和大家一起推动这个领域的更多进展，让大众更多地了解技术原理和其背后的风险，和行业一起学习交流。

扩展阅读

[01] 2021阿里巴巴碳中和行动报告

https://sustainability.alibabagroup.com/sc

[02] FederatedScope

https://github.com/alibaba/FederatedScope

[03] OpenCheetah

https://github.com/Alibaba-Gemini-Lab/OpenCheetah

[04] Robust-Vision-Transformer

https://github.com/vtddggg/Robust-Vision-Transformer

[05] 2022蓝骑士发展与保障报告

http://www.aliresearch.com/ch/information/informationdetails?articleCode=301971005755232256

资讯详情

阿里在人工智能发展治理方向的思考和实践

一、AI技术发展和存在的问题

技术发展

技术缺陷

技术滥用

AI 潜在的社会问题

二、人工智能治理

建设负责任的技术体系

践行“人人受益、责任担当、开放共享”的好科技

三、建设负责任的技术体系

可用技术

可靠技术

可信技术

可控技术

扩展阅读

动力学技术KTU1121 USB Type-C 端口保护器的介绍、特性、及应用

阿里在人工智能发展治理方向的思考和实践

一、AI技术发展和存在的问题

技术发展

技术缺陷

技术滥用

AI 潜在的社会问题

二、人工智能治理

建设负责任的技术体系

践行“人人受益、责任担当、开放共享”的好科技

三、建设负责任的技术体系

可用技术

可靠技术

可信技术

可控技术

扩展阅读

动力学技术KTU1121 USB Type-C 端口保护器的介绍、特性、及应用

最近热搜

历史搜索 清除历史记录

历史搜索清除历史记录