当前位置:
时建中:治理算法与算法治理
时间:2021-11-26   来源:   责任编辑:

时建中:治理算法与算法治理

中国政法大学副校长兼数据法治研究院院长、国务院反垄断委员会专家咨询组成员时建中教授在10月10日举行的“数据治理与隐私保护”高端研讨会暨网络空间治理与数字经济法治(长三角)研究基地启动仪式上发表主旨演讲。演讲内容整理修改如下:


从功能的角度来讲,算法是发现数据之间相关性从而配置数据资源并实现数据价值的机制。作为数据资源价值的发现机制、配置机制和实现机制,算法在数字经济运行过程中扮演着非常重要的作用。数据治理就是通过政府监管、平台自治和社会共治等机制综合施策,规范数据的收集、存储、使用、加工、传输、提供、公开、删除等行为。在数字化时代,任何一种数据行为都须借助算法。因此,数据治理的核心是治理算法和算法治理。算法或许具有工具属性,但是,算法黑箱、歧视、失范等问题,则反映了算法研发和运用的伦理观和价值观取向。只有作为治理对象的算法被纳入了法治轨道,公平、透明、非歧视的算法才能作为治理工具实现数据治理的目标,提升数据治理的能力。

我国数据安全法第三条第一款规定,“本法所称数据,是指任何以电子或者其他方式对信息的记录”。基于这一定义,可以得出如下两个结论:第一,数据是对信息的记录,也即数据是信息的载体;第二,数据有两种表现方式:电子方式与非电子方式。我国个人信息保护法第四条第一款规定,“个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息”。基于这一定义,个人信息有两种记录方式,电子方式和非电子方式。所以,个人信息保护法所保护的个人信息,同时受到数据安全法的保护。随着数字技术的不断进步和广泛运用,个人信息主要以电子方式记录,以电子方式记录信息的数据将成为最主要的方式。在数字化背景下,“数据治理”语境下所讨论的数据主要限于电子方式记录信息的数据。因此,有必要区分电子方式的数据、信息和非电子方式的数据、信息,提高数据监管治理的针对性和有效性。无论如何,数据安全法和个人信息保护法都将成为数据治理的重要法律依据。

就隐私、私密信息和隐私权而言,我国民法典也有相应的规定。例如,民法典第一千零三十二条规定,“自然人享有隐私权。任何组织或者个人不得以刺探、侵扰、泄露、公开等方式侵害他人的隐私权”。同时,该条第二款规定,私密信息属于隐私。根据民法典第一千零三十三条规定,除法律另有规定或者权利人明确同意外,任何组织或者个人不得处理他人的私密信息。我们可以小结如下:自然人享有隐私权,他人不得侵害。私密信息属于个人信息,是隐私。除法律另有规定或者权利人明确同意外,处理他人的私密信息,构成侵害他人隐私权。此外,根据民法典第一千零三十四条第三款规定,个人信息中的私密信息,适用有关隐私权的规定;没有规定的,适用有关个人信息保护的规定。综上,规范收集、存储、使用、加工、传输、提供、公开、删除个人信息的数据处理行为,涉及私密信息的,须遵守民法典有关自然人隐私以及隐私权保护的相应规定。个人信息保护法也是自然人隐私保护法,数据安全法也是隐私安全法。加强算法治理,规范数据处理行为,有助于自然人隐私和隐私权的保护。

数据安全法第三条第二款规定,“数据处理,包括数据的收集、存储、使用、加工、传输、提供、公开等”。个人信息保护法第四条第二款规定,“个人信息的处理包括个人信息的收集、存储、使用、加工、传输、提供、公开、删除等”。比较前述规定,数据处理行为与个人信息的处理行为的典型样态呈现为“七同一异”:均包括“收集、存储、使用、加工、传输、提供、公开”,个人信息处理行为在这七种行为的基础上,还有“删除”行为。在数字化时代,包括私密信息在内的个人信息主要是电子方式记录,侵害自然人隐私和隐私权的行为,可以发生在数据处理的任一环节的任一行为。因此,仅仅预防和制止过度采集个人信息的行为还不足以保护个人信息,数据治理不应止于数据的收集环节和行为,无疑应该延伸到存储、使用、加工、传输、提供、公开以及删除等各个环节。如果数据治理不能形成闭环,一样会导致数据治理失效、数据处理行为失序,包括私密信息在内的个人信息就不会得到有效保护,就会受到侵害,甚至不能得到有效救济。数据治理延伸到哪里,算法治理就应延伸到哪里。

数据以及个人信息的处理离不开算法。换言之,算法是数据处理的核心机制。例如,在数据的收集环节,收集什么数据、在多大范围收集数据、收集多少数据,这是基于算法通过计算机软件来实现的。目前,在面向消费的互联网经济活动中,商家信奉“数据为王”,数据收集倾向于范围越大越好,数量越多越好,甚至大量频繁地访问用户手机等终端设备,收集与平台现阶段主营业务并无关联的个人信息数据。在收集数据的同时,平台需要通过算法确定存储数据的范围和方式,以实现数据数量、质量与存储成本之间的均衡。数据的收集和存储,解决了有没有数据的基础问题;数据的使用、加工才是实现数据价值的关键环节,解决为什么用数据、用什么数据、用给谁以及怎么用等关键问题,可以这样讲,离开了算法就无法实现数据的价值;数据的传输、提供、公开,涉及数据的对内和对外分享,在数据成为竞争力基础的背景下,算法成为了数据分享决策的必要机制。甚至,在数据行为监管不断加强的法治背景下,算法成为了探索法治边界、尝试规避法治的机制。

从商业运用的角度,用户数据可以分为三类:身份数据、行为数据和关系数据。这三类数据可以反映出该用户或者消费者有无商业价值以及商业价值的大小。APP是消费互联网的实现形式,也是用户进入消费互联网的通道。用户登录数字技术支撑的各种APP的过程是程式化的,对于APP预设的程序性要求,即使不合理也只能无奈地点击同意,除非放弃使用。每个用户的身份都已经被以电子形式记录并数字化;每个用户的线上行为都已经数字化,线下行为也反映在线上并被数字化;进而,用户与商家及其提供产品或者服务之间的关系、与其他用户之间的关系都已经被数字化。可以这样讲,收集海量的用户身份数据、行为数据身份和关系数据是搭建商业模式实现商业目的的基础;高能的算法黑箱是实现商业目的的利器,例如,大数据杀熟、二选一等行为均需要算法予以实现;强大的算力技术和基础设施是实现商业目的的支撑条件;雄厚的资本加持是实现商业目的的经济保障。

目前,算法存在三大问题:一是算法透明度不够,像黑箱一样。二是算法歧视,表现为算法不公平、不正义。三是算法违法,例如,通过算法实施一些违法的数据处理行为。这三个问题有两大根源。一是价值层面,算法运用者的商业伦理出了问题;二是算法监管制度供给不够、不优、不力。与实体经济相比较,数字经济更具有开放性。如果说区域性是某些实体经济的固有特点,开放性则是所有类型数字经济的共同特征。地方立法效力的区域性与数字经济的开放性有可能是冲突的,如果地方保护在数字经济领域抬头,则会伤及全国的数字经济。

只有算法得到有效治理,才能成为数据治理的强大武器,才能更好地推动产业数字化、数字产业化,才能赋能实体经济,才能更好地维护消费者利益。只有把算法关进法治的笼子,用法治化的算法发现数据之间相关性从而配置数据资源并实现数据价值的机制,数字经济才能够更加健康发展。(时建中)