今年以来,特斯拉一直处于舆论的风口浪尖上,自带吸睛属性。5月份,在柏林项目不顺利的情况下,特斯拉决定放弃上海扩建计划。到了5月25日晚上,特斯拉官方宣布,已在中国建立数据中心。
特斯拉:我们已经在中国建立数据中心,以实现数据存储本地化,并将陆续增加更多本地数据中心。所有在中国大陆市场销售车辆所产生的数据,都将存储在境内。汽车数据安全非常重要,我们坚信,统一规范管理,将更有利于智能汽车的有序长远发展。
这个新闻很有嚼头。表面看,一切平平无奇。科技企业建数据中心,理由就俩字:合规。
官宣的潜台词
数据中心的官宣,特斯拉在参与《汽车数据安全管理若干规定(征求意见稿)》(以下简称“规定”)专家研讨会后宣布的。
目前,网信办的“规定”处于征求意见阶段,尚未进入实施。如果放在新能源汽车这一领域,有人认为有针对特斯拉的意思。因为当前“数据本地化”最大的目标,就是特斯拉。
事实上,根据2016年版《电动汽车远程服务与管理系统技术规范 》(暨国标GB/T32960—2016),已经要求数据本地化。特斯拉想在中国运营,哪怕只做进口车,建立本地数据中心,也是迟早的事。
当然,“数据本地化”没有严格的时限要求,苹果2012年就被要求数据本地化,直到2017年才通过与“云上贵州”合作,建立了本地数据中心。而特斯拉在去年就已经宣布开始建设本地数据中心,今年4月初,全球副总陶琳还在工信部论坛上再次宣布了中心的进展。那会儿,上海车展还没开幕,特斯拉还没有被放在火上烤。
但实际上,研讨会及数据中心建立这事,远比官宣看上去要丰富。研讨会主办者是中国网络空间安全协会秘书处、清华大学互联网治理研究中心、伏羲智库。前两者是一回事,后者是半官方智库。而特斯拉作为唯一公开的企业代表参加,难免有点赴“鸿门宴”的感觉。
研讨会过了5天之后,特斯拉“才”宣布数据中心建成,还宣布未来会有更多本地数据中心。而且,数据中心的地点,去年强烈暗示是贵州,今年则遮遮掩掩不肯明示。看上去,特斯拉正在努力平衡来自官方和民间舆论的要求,努力不显示出自己因背负压力而被迫采取行动。
两套研发体系,在所难免
同时,“多中心”的承诺也表明,特斯拉与苹果对数据的诉求不同。苹果自己不需要使用icloud数据,本身就是100%用户数据,基本是因应法律要求,苹果最多做做统计,提升服务质量之类。
至于尚未实施的“规定”,则又加了一层“紧箍咒”,21项条款中,有些条款比较软性,譬如收集数据要“克制”、数据要“脱敏”、强化消费者知情权等。有些条款相对刚性,譬如收集超过10万人数据要向省网信部门提交年度报告;本地化存储,数据出境要国家级网信评估。
这样一来,特斯拉必须要在中国建立研发中心。由于训练的原始数据要留在中国。在境外不可以接触到中国数据(无论是哪国人),无论是网上传输还是肉身携带,都是违规的。
不仅如此,数据提炼、模型训练和调参、软件更新等工作,也必须在中国进行。影子数据采集自中国用户,训练模型也要针对中国场景。而绝大多数影子驾驶的数据,如果不加以提炼,从深度学习角度,它们的差异性远比人类眼睛看上去要小,对模型训练并无帮助。所以必须要提炼出“特异化”训练场景。譬如,中美连路牌都不一样,不能照搬美国数据生成的模型。
即便如此,难度也很大。因为美国那边也要求数据不能离开美国国境,模型势必要分开训练。中美之间可以传递一些基础的参数,但不能传递数据。训练“流水线”也要中美两边各搭建一个。
目前为止,特斯拉没有提到数据如何使用,是否要建立研发中心。如果想在中国长期做下去,这一点也无可避免,否则用美国的训练模型,还可能捅更大的篓子。
数据主权和智能监管
现在国家层面,透过一系列国标、法规,宣示了数据主权,边界是清晰的。即在中国产生的数据,属于中国。法规还隐含了另一个前提,那就是个人消费者产生的数据,归根结底属于个人,只不过它属于被让渡的权利。作为数据收集方,必须证明自己善意、克制地使用。而且当所有权方(即消费者个人)要求删除数据,必须要在限时内响应。
这就是为什么特斯拉最近火线更改了“知情同意条款”。
未来可能更进一步,数据可以用于牟利。消费者如果止步于无偿贡献数据,显失公平。如果有主机厂带头,可能会产生与用户分享数据利益的生态。对其他厂家而言,这是一种倒逼机制。数据如果是生意,那么它作为整体,价值如何衡量。作为数据的个人贡献者,利益如何分割,那将是全新的业态。
数据中心建立后,特斯拉可以有限排除收集敏感信息,并用于危害国家安全的嫌疑。
这一部分能力的限制,将依靠敏感区域和敏感用户群体的自行规定。至于特斯拉作为坐标标记,绘制位置信息,跟踪重要人物等,甚至引导导弹攻击等,可能是读书太少而想得太多。
这些能力,可以归结为两个基础能力。一个是基于精确地理位置定位,另一个是对特定对象音频视频数据收集上传。
定位要有准确的绝对坐标信息,还要结合精确的街景和建筑物内外格局信息。两者缺一不可。
若只有坐标,而地图商提供的街景数据是扭曲的(这是测绘单位为保密常用的方式),无法精确定位。即便特斯拉能够驶入敏感区域,也无法判定目标性质。除非加入大量的人工分析。
而特斯拉在中国没有测绘资质。从2014年进入中国起,特斯拉一直使用四维图新提供的地图。而基于位置的地图服务商有三种。一种为底层图商,提供基础数据;第二种为地图服务商,提供场景解决方案;第三种是应用图商,提供方案落地。四维和高德为第一种,百度、腾讯则属于第二种。百度地图本身也用的是四维底层数据。因为四维拥有一级测绘资质,百度没有。
所以,当特斯拉将车端地图合作伙伴从四维换成百度之后,底层地图数据服务商并没有换。
底层地图服务商基于位置提供的地图,在关键区域,都有一定扭曲。这是特斯拉作为用户无法改变的,也无法自动修正。它能采集到精确经纬度坐标(靠GPS信号做差分)。对应地图上,存在一定人为偏差。传感器对此也没有修正功能。这样一来,所谓目标引导等战术作用,也不存在。
特斯拉可以一直拥有对座舱内音频数据能力。其实苹果手机想收集用户的生物学数据(面容、指纹、虹膜、声线)和音频视频数据更容易,也更简单。我们为什么不担心浓眉大眼的苹果呢?
在重点区域、部门、人员保密方面,大国都有针对所有电子产品的成熟做法,智能汽车个头那么显眼,纳入监控一点都不难。
对于智能化汽车而言,数据驱动了产品,给产品带来更多能力,还可能带来收益和附带伤害。现在是规范能力边界的时候了,特斯拉又是首当其冲。作为外资独资企业,数据合规只是第一步,后面要做的事还有很多。命运的礼物都暗地里标了价码,果然如此。
暂无评论内容