第15章 数据之海(1/2)
恶臭。
那味道像是粘在了皮肤上,渗进了头发里,嵌在了指甲缝中,怎么也去不掉。林劫躺在冰冷、满是油污的水泥地上,背靠着一个锈迹斑斑的巨大齿轮,大口大口地喘着气。每一次呼吸,肺里都火辣辣地疼,带着地下管道深处那种混合了粪便、化学废料和腐烂物的、令人作呕的甜腥气。他逃出来了,从那个吞噬一切的排水竖井,从冰冷刺骨、污浊不堪的水流中,被冲进了一条更宽阔、水流相对平缓的地下主排水渠,最后在一处坍塌形成的碎石滩上,耗尽最后一丝力气,把自己拖了上来。
这里似乎是城市边缘,某段废弃工业区的地下泄洪道。头顶很高,是粗糙的混凝土拱顶,远处有微弱的天光从一个破损的栅栏口透进来,应该是接近黎明。空气依然糟糕,但至少能呼吸,没有立即被污水淹没的风险。
他瘫在那里,一动不想动。全身每一块肌肉都在尖叫,骨头像是散了架。制服早已看不出原色,被污水浸透,又沾满了黑色的淤泥和不明污物,紧紧裹在身上,又冷又沉。脸上、手上布满了被管道内壁和杂物刮出的血口子,被污水泡得发白、刺痛。左臂有一道较深的伤口,可能是被尖锐的金属边缘划的,还在缓慢地渗着血,混合着污水,看起来触目惊心。
但他还活着。
他侧过头,剧烈地咳嗽了几声,吐出几口带着铁锈味的浊水。然后,他挣扎着,用颤抖的手,摸了摸胸口。
隔着湿透、冰冷、污秽的衣服,能感觉到一个坚硬的、书本大小的轮廓。还在。那个用多层防水材料紧紧包裹的加密存储器,以及那个超低功耗的预处理单元,都还在。它们贴着他的皮肤,是他用命换来的,也是此刻唯一能证明他存在价值的东西。
他必须立刻检查它们。污水可能渗入,设备可能损坏。而且,他需要知道,他冒死带出来的到底是什么。
但他先得确认安全。他强撑着坐起身,背靠着齿轮,环顾四周。这条泄洪道很宽,大约十几米,两侧是高高的水泥岸堤。他所在的这侧,靠近一个坍塌形成的斜坡,堆满了从上面冲刷下来的建筑垃圾和生活废弃物,形成了一个临时的、相对干燥的“滩涂”。污水在几米外缓缓流淌,发出沉闷的哗啦声。远处透光的地方,能听到隐约的车流声和城市惯有的低鸣,但很遥远。
暂时,这里应该是“清道夫”和巡捕不会立刻搜查到的角落。但他不能久留。天快亮了,一旦日出,从那个破损栅栏口透进的光会更多,也可能有人(哪怕是流浪汉)会发现这里。
他必须尽快处理伤口,分析数据,然后离开。
他先从贴身的内袋里(相对最干燥)摸出一个小巧的密封医疗包,这是“墨影”标准装备之一。用牙齿配合还能动的右手,艰难地撕开消毒纱布和止血凝胶的包装,处理左臂那道最深的伤口。消毒时传来的尖锐刺痛让他额头青筋暴起,但他只是闷哼一声,动作没有丝毫停顿。简单包扎后,他又吞下两片抗生素和止痛药——在这样污秽的环境里受伤,感染是致命的。
做完这些,他才小心翼翼地,一层层解开胸前那个防水包裹。手指因为寒冷和脱力而不断颤抖,解了好几次才成功。包裹最里层是特制的防水袋,密封完好。他打开袋子,取出里面的存储器和预处理单元。
预处理单元的电子墨水屏边缘有些水渍,但屏幕本身完好。他按下电源键,屏幕亮起灰白色的光芒,启动自检。几秒钟后,自检通过。他松了口气,至少核心设备没坏。
然后,他看向那个存储器。火柴盒大小,哑黑色,表面没有任何标识。这里面,装着他在“星港”核心接口室,在“蜂群”无人机的追捕下,在冰冷污秽的管道中亡命时,始终死死护着的、关于“灵河”网络、关于脑波图谱、关于情绪标记、关于“宗师”那冰冷宏大计划的原始数据碎片。
总容量:17.4TB。他只解密和分析了其中极小一部分,大约6.5%。
他深吸一口气(尽量忽略恶臭),将存储器连接到预处理单元。连接成功。屏幕上显示出存储器的目录树。数据文件庞大而杂乱,大部分是高度加密的原始数据流文件,文件名是毫无意义的代码串。
他没有立刻去尝试解密那些最核心的、关于“灵河”和脑波的情绪数据。他先调取了一个在初步筛选时被标记为“数据收集元信息”的较小文件。这个文件记录的不是具体内容,而是关于数据收集范围、规模、时间跨度和源类型的统计信息和描述性元数据。
文件被解密,打开。
首先映入眼帘的,是几行简洁的标题和数字:
“项目标识”:龙吟系统-生物特征数据整合层(Dragont-BIL)
“数据收集起始时间”:系统上线后第147天(约七年前)。
“当前活跃数据源数量”:8,427,193(持续增长)。
“日均新增原始数据量”:~2.1EB(Exabytes)。
“累计存储数据总量”:~3.7ZB(Zettabytes)。(注释:1ZB=10亿TB)
“数据保留策略:原始高精度数据保留30天,后经压缩、特征提取与聚合,长期保存聚合后特征数据及样本片段。永久存档标记样本。”
林劫盯着那些数字,感到一阵轻微的眩晕。不是身体上的,而是认知上的。
八百四十二万多个活跃数据源?这意味着,在瀛海市,有超过八百四十万个“点”,在实时向“龙吟系统”的“生物特征数据整合层”输送数据。这不可能都是植入式设备,绝大多数市民并没有接受过神经植入手术。
那么,这些“数据源”是什么?
他往下翻看源类型分类:
“类型A:植入式/穿戴式医疗/健康设备”:数量~1,205,400。包括:心脏起搏器、胰岛素泵、高级神经刺激器、可监测脑波/肌电的医疗级头环/腕带等。(权限:高级,数据精度高,实时性强。)
“类型B:民用健康/运动监测设备”:数量~5,831,650。包括:智能手环、运动手表、睡眠监测仪、体重秤、甚至部分“智能服装”。(权限:中级,数据精度中,需通过用户协议(通常默认同意)及设备后门获取。)
“类型C:环境交互传感器(间接推断)”:数量~1,280,143。包括:高分辨率公共摄像头(微表情分析)、拾音器阵列(声纹、语音压力分析)、公共交通工具/智能办公家具的压力/姿态传感器、在线行为日志(点击流、停留时间、输入错误率)。(权限:中低级,数据精度较低,需通过复杂算法融合与推断。)
“类型D:主动参与式反馈”:数量~109,000。包括:心理评估应用、互动式广告/内容的情感反馈按钮、部分需要实时生物特征验证的高级服务等。(权限:不定,数据带有明确标签,但样本可能存在偏差。)
林劫的喉咙发干。这不仅仅是监控几个特定目标,这是一张覆盖了几乎全体市民的、立体的、多层次的生物特征数据采集网。
手环记录你的心率和皮电反应(紧张/放松),摄像头捕捉你面部肌肉的微小抽动(厌恶/惊喜),你办公椅的传感器察觉到你坐立不安(焦虑),你在短视频上的停留时间和滑动速度反映了你的注意力波动,甚至你家里那个声称“保护隐私”的智能音箱,可能也在背景中分析着你说话的语调和间隔(情绪状态)……
所有这些看似孤立、无关紧要的数据点,被“龙吟系统”那强大的数据处理能力汇集、清洗、关联、建模。通过复杂的算法,系统能从你散步时的心率变异性,推断出你大致的情绪状态;能从你在屏幕前无意识的揉眼次数,推测你的疲劳程度;甚至能从你在社交媒体上发布内容的用词习惯和回复速度,侧面印证它通过其他渠道对你情绪的判断。
这不再是被动地“记录行为”,而是主动地、系统地、全方位地解读状态。
而每天2.1EB的新增数据量,累计3.7ZB的存储总量……这些天文数字代表的,是七年多来,瀛海市近千万市民每分每秒产生的、海量的、最私密的生理和心理活动的“数字足迹”。这是一片浩瀚无垠的、由人类生物特征和数据构成的沉默的海洋。
本章未完,点击下一页继续阅读。