简介:大数据分析是检查具有各种类型的大量数据并快速生成以识别隐藏模式、未知相关性和其他有用信息的过程。在现代汽车集团的研发中心,有许多类型的机器能够以前所未有的规模生成数据。作者开发了一种名为VDMS的车辆信号采集设备。这种类型的传感器每天在大数据系统上存储超过1TB的数据。因此,分析不断增加的数据量和高速流传感器数据的能力是必不可少的。本文研究了传感器数据的分析方法,首先,建立了从信号数据相关性分析到分类模型的分析过程,并开发了针对信号优化的分析方法。另外,提出了一种将异常信号数据形成图案并检测特定图案的方法。
简介:本文通过分析交通违法行为相关业务数据,提出一种驾驶证买分卖分嫌疑记录的检测和推定方法。首先,针对业务数据高维度、噪声大的具体特点,采用基于流形学习的方法,借助内禀流形的识别对业务数据进行非线性降维,同时降低噪声实现提升数据质量,其次,由于目前驾驶证买分卖分嫌疑都是专家基于业务经验的推定,针对已推定样本数量有限并具有一定不确定性的特点,进一步在流形正则化的框架下,结合半监督学习方法,利用大量未推定样本集的内在几何结构,提炼并改善专家的经验知识,并将其应用到未推定数据上最后,基于交通违法行为相关业务数据的分析,实现对驾驶证买分卖分嫌疑的高通量检测和自动化推定。