大数据清洗

  浏览:2881次     |      2020-05-16

11111111.jpg


数据清理从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。一般针对具体应用,因而难以归纳统一的方法和步骤,但是根据数据不同可以给出相应的数据清理方法。

解决不完整数据(即值缺失)

错误值的检测

重复记录的检测

不一致性( 数据源内部及数据源之间)的检测

 

 

大数据分析

TJData是自主研发的全新一代智能化分析模型构建与应用场景的大数据平台。 秉承"智建模、易应用”的全新设计理念,TJData打通了 "从数据到模型,从模型到应 用场景化应用”的全流程;凭借强大算法引擎与大数据处理能力,打造面向"全民数据科 学家”的智能、易用的人工智能分析与应用平台。

应用价值

交互式数据分析,快速洞察数据规律

丰富的可视化效果、灵动的视觉交互探索手段、交互式的即席分析体验,让业务人员 更好地观察数据,与数据对话,发现数据规律,获取敏锐洞察,让数据分析更简单、 更智能。

深度数据探索,发掘数据价值

图形化拖拽式的数据挖掘工具,开箱即用的内置机器学习算法,让业务人员快速进行数据模型构建与优化,完成数据深层次价值的探索与挖掘。

快速数据应用开发

基于平台的分析成果,快速构建企业分析型、智能化数据应用,并无缝融入业务系统中。 通过迭代式敏捷开发,颠覆传统数据通用开发模式,有效提升开发效率。

行业应用

学校、电网、医疗、监狱、政府、银行、交通、水利水务、设备制造家电行业。