Array ( [article_id] => 149 [article_title] => 数据重构 [article_keyword] => 数据重构,数据重构算法原理,数据重构算法用途 [article_description] => 数据重构是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。 [article_detail] => 对数据(包含数值和非数值类型)进行分析和加工的技术过程 [article_content] => <div class="rightwrap collegeDetail"> <h1 class="algorithmName"> 数据重构 </h1> <div class="clearfix topcontent"> <p> 数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。 </p> <p> 数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。 </p> <p> 计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。 </p> </div> <div class="lemma_catalog clearfix"> <h2 class="block_title"> 目录 </h2> <div class="lemma_list"> <a href="#a_2">1、算法描述</a><a href="#a_5">2、相关应用</a><a href="#a_7">3、参考资料</a><a href="#a_9">4、实例</a><a href="#a_14">5、输入输出</a><a href="#a_18">6、相关条目</a><a href="#a_20">7、优缺点</a> </div> </div> <a name="a_2"></a><a class="para_title"><span class="number">一</span>算法描述</a> <p> 对同一批数据往往需要从各种不同的侧面进行研究,因为采用不同的统计方法进行分析,对数据的结构要求不尽相同,所以数据重构是很有必要的。数据重构就是对数据文件的结构进行重新调整或转换,以便适合相应的统计方法使用。 </p> <a name="a_5"></a><a class="para_title"><span class="number">三</span>相关应用</a> <p> 数据重构主要用于当分析字段包含很多分析侧面时,需要把该分析字段按照侧面展开,进而分析每个侧面对目标变量的影响。 </p> <a name="a_7"></a><a class="para_title"><span class="number">四</span>参考资料</a> <p> 马克威分析系统使用教程,http://www.tenly.com </p> <a name="a_9"></a><a class="para_title"><span class="number">五</span>实例</a> <p> 现在有两个商店,其营业时间以及营业额的变化如下,单位:小时 </p> <table class="college_table"> <tbody> <tr class="thead"> <td> 编号 </td> <td> 商店 </td> <td> 营业额 </td> <td> 营业时间 </td> </tr> </tbody> <tbody> <tr> <td> 1 </td> <td> 1 </td> <td> 50000 </td> <td> 6 </td> </tr> <tr> <td> 2 </td> <td> 2 </td> <td> 48000 </td> <td> 6 </td> </tr> <tr> <td> 3 </td> <td> 1 </td> <td> 55000 </td> <td> 8 </td> </tr> <tr> <td> 4 </td> <td> 1 </td> <td> 65000 </td> <td> 10 </td> </tr> <tr class="lasttr"> <td> 5 </td> <td> 2 </td> <td> 53000 </td> <td> 8 </td> </tr> </tbody> </table> <p> 基于分析需要,我们想观察时间对两个商店营业额的影响,数据重构后如下表: </p> <table class="college_table"> <tbody> <tr class="thead"> <td> 商店 </td> <td> 营业额-6 </td> <td> 营业额-8 </td> <td> 营业额-10 </td> </tr> </tbody> <tbody> <tr> <td> 1 </td> <td> 50000 </td> <td> 55000 </td> <td> 65000 </td> </tr> <tr class="lasttr"> <td> 2 </td> <td> 48000 </td> <td> 53000 </td> </tr> </tbody> </table> <a name="a_14"></a><a class="para_title"><span class="number">六</span>输入输出</a> <p> 输入变量类型:整型、浮点型,数据要求没有缺省。 </p> <p> 输入数据尺度:标量型 </p> <p> 输出结果:数据架构后的结果有整型、浮点型。 </p> <a name="a_18"></a><a class="para_title"><span class="number">七</span>相关条目</a> <p> 重新构成、分类汇总 </p> <a name="a_20"></a><a class="para_title"><span class="number">八</span>优缺点</a> <p> 优点:当分析维度包含很多分析面时,按照业务需要把所需要的分析维度按照侧面展开,能清晰地分析出每个侧面对目标变量的影响程度。 </p> </div> [is_show] => 1 [cat_id] => 68 [article_img] => [article_order] => 1 [article_time] => 1481249348 [isdel] => 0 )

数据重构

数据处理是指对数据(包含数值和非数值类型)进行分析和加工的技术过程;也就是对数据的采集、检索、加工、变换和传输,将数据转换为信息的过程。

数据处理的基本目的是从大量的、杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。

计算机的数据处理是使用计算机收集、记录数据,并经过一个或若干个处理方式组合,最后输出的是各种文字和数字的表格和报表。数据处理主要包含11种处理方式:数据查询、数据计算、数据排序、缺失值填充、数据抽样、变量处理、数据合并、重新编码、数据重构、数据汇总、随机数生成。

算法描述

对同一批数据往往需要从各种不同的侧面进行研究,因为采用不同的统计方法进行分析,对数据的结构要求不尽相同,所以数据重构是很有必要的。数据重构就是对数据文件的结构进行重新调整或转换,以便适合相应的统计方法使用。

相关应用

数据重构主要用于当分析字段包含很多分析侧面时,需要把该分析字段按照侧面展开,进而分析每个侧面对目标变量的影响。

参考资料

马克威分析系统使用教程,http://www.tenly.com

实例

现在有两个商店,其营业时间以及营业额的变化如下,单位:小时

编号 商店 营业额 营业时间
1 1 50000 6
2 2 48000 6
3 1 55000 8
4 1 65000 10
5 2 53000 8

基于分析需要,我们想观察时间对两个商店营业额的影响,数据重构后如下表:

商店 营业额-6 营业额-8 营业额-10
1 50000 55000 65000
2 48000 53000
输入输出

输入变量类型:整型、浮点型,数据要求没有缺省。

输入数据尺度:标量型

输出结果:数据架构后的结果有整型、浮点型。

相关条目

重新构成、分类汇总

优缺点

优点:当分析维度包含很多分析面时,按照业务需要把所需要的分析维度按照侧面展开,能清晰地分析出每个侧面对目标变量的影响程度。