admin 发表于 2023-2-10 07:20:10

SPSS中怎么使用分箱功能将连续数据离散化?

<div class="markdown-body editormd-preview-container">
                              <p>
  &ldquo;分箱法&rdquo;相信学过统计学的小伙伴们都不会陌生,它的主要作用就在于对噪音数据进行剔除,同时将连续型数据进行离散处理。在模型分析开始前,我们经常需要使用到分箱法来处理和清洗数据。下面小编就带着大家一起学习一下吧!
</p>
<p>
<strong>  操作方法:</strong>
</p>
<p>
  图1是我们准备要分箱的数据,我们将对年龄列进行分箱,按照每10岁为一个标准进行分箱。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747211.jpg"></a>图1:要分箱的数据</center>
<p>
  点击&ldquo;转换&rdquo;中的&ldquo;可视分箱&rdquo;,进入分箱设置界面。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747212.jpg"></a>图2:可视分箱</center>
<p>
  将&ldquo;年龄&rdquo;拉入到&ldquo;要分箱的变量&rdquo;中,然后点击&ldquo;继续&rdquo;。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747213.jpg"></a>图3:拉入要分箱的变量</center>
<p>
  在图4所示界面,我们可以看到要扫描的个案数共34个,其中最大的变量值为67,最小为22,也就是说要分箱的数据年龄段在22到67岁之间。
</p>
<p>
  我们在&ldquo;分箱化变量&rdquo;中,填入&ldquo;年龄段&rdquo;,作为一个之后新生成的变量,随后点击&ldquo;生成分割点&rdquo;按钮。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747214.jpg"></a>图4:分箱化变量</center>
<p>
  按照我们的分箱目的,我们要每隔10岁分组一次,最小的年龄为22岁,则我们需要在第一个分割点位置填写&ldquo;20&rdquo;,然后在宽度填写&ldquo;10&rdquo;,此时点击键盘Tap键,SPSS会自动生成分割点数的值为&ldquo;5&rdquo;,如图5所示。
</p>
<p>
  这样子SPSS会自动帮我们将20到30、30到40、40到50、50到60、60到70的年龄段进行分组,一共5组。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747215.jpg"></a>图5:生成分割点</center>
<p>
  点击&ldquo;应用&rdquo;按钮后,回到&ldquo;可视分箱&rdquo;界面中,我们可以在图6红框位置看到后续的分箱值,标签栏默认是空值,我们可以进行自定义填写,如设置20的分箱标签为2。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747216.jpg"></a>图6:设置自定义标签</center>
<p>
  最后点击&ldquo;确定&rdquo;按钮,开始进行数据分箱,分箱后的新数据结果如图7所示,生成了新的&ldquo;年龄段&rdquo;列,数据也非常正确地进行了分箱,如年龄为27的那行数据,被正确地设置到了标签为2的分箱中。
</p>
<center>
        <ahref="https://www.downkr.com/uploadfile/2021/0729/202147290747217.jpg"></a>图7:分箱结果</center>
<p>
  以上就是使用IBM SPSS Statistic对演示数据中的年龄指标,按照每隔10岁的标准,进行分箱的全部教程,上述演示的是等距分箱,小伙伴也可以自己动手在IBM SPSS Statistic中尝试一下不等距分箱哦。
</p>
                            </div>
页: [1]
查看完整版本: SPSS中怎么使用分箱功能将连续数据离散化?