![Stata统计分析与行业应用案例详解(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/500/26943500/b_26943500.jpg)
1.6 定义数据的子集
1.6.1 定义数据的子集概述
在很多情况下,现有的Stata数据达不到分析要求,我们需要截取出数据的一部分进行分析,或者删除不需要进入分析范围的数据,这时我们就需要用到Stata的定义数据子集功能。在本节中,我们将通过实例的方式讲述定义数据子集的基本操作。
1.6.2 相关数据来源
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0001.jpg?sign=1739400330-pnyie1uSiQkzZ0sE6C6vE7P3u0WoQRCS-0-ccbc3bf074583acfbed12082eb6120d7)
【例1.5】试通过操作案例1.5.dta完成以下工作。
(1)列出第3条数据。
(2)列出第1~3条数据。
(3)列出变量值“shangjiao”最小的两条数据。
(4)列出变量值“year”大于2005的数据。
(5)列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
(6)删除第3条数据。
(7)删除变量值“year”等于2005的数据。
(8)删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.3 Stata分析过程
分析步骤如下:
进入Stata 14.0,打开相关数据文件,弹出如图1.30所示的主界面。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0003.jpg?sign=1739400330-FPNdMUYsyf3b7V1M5gDQcTAMhW48jco4-0-07a46709334d9e8d60a4f715d73b27cc)
图1.30 主界面
在主界面的“Command”文本框中输入操作命令并按键盘上的回车键进行确认。对应的命令如下。
●list in 3:本命令的含义是列出第3条数据。
●list in 1/3:本命令的含义是列出第1~3条数据。
●sort shangjiao list year shangjiao shenjiao in 1/2:本命令的含义是列出变量值“shangjiao”最小的两条数据。
●list if year>2005:本命令的含义是列出变量值“year”大于2005的数据。
●list if year>2007 & shangjiao>865:本命令的含义是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
●drop in 3:本命令的含义是删除第3条数据。
●drop if year==2005:本命令的含义是删除变量值“year”等于2005的数据。
●drop if year>2005 & shangjiao>865:本命令的含义是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.4 结果分析
图1.31是列出第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0001.jpg?sign=1739400330-aZpZXgoEeZdcibFBqyQDkppf85spzAkg-0-a56531b8e22103c7a4e47443c861661f)
图1.31 分析结果1
图1.32是列出第1~3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0002.jpg?sign=1739400330-Klf478I9qIaMLc20zn02emfZbiCc6CAS-0-97f8172453718c6557c1b11955e480d5)
图1.32 分析结果2
图1.33是列出变量值“shangjiao”最小的两条数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0003.jpg?sign=1739400330-Hz8LFApiyRXPl6mpzBDNUKhMmQPzt674-0-ab3bd8c052fb62152bcb94c2789708a9)
图1.33 分析结果3
图1.34是列出变量值“year”大于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0004.jpg?sign=1739400330-zrMjtsUhWRceH1C9n4O600sSdqjSXMyh-0-594101d8f75fb8a82436a876dcbb484a)
图1.34 分析结果4
图1.35是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0005.jpg?sign=1739400330-2SLbbvayePxza0BHmednvf1dkx06KmI7-0-a1689648d156476b57fc85889376568a)
图1.35 分析结果5
图1.36是删除第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0006.jpg?sign=1739400330-EfOrHEwJDkBq5a1nM48dqI05mJTjQWa3-0-64f2796d1d67c234d6c7c1b76bdea6de)
图1.36 分析结果6
图1.37是删除变量值“year”等于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0001.jpg?sign=1739400330-wN8lukS38Ml8prfFVK3mpmiD8SpDjUai-0-7d8a17099e323a8b6fd163f13abadef1)
图1.37 分析结果7
图1.38是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0002.jpg?sign=1739400330-lDW66PT2cOLYd7XIyRZ7MWP3eVgqmYRL-0-a0b7d7d011ae85a0ce2fa6f8602e2321)
图1.38 分析结果8
1.6.5 案例延伸
我们在上述的Stata命令中用到了Stata中的关系运算符和逻辑运算符。Stata 14.0中共支持6种关系运算符和3种逻辑运算符,如表1.7和表1.8所示。
表1.7 关系运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0003.jpg?sign=1739400330-p7gAsODmjeB7X118nqNDE2jx9XA26Vqg-0-03f3b97b20aec41b98a4dbad80f26ad3)
表1.8 逻辑运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0004.jpg?sign=1739400330-EZ6NGDOVzpT6yow39hBlKL5CeUFkQCyW-0-58ada79e79226a8f86a3d71bf51f8f48)