目录-使用stata进行数据分析的工作流程.docx

上传人:asd****56 文档编号:79327883 上传时间:2023-03-21 格式:DOCX 页数:9 大小:29.60KB
返回 下载 相关 举报
目录-使用stata进行数据分析的工作流程.docx_第1页
第1页 / 共9页
目录-使用stata进行数据分析的工作流程.docx_第2页
第2页 / 共9页
点击查看更多>>
资源描述

《目录-使用stata进行数据分析的工作流程.docx》由会员分享,可在线阅读,更多相关《目录-使用stata进行数据分析的工作流程.docx(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、The Workflow of Data Analysis Using Stata目录表格目录.21图形目录.23示例目录.25前言.29对字体、文件名、命令和示例的说明.33第1章 导论.1第1节 工作流程的指导原则可复制性.2第2节 工作流程的几个步骤31.2.1数据清理41.2.2.进行分析41.2.3.结果呈现41.2.4.文档保存4第3节 每个步骤中的具体任务.51.3.1.计划.51.3.2.组织51.3.3.记录51.3.4.执行6第4节 选择工作流程的标准61.4.1.精确61.4.2.效率61.4.3.简洁71.4.4.标准化.71.4.5.自动化.71.4.6.易用性.71

2、.4.7.扩展性.8第5节 改变工作流程.8第6节 本书的结构安排8第2章 计划、组织和记录.11第1节 数据分析的循环过程13第2节 计划14第3节 组织182.3.1.组织的原则.182.3.2.组织文件和目录192.3.3.创建个人目录结构.21小型项目的目录结构.21大型个人项目的目录结构.23多人合作项目的目录结构.23特殊用途目录.25牢记目录内容.27规划个人目录结构.29文件命名.30批处理文件302.3.4.新建目录结构(高阶).31新建目录结构的示例31第4节 记录.342.4.1.关于什么是需要记录的内容.362.4.2.记录的层次.372.4.3.关于编写记录文件的建议

3、.38记录文件的评估.392.4.4. Research log39Research log 示例.40Research log 模板.422.4.5. Codebook编码表.43基于测量工具的编码表.432.4.6. 数据库记录.44第5节 本章小结45第3章 Do文件的编写和调试.47第1节 运行命令的3种方式.473.1.1. 命令窗口483.1.2. 对话框.493.1.3. Do文件49第2节 编写有效的Do文件503.2.1. 使Do文件更加稳健.51使Do文件更加self-contained51使用版本控制53排除目录信息53包含随机数种子.553.2.2. 使Do文件更具可读

4、性55 尽量多使用附注.56对齐与缩进.57单行不要太长.58谨慎使用缩写.61前后一致633.2.3. Do文件模板.63Do文件中必备命令.63一个简单的Do文件模板66相对复杂的Do文件模板.66第3节 Do文件的调试.683.3.1. 低级错误及其修改.68Log文件处于打开状态.68Log文件已经存在.68命令拼写错误.69变量名拼写错误69选项错误.70选项之前缺少逗号703.3.2. 解决错误的步骤70第一步:升级Stata及其用户书写程序.70第二步:使用新的slate.71第三步:使用其他数据.72第四步:不要忽视任何错误的可能性.72第五步:分别执行每个命令72第六步:排除

5、Do文件的一部分.74第七步:重新编写Do文件.74第八步:并非编写错误的其他原因.753.3.3. 例1:调试一处细微错误.753.3.4. 例2:调试非预期结果773.3.5. 高级调试方法.81第4节 如何获取帮助.82第5节 本章小结.82第4章 将工作自动化运行.83第1节 宏.844.1.1. Local and global macros.84Local macros.84Global macros.85定义宏时使用双引号.85新建long strings854.1.2. 区分分组变量和嵌套模型.864.1.3. 用local来设置选项.88第2节 Stata命令返回的信息90在

6、local宏的帮助下使用返回结果92第3节 Loop循环语句:foreach命令与forvalues命令.92Foreach命令.94Forvalues命令.954.3.1. 使用loops的方式.95Loop示例1:列举变量和纸标签.96Loop示例2:创建交互变量.97Loop示例3:用教育的替代措施来调整模型.98Loop示例4:用同一方式记录多个变量.98Loop示例5:创建一个可累积信息的宏.99Loop示例6:检索Stata返回信息.1004.3.2. 在loop中记录循环次数.101使用loop将结果保存至矩阵.1024.3.3. 嵌套循环.1044.3.4. 循环的调试.105

7、第4节 include命令.1064.4.1. 用include文件制定分析样本.1074.4.2. 用include文件记录数据.1074.4.3. 使用include的注意事项.109第5节 ado文件.1104.5.1. 一个更改目录的简单程序.1114.5.2. 加载和删除一个ado文件.1124.5.3. 列举变量名称和标签.1134.5.4. 一个更改工作目录的通用程序1174.5.5. 注意事项.118第6节 帮助文件.1194.6.1. nmlabel.hlp1194.6.2. help me.122第5章 名称,备注和标签.125第1节 post文件125第2节 数据管理和统

8、计分析的双重工作流程127第3节 名称,备注和变量.129第4节 do文件命名.1295.4.1. 命名do文件重新创建数据集.1305.4.2. 命名do文件复制统计分析过程1305.4.3. 使用master do文件.131Master log文件1335.4.4. 命名do文件的一个模板134在复杂分析中使用子目录.135第5节 数据集的命名和internally documenting136勿将文件命名为“最终版本”1375.5.1.暂时或一次性数据集.1375.5.2.大型项目的数据集1385.5.3.数据集的标签和备注.1385.5.4.datasignature命令.139一个

9、使用datasignature命令的工作流程.140Datasignature无法探测到的改变.141第6节 变量命名.1435.6.1.创建和命名变量的基本原则1435.6.2.变量命名的体系144顺序命名体系.145来源命名体系.145记忆命名体系.1465.6.3.为命名进行规划.1465.6.4.选择名称的规则.147设想寻找变量的过程147使用简洁的、无歧义的名称148在决定名称前先进行尝试.151第7节 为变量添加标签5.7.1. 列举变量的标签和其他信息151改变数据集中变量的顺序.1555.7.2. 为变量添加标签的有关语句1555.7.3. 为变量添加标签的原则.156注意t

10、runcation.156在post文件之前检测变量标签.1575.7.4 暂时更改变量标.1575.7.5 创建包含变量名的变量标签.157第8节 为变量添加备注.1605.8.1. 与添加备注有关的命令161列出备注.161删除备注162搜索备注.1625.8.2. 在备注中使用宏和循环162第9节 值标签1635.9.1.两步法创建值标签.164第一步:定义标签164第二步:贴标签164为何使用该两步法164删除标签1655.9.2.创建值标签的原则.165原则1:标签尽量简短.165原则2:包含分类编号.166原则3:避免使用特殊符号168原则4:熟知标签被使用于何处.1695.9.3

11、.清理值标签.1705.9.4.值标签对缺失值的处理须保持一致1715.9.5.在贴标签时使用loop语句.171第10节 使用多种语言5.10.1 针对不同语种使用语言集标签.1745.10.2 针对长标签和短标签使用不同语言集标签174第11节 名称和标签的工作流程176第一步:做出改变时要提前规划.176第二步:存档、复制与重命名.177第三步:修改变量标签177第四步:修改值标签.177第五步:确认修改.1785.11.1. 第一步 检查数据来源178第一步a:列出当前名称和标签178第一步b:尝试当前名称和标签1815.11.2. 第二步 创建复制和重命名变量.182第二步a:创建复

12、制.183第二步b:创建重命名命令183第二步c:重命名变量1845.11.3 第三步 修改变量标签.185第三步a:创建变量标签命令185第三步b:修改变量标签1865.11.4. 第四步 修改值标签187第四步a:列出当前标签.188第四步b:创建label define 命令来编辑标签.189第四步c:修改标签并将标签添加到数据集.1935.11.5. 第五步 检查新名称和新标签.194第12节 本章小结.195第6章 清理数据197第1节 数据导入.1986.1.1.数据格式198ASCII数据格式198Binary-data数据格式2006.1.2.导入数据的方法.201与导入数据相

13、关的stata命令201从其他统计软件中导出数据.203使用数据转换软件.2036.1.3.确认数据转换.203对俄罗斯ISSP 2002数据进行转换204第2节 核实变量.2106.2.1. 检查变量值.211检查科学家职业历程数据的变量值.212检查家庭观念数据的变量值.2156.2.2. 检查独立有效性.216“获得学位所用时间”究竟测量了什么216检查出现频率极高的值218变量之间的联系.220问卷中问题的更改2256.2.3. 检查缺失值225缺失值的大小比较.225创建标识案例是否缺失的指标.228使用扩展缺失值228核实和扩大缺失值编码.229使用include文件.2366.2

14、.4. 内在一致性检验238科学家职业里程数据的一致性.2386.2.5. 修正不一致数据的原则.241第3节 为数据分析新建变量.2416.3.1.创建新变量的原则242新变量,新名字.242核实新变量是否正确.243记录新变量.244保留原变量.2446.3.2.创建新变量的核心命令244Generate命令.245Clonevar命令245Replace命令.2466.3.3.创建有缺失值的变量2476.3.4.创建新变量的其他命令.249Recode命令.249Egen命令.250Tabulate, generate() 命令2526.3.5.为新建变量创建标签2536.3.6.核实变量是否正确.254检查代码.255列出变量.255绘制连续变量散点图256使用tabulate命令.258用多种方式创建变量259第4节 数据集的保存2606.4.1.选择观察样本.261删除部分样本VS另存所需样本.2616.4.2.删除变量.262从俄罗斯ISSP 2002数据中选择变量.2636.4.3.变量的排序2636.4.4.内部记录.2646.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 财经金融

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com