forcode:刚才两个师弟过来跟我讨论问卷中多选项问题的数据录入问题,提到的一篇论文《再谈SPSS 中SUBSTR 函数与多选题答案的编码》,让我学到了一种新的录入多选项问题的办法。按照传统的方法,在spss里面,多选项问题需要将每个选项编码为0,1的虚拟变 量,然后使用analyzs中的multiple response来进行统计分析,这样输入的时候如果选项较多,工作量比较大。这篇论文巧妙利用substr这个字符串函数使得多选项问题的录入大大简 化,还是举个例子来说吧,比如,有一个问题有9个选项,每个人最多选3项,如果第一个人选了2、3、4这三项,第二个人选了1、3、7这三项……这种方法 在录入该问题的时候,只需要产生一个变量,如果选择2、3、4这三项,就连着录入234这个字符(注意tiaojian这个变量是字符型),具体如下:
tiaojian
234
137
356
129
139
257
268
346
这种方法虽然能够简化数据录入,但是在具体使用的时候还得将tiaojian这个变量拆开,有多少个选项就要生成多少个0、1的虚拟变量,比如,受访对象 选择了第四项,我们需要的虚拟变量tiaojian1中该值就为1,其他没有选择第四项的受访对象的该变量值就编码为0,方法如下,在transform 菜单中选择compute来生成新变量,如下图所示:

进入compute窗口,target variable中输入新变量tiaojian1的名字,在numeric expression中输入这个公式:
substr(tiaojian,1,1)=’4′ | substr(tiaojian,2,1)=’4′ | substr(tiaojian,3,1)=’4′
该公式包含了三个substr()函数,用|连接起来,表示只要三个substr()函数只要有一个成立就赋值为1,该函数有三个参数,具体意思如下:
函数substr(tiaojian,1,1)=’4′中有三个参数,tiaojian是来源变量的名字,中间的1是表示该函数的起始位置,这里是1就表 示对该字符左边第1位进行识别,第二个1表示识别的字符的长度。substr(tiaojian,1,1)=’4′表示tiaojian这个字符变量的第 一个字符如果为4就将tiaojian1相应的值编码为1,否则编码为0。substr(tiaojian,2,1)=’4′和substr (tiaojian,3,1)=’4′分别表示tiaojian这个字符变量的第二和第三个字符如果为4就将tiaojian1相应的值编码为1,否则编 码为0,因为这里tiaojian这个字符型变量只有3位,因此只需要三个substr函数就可以了,具体截图如下,然后点击确定:

于是就得了新的变量tiaojian1,可以发现tiaojian变量中234和346这两个案例中都含有4,于是在tiaojian1中,这两个案例的值都是1,其他都是0,于是就得到了我们需要的虚拟变量,用类似方法可以生成所有的选项的虚拟变量,截图如下:
tiaojian tiaojian1
234 1.00
137 .00
356 .00
129 .00
139 .00
257 .00
268 .00
346 1.00

如果选项非常多,超过了9个出现两位数的选项怎么办?很简单,用英文小写字母来表示9以后的选项就可以了。
如果还有什么不明白的,那就看看这篇论文的原文吧,很短,只有一页,我就截图放这了:
《再谈SPSS 中SUBSTR 函数与多选题答案的编码》
暨南大学医学院卫生统计教研室(510632) 林汉生 夏苏建 杨 丽 蔡 玲
图片相册地址:
http://picasaweb.google.com/woodphone/SPSSSUBSTR


文献〔1〕着重介绍了SUBSTR 函数在多选题答案编码中的
应用。文章发表后,我们发现还有更简便的SPSS 操作可以完
成该项功能。下面结合实例进行介绍,并指出该操作与以前介
绍的不同之处。
例 受伤情况: (1) 软组织挫伤; (2) 骨折; (3) 胸腹和骨盆
内部损伤; (4) 颅脑损伤。
一、SPSS 数据工作表
将该问题设置1 个字符变量, 如type , 分别用字符变量值
1 ,2 ,3 ,4 代表4 种受伤情况。字符变量的宽度不一定和多选项
的数目一致。如调查结束后,发现调查对象中最多只会同时有
3 种损伤,则字符变量的宽度为3 。
如某人同时有软组织挫伤、骨折、颅脑损伤,则输入字符变
量值124 ;如只有软组织挫伤,则输入1 ;如没有损伤,则输入0 。
表1 中的number (调查对象编号) 和type 为数据工作表的基本
数据。
字符变量type 的变量值便于数据录入, 但不便于统计分
析。因此需要用SUBSTR 函数将字符变量type 分解为数值变
量type1 , type2 , type3 , type4 ,分别代表4 种受伤情况,用数值0
表示无,1 表示有。
表1 SPSS 数据工作表
number type type1 type2 type3 type4
1 0 0100 0100 0100 0100
2 4 0100 0100 0100 1100
3 13 1100 0100 1100 0100
4 23 0100 1100 1100 0100
5 124 1100 1100 0100 1100
二、Compute 过程和SUBSTR 函数的使用
SUBSTR 为子串选择函数, 表达式为SUBSTR ( S t rex pre ,
pos , lenth) =′子串′。式中Strexpre 为字符变量, pos 为字符串
变量值的开始位置, length 为选取字符串变量值的长度。如从
字符变量( type) 值中选取第3 个字符为“4”的子串,则Strexpre
为type , pos 为3 , lenth 为1 (只选取1 个字符) , 即SUBSTR
( type ,3 ,1) =′4′。
当表1 中number 和type 的变量输入完毕后, 用SUBSTR
函数将字符变量type 分解为数值变量type1 , type2 , type3 ,
type4 ,可通过Compute 对话框或Syntax Editor (语句编辑) 完
成。
11Compute 对话框
从菜单选择Transform vCompute。在Compute 对话框的
Target 栏中输入type4 ,在Numeric Expression 栏中输入
SUBSTR( type , 1 , 1) =′4′| SUBSTR ( type , 2 , 1) =′4′| SUBSTR
( type ,3 ,1) = ′4′
单击OK按钮
“| ”表示“或者”,也可以用or 表示。
以上操作的作用是:在字符变量type 的变量值中, 不管是
第1 ,还是第2 或者第3 个字符为4 , 返回的函数值为1 ; 如果
type 的变量值中不包含4 ,返回的函数值为0 ;返回的函数值赋
值给数值变量type4 。
重复以上操作,可以生成新变量type1 、type2 和type3 。
本文与原来介绍的主要不同之处是:免去在Compute 对话
框中使用If 过程,免去将数据工作表中的缺失值用Recode 重
新编码。
在Compute 对话框中,利用Paste 按钮,可以将上述操作过程
用SPSS 语句粘贴到Syntax Editor 窗口中,从而方便以下操作。
21Syntax Editor
在Syntax Editor 窗口,编辑并执行以下程序,也可得到表1
的结果。利用复制和粘贴功能,可减少输入时的错误。要注意
在英文状态下输入并编辑程序。
COMPUTE type1 = SUBSTR ( type , 1 , 1) = ′1′| SUBSTR
( type ,2 ,1) = ′1′| SUBSTR( type , 3 , 1) =′1′。COMPUTE type2
= SUBSTR( type , 1 , 1) =′2′| SUBSTR ( type , 2 , 1) =′2′| SUB2
STR( type ,3 ,1) = ′2′。COMPUTE type3 = SUBSTR( type ,1 ,1)
=′3′| SUBSTR ( type , 2 , 1) =′3′| SUBSTR ( type , 3 , 1) =′3′。
COMPUTE type4 = SUBSTR ( type , 1 , 1) =′4′| SUBSTR ( type ,
2 ,1) =′4′| SUBSTR( type ,3 ,1) = ′4′。
EXECUTE。
参 考 文 献
11 林汉生,杨丽,夏苏建,等. 多选题答案的编码与SPSS 中SUBSTR 函
数的使用. 中国卫生统计,2001 ,18 (6) :371 - 373.
·60 · 中国卫生统计2005 年2 月第22 卷第1 期
–
未来新技术和新趋势的种种可能:
奇想录 http://www.qixianglu.cn
订 阅 http://feed.feedsky.com/woodphone
非主流的科幻界的非主流论坛——奇想家园:
http://www.douban.com/group/forcode/
你可能对这些文章感兴趣:
No related posts.
以上关联文章由 Yet Another Related Posts Plugin 提供支持。
written by forcode
One Response to “forcode:SPSS多选项问题录入的一个高效率方法(组图)”
Leave a Reply
书摘影评
- 辜朝明《大衰退》精彩节选
- 集体行动逻辑读书笔记
- 集体行动之困境—— 搭便车理论述评
- 如何亲切地问候梁文道
- 美国的罗生门?
- 演变还是革命?
- 抛掉教科书和成见,看见世界的真实
- 开阔视野的金融类书籍
- 胖子都有颗敏感的心 (致命ID 影评)
- 绝赞的电影——镜头无浪费情节无BUG
- 分析一下胖子的人格世界 (致命ID 影评)
- 《惊魂记》是长久的惊叹
- 《惊魂记》中的性别与权力
- 浅析希区柯克的悬念电影:以《惊魂记》为例
- 浅谈拳击界如今的死气萧条
- 他为了找到真正的自己付出了一切
- 《乔布斯传》最后一章:真实的我
- 红颜之如格蕾丝凯利 (后窗 影评)
- 后窗内闪亮的眼睛 (后窗 影评)
- 人生的另一种本质 (后窗 影评)
统计和数据
- 中电联预计我国未来5年用电量将年均增长8.5%
- 中国电力企业联合会预测2011年全国用电量增12%
- 2010年全社会用电量4.19万亿千瓦 同比增14.56%
- 获取经济数据的50个网站
- Excel表格公式大全
- 统计学女博士中4次百万大奖 被疑摸透彩票规律
- 长江电力收购地下电站6台机组的利空分析
- 中国A股市场历年整体平均市盈率和换手率
- 哪个国家是美国最大石油供应国?
- 1977-2010全国参加高考人数、录取数、录取率
- 世界主要15大石油国的石油财富估值
- 十年A股涨幅榜 40股10年翻十倍 资源股最牛
- 为什么2011年的2600点相当于2005年的1100点?
- 2011年6月3日长江电力上网电价上调约2分的影响分析
- 美国劳工部:1947-2011年历年历月美国CPI数据
- 告诉你怎么找统计数据&机构报告!
- 麻省理工统计天才破解彩票规律 中奖率达9成
- 结息周期对年收益率的影响
- forcode自定义的股票指标:“相对大盘”
- 利用google docs spreadsheet制作股票实时行情(图)


手机阅读



01月 13th, 2008 at 02:24
高科技哇,哇哈哈
Reply