收藏 分享(赏)

示例3图书馆数据的概括性报告.pdf

上传人:weiwoduzun 文档编号:1765391 上传时间:2018-08-22 格式:PDF 页数:5 大小:140KB
下载 相关 举报
示例3图书馆数据的概括性报告.pdf_第1页
第1页 / 共5页
示例3图书馆数据的概括性报告.pdf_第2页
第2页 / 共5页
示例3图书馆数据的概括性报告.pdf_第3页
第3页 / 共5页
示例3图书馆数据的概括性报告.pdf_第4页
第4页 / 共5页
示例3图书馆数据的概括性报告.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、示例 3:图书馆数据的概括性报告 简介读者借阅信息读者数目统计LC分类报表简介 本示例所用的数据是关于从两个图书馆借阅图书的记录。LIBRARY 中每个观测值代表一本书,每个读者借阅图书时可以借多本书。此数据集有意义的地方在于其可以以多种方式进行分类。例如,数据分析既可以基于读者借阅情况, LC 分类,也可以根据读者年龄等。我们可以考察每个读者借阅图书的总数、平均数,每个图书馆的平均借阅数,还可以根据读者年龄分组考察每个 LC 类的图书总数。 首先我们用下面的程序来创建 LIBRARY 数据集。 PROC FORMAT; VALUE $CAT A = General Works B = Phi

2、losophy VALUE DAYWK 1 = Sun. 2 = Mon. 3 = Tue. 4 = Wed. 5 = Thu. 6 = Fri. 7 = Sat.; VALUE $AGEGRP A = Adult Y = Youth; RUN; DATA LIBRARY; INPUT 1 ID $5. 6 LIBRARY $10. 16 DATE MMDDYY8. 24 LC $10.; LENGTH CATEGORY $ 25; *Extract the LC category: 1- or 2-characters before first digit; FIRST_N = INDEXC

3、(LC,0123456789); *Position of first numeral; CATEGORY = PUT(SUBSTR(LC,1,FIRST_N - 1),$CAT.); *LIBRARY name and DATE are only entered on the first record for each visit.; *Copy Library information from the first non-blank entry if blank; LENGTH HOLD_LIB $ 10 AGE_GROUP $ 1; RETAIN HOLD_LIB HOLD_DATE;

4、IF LIBRARY NE “ “ THEN DO; HOLD_LIB = LIBRARY; HOLD_DATE = DATE; END; ELSE DO; LIBRARY = HOLD_LIB; DATE = HOLD_DATE; END; DUE_DATE = DATE + 14; DAY = WEEKDAY(DATE); AGE_GROUP = SUBSTR(ID,1,1); FORMAT DATE DUE_DATE DATE9. DAY DAYWK. AGE_GROUP $AGEGRP.; DROP HOLD_: FIRST_N; DATALINES; Y0123CLINTON 102

5、12000H410.B5 Y0123 H415.A7 。 。 LIBRARY 前三个观测值罗列如下。 Obs ID LIBRARY DATE LC CATEGORY GROUP DUE_DATE DAY 1 Y0123 CLINTON 21OCT2000 H410.B5 Social Sciences Youth 04NOV2000 Sat. 2 Y0123 CLINTON 21OCT2000 H415.A7 Social Sciences Youth 04NOV2000 Sat. 3 A1234 FLEMINGTON 21OCT2000 Q550.B10 Science Adult 04NO

6、V2000 Sat. 可以看到,该数据集包含八个变量:读者编号、图书馆位置、借阅日期、 LC 码、图书分类、读者年龄组、归还日期及周日。 读者借阅信息 我们的第一个任务是计算每个读者借阅图书的数量以找出相应的频率分布。我们可以利用PROC MEANS 与 PROC FREQ 过程来实现。这里仅以 PROC MEANS 为例。 PROC MEANS DATA=LIBRARY NOPRINT CHARTYPE; CLASS ID DATE LIBRARY; TYPES ID*DATE ID*DATE*LIBRARY; VAR DATE; OUTPUT OUT=BOOKS(DROP=_FREQ_)

7、N=N_OF_BOOKS; RUN; 由于我们想考察在给定的日期里每个读者借阅的图书数目,所以在 PROC MEANS 过程中,ID与 DATE 为 CLASS 变量。如果还要了解这些图书所属图书馆的情况,则 LIBRARY 也是 CLASS变量。注意到_TYPE_ 变量共有个值,我们可以利用 TYPES 语句来选择哪种计数需要保留。CHARTYPE 选项所创建的_TYPE_ 变量并不是通常的二进制数值变量。本程序需注意的是要搞清楚_TYPE_ 的取值与图书计数之间的关系。由于 CLASS 变量包括 ID、DATE 、与 LIBRARY,可以看出“”对应于在给定日期里每个读者借阅的图书数目,而

8、“”则对应于在给定图书馆及给定日期里每个读者借阅的图书数目。首先来看一下由上述程序产生的结果,也许对我们理解上述说法有所帮助。 N_OF_ Obs ID DATE LIBRARY _TYPE_ BOOKS 1 A1010 23OCT2000 110 4 2 A1022 23OCT2000 110 3 。 。 32 A1010 23OCT2000 FLEMINGTON 111 4 33 A1022 23OCT2000 CLINTON 111 3 。 。 现在如果我们想要看一下每个读者在给定日期或给定图书馆下图书的借阅情况,例如计算借阅图书数目的平均数及标准差,我们可以在 PROC MEANS 中

9、使用 WHERE 语句。例如下述程序可以计算在给定日期里每个读者借阅图书的平均数及标准差。 PROC MEANS DATA=BOOKS; VAR N_OF_BOOKS; WHERE _TYPE_=“110“; RUN; 我们可以用下面的程序来绘制每个图书馆中,在给定日期下每个读者借阅图书数目的频率条形图。 PROC CHART DATA=BOOKS; WHERE _TYPE_=“111“; TITLE “BOOK FREQUENCIES BY LIBRARY“; VBAR N_OF_BOOKS/GROUP=LIBRARY MIDPOINTS=0 TO 5 BY 1; RUN; 读者数目统计 假

10、如我们想了解借阅出的图书数目在每周或各个图书馆的变化情况。运行下列程序: PROC MEANS DATA=LIBRARY NOPRINT NWAY; CLASS ID DAY LIBRARY; VAR DATE; OUTPUT OUT=BOOKS_BY_DAY(DROP=_TYPE_ _FREQ_) N=N_OF_BOOKS; RUN; PROC CHART DATA=BOOKS_BY_DAY; TITLE “BOOK FREQUENCIES BY DAY OF THE WEEK AND LIBRARY“; VBAR DAY/SUMVAR=N_OF_BOOKS TYPE=MEAN GROUP=

11、LIBRARY DISCRETE; RUN; 因为我们仅想得到 ID, DAY 与 LIBRAR Y 每个组合的图书借阅数目,所以在上述 PROC MEANS 中使用了 NWAY选项,此选项可以限制在输出结果中只显示对应于最大_TYPE_值的统计资料(即:7 或者,在使用了 CHARTYPE 选项后, “111” )。 由于变量 DAY 是数值变量,所以有必要在 VBAR中使用选项 DISCRETE 以保证在调用 PROC C HART 过程时, 输出结果以 DAY 的真值进行分组。 LC 分类报表 本节将调用 PROC TABULATE 过程计算在每个年龄段里,各 LC 类中的图书借阅数。首

12、先运行下列程序: PROC TABULATE DATA=LIBRARY FORMAT=COMMA15.; TITLE “FREQUENCIES OF BOOKS BY LC CATEGORY AND AGE GROUP“; CLASS CATEGORY AGE_GROUP; TABLES CATEGORY, (AGE_GROUP ALL)*N=“ “/RTS=20; LABEL AGE_GROUP=“AGE GROUP“ CATEGORY=“LC CATEGORY“; KEYLABEL ALL=“COMBINED“; RUN; 在上述程序中,关键字 ALL 的作用是将每个 LC 类中,青年组与成年组借阅的图书总数在结果中输出。 RTS=20用来指定行标题的列宽 (最左边一列),如果要改变列标题的宽度, 则需更改FORMAT选项的值。下图是运行上述程序产生的报表。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 研究报告 > 教育

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报