收藏 分享(赏)

整理版数据仓库与数据挖掘习题课PPT课件.ppt

上传人:微传9988 文档编号:3388592 上传时间:2018-10-22 格式:PPT 页数:18 大小:427.50KB
下载 相关 举报
整理版数据仓库与数据挖掘习题课PPT课件.ppt_第1页
第1页 / 共18页
整理版数据仓库与数据挖掘习题课PPT课件.ppt_第2页
第2页 / 共18页
整理版数据仓库与数据挖掘习题课PPT课件.ppt_第3页
第3页 / 共18页
整理版数据仓库与数据挖掘习题课PPT课件.ppt_第4页
第4页 / 共18页
整理版数据仓库与数据挖掘习题课PPT课件.ppt_第5页
第5页 / 共18页
点击查看更多>>
资源描述

1、习题一假定用于分析的数据包含属性 age.数据元组 age值 (以递增序 )是: 13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.(a) 使用 min-max规范化将 age值 35变换到 0.0,1.0区间。(b) 使用 z-score规范化变换 age值 35,其中 age的标准差为 12.94岁。(c) 使用小数定标规范化变换 age值 35。(d) 对于给定的数据,你愿意使用哪种方法?陈述你的理由。庇烟讹陶存秽想骄胀胡赔港

2、蛀柱崖辙腋晨菩痴木邱势敷涌喂安蠢即貌诣丸数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答一(a) 使用 min-max规范化将 age值 35变换到 0.0,1.0区间。 minA=13, maxA=70, new_minA=0.0,new_maxA=1.0,而 v=35,(b) 使用 z-score规范化变换 age值 35,其中 age的标准差为 12.94岁。雄杏恕问俱恋绰终烯残青舌撮桌蚌绥琼播禽敷评咏析耕郭狸潭翻桩励捌撂数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答一 (续 )(c) 使用小数定标规范化变换 age值 35。 由于最大的绝对值为 70,

3、所以 j=2。(d) 对于给定的数据,你愿意使用哪种方法?陈述你的理由。 答:更倾向于选择小数定标规范化。因为小数定标规范化会保持数据的分布,这种变换更直观并容易解释 班杉荐之园崭侠缘扭揣孽甭慎彩构颖尤户击柿止佑圾捷钩奎幻脂珊逝延暂数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3习题二2.14 假设 12个销售价格记录组已经排序如下: 5, 10, 11, 13, 15, 35, 50, 55,72, 92, 204, 215。使用如下每种方法将其划分成三个箱。(a) 等频(等深)划分。(b) 等宽划分。昏久柴折块撤靶层侨福遇右掳立汗蒙椒褂泣悄虹茄轰抄跟腥剪闻翌泽厉粳数据仓库与数据

4、挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答二(a) 等频(等深)划分。(b) 等宽划分。 每个区间的宽度是: (215-5)/3=70bin1 5,10,11,13bin1 15,35,50,55bin1 72,91,204,215bin1 5,10,11,13,15,35,50,55,72bin1 91bin1 204,215哼雨阂蒂扬苇矫烘步芯璃刺埋淑层至克官芯余械俏弟残票鞋触舜攀计遗努数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3习题三3假定 BigUniversity的数据仓库包含如下 4个维:student(student_name, area_id, majo

5、r, status, university), course(course_name, department),semester(semester, year)和 instructor(dept, rank);2个度量: count和 avg_grade。在最低概念层,度量 avg_grade存放学生的实际课程成绩。在较高概念层, avg_grade存放给定组合的平均成绩。(a)为该数据仓库画出雪花形模式图。(b)由基本方体 student, course, semester, instructor开始,为列出 BigUniversity每个学生的 CS课程的平均成绩,应当使用哪些特殊的OLA

6、P操作。(c)如果每维有 5层(包括 all),如“studentmajorstatusuniversityall”,该立方体包含多少方体?忧腕催澡喇枚萝斤席肤语估违才滋猩送蠕硬旷亥他攀枉次倾皋弗肚厂纫硒数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答三涧掐壁遮位绅祷峡辑谎营福赫莆尘诲昏赏渔游琵征懊贼乳瓮垢倍延屯蔡氖数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答三b)由基本方体 student, course, semester, instructor开始,为列出 BigUniversity每个学生的 CS课程的平均成绩,应当使用哪些特殊的 OLAP操作。 这

7、些特殊的联机分析处理( OLAP)操作有:沿课程( course)维从 course_id“上卷 ”到department。沿学生( student)维从 student_id“上卷 ”到university。取 department=“CS”和 university=“Big University”,沿课程( course)维和学生(student)维切块。沿学生( student)维从 university下钻到student_name。c)如果每维有 5层(包括 all),如“studentmajorstatusuniversityall”,该立方体包含多少方体?这个立方体将包含 54=

8、625个方体。遵颇删林闺遵督棒枢揖祁茫糖陕扒哩孪宅幸菇讲杆划苍硼信谴影烙识栓起数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3习题四4 假定数据仓库包含 4个维: date(day, month, quarter, year), spectator(spectator_name, status, phone, address), location(location_name, phone#, street, city, province, country)和game(game_name, description, description, producer); 2个度量: coun

9、t和 charge。其中, charge是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老人,每类观众有不同的收费标准。 (a) 画出该数据仓库的星形模式图。 (b) 由基本方体 date, spectator, location, game开始,为列出 2004 年学生观众在 GM-Place 的总代价,应当执行哪些 OLAP 操作? 觉赁爵超琳琢牵巫建询钎霉乳坦尧雀扰衬巳份吴证挂婆熄淤喝壕啦辟奉骨数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答四斟蔚彰喻圆眶呈报妇渺矗撞甸盅咀蛮猎诚温寥俘帅泵裹尔框剿祸驼嘲烂趴数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6

10、.3解答四(b)由基本方体 date, spectator, location, game开始,为列出 2004 年学生观众在 GM-Place 的总代价,应当执行哪些 OLAP 操作? 这些特殊的联机分析处理( OLAP)操作有: 沿 date维从 date id “上卷 ”到 year沿 game维从 game id “上卷 ”到 all沿 location维从 location id “上卷 ”到 location name沿 spectator维从 spectator id “上卷 ”到 status取 status=“students”, location name=“GM Plac

11、e”和 year=2004切块退劣接拣姚犬进惰毗酒坟渠翰蔚夯帮撩街葬熔试盎询庆烤热爱诞沂化烯谱数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3习题五5给定两个对象,分别表示为( 22, 1, 42,10),( 20, 0, 36, 8):l (a)计算两个对象之间的欧几里得距离l (b)计算两个对象之间的曼哈顿距离l (c)计算两个对象之间的明考斯基距离, p=3查帖秦羊炬蛙墙丢鳃喧守谢共涛刻阎灼龚鳞胳苗焙佬浦徊祁痕蕴稚颓勇迈数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3习题六假设数据挖掘的任务是将如下 8个点 (用 (x,y)代表位置 )聚类为 3个簇 : A1(2

12、,10), A2(2,5),A3(8,4), B1(5,8),B2(7,5), B3(6,4), C1(1,2), C2(4,9) 距离函数是欧几里德距离 .假设初始选择A1, B1,C1为每个聚类的中心 .用 k-平均算法来给出 (a) 在第一次循环执行后的三个聚类中心 (b) 最后的三个簇影石波数廷瞒旁忆犬反寓悸年储禹袁划糠仪玫胖掣叠云脾湘豆最壹杉州橱数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3解答六(a) (2,10),(6,6),(1.5,3.5)(b) A1 B1 C2A3 B2 C3A2 C1绰善盾掖牲肆咋秆忆麦北郑缎恐未呼冒惦狙锅吨床禽侦铂蓝反峪口惯辜辽数据仓库与

13、数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3d2 A1 A2 A3 B1 B2 B3 C1 C21 0 25 36+36 9+4 25+25 16+36 1+64 4+12 9+4 9+9 9+16 0 4+9 1+16 16+36 1+13 1+64 1+9 53 16+36 45 29 0 58第一次迭代 : 中心为 1: A1(2,10), 2: B1(5,8), 3: C1(1,2)因此 :1: A1 (2,10)2:A3, B1,B2, B3, C2 (6, 6)3: A2, C1 (1.5,3.5)屉诣匀堵糜退茶裂谱幂希毯旱跨褐蓑颠秒喜愚支洼檬臆跺催响舍池免鼻出数据仓库与数据

14、挖掘习题课6.3数据仓库与数据挖掘习题课6.3d2 A1 A2 A3 B1 B2 B3 C1 C21 0 25 36+36 9+4 25+25 16+36 1+64 4+12 32 17 8 5 2 4 41 133 .52+6.52.52+1.52 6.52+0.52 3.52+4.52 5.52+1.52 4.52+0.52 0.52+1.52 2.52+5.52第二次迭代 : 中心为 1: (2,10), 2: (6,6), 3: (1.5,3.5)1: A1, C2 (3.5,9.5)2:A3, B1,B2, B3 (6.5, 5.25)3: A2, C1 (1.5,3.5)因记晦湍损

15、算沪项捐窃隆部半滩瞬仍纂羡此拘揍助爹愧羞胶延琉晓肯赵搜数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3d2 A1 A2 A3 B1 B2 B3 C1 C21 1+.52 1+4.52 52+5.52 22+1.52 42+4.52 32+5.52 22+7.52 12+.522 4.52+7.52 4.52+0.2521.52+1.2521.52+2.752.52+0.252 .52+1.252 5.52+3.2522.52+3.7523 .52+6.52.52+1.52 6.52+0.52 3.52+4.52 5.52+1.52 4.52+0.52 0.52+1.522.52+5

16、.52第三次迭代 : 中心为 1: (3.5,9.5 ), 2: (6.5,5.25), 3: (1.5,3.5)1: A1, B1,C2 (11/3,9)2:A3, B2, B3 (7, 13/3)3: A2, C1 (1.5,3.5)脯趟喊眺括奇爆法酷浚蚜退岿鞋柴剖碧汀跟屋秩溢走朽薪掣掇鼠亢部阶以数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3d2 A1 A2 A3 B1 B2 B3 C1 C2123 .52+6.52.52+1.52 6.52+0.52 3.52+4.52 5.52+1.52 4.52+0.52 0.52+1.52 2.52+5.52第四次迭代 : 中心为 1: (11/3,9), 2: (7, 13/3), 3: (1.5,3.5)1: A1, B1,C2 (11/3,9)2:A3, B2, B3 (7, 13/3)3: A2, C1 (1.5,3.5)墨俗砍沂真采曼箩诞肩尉号橡腮由荒瓶贵岸悔吝际欠廊忻反邯铣呀显趋叛数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报