全球旧事资料 分类
类技术也能被用来对概念分
层,这是通过将低级概念上卷到高级概念来光滑数据。
35如下规范化方法的值域是什么?答:
ami
max规范化。值域是
ew_mi
ew_max。
bzscore规范化。值域是old_mi
-mea
σ,old_max-mea
σ,总的来说,对于所有可能的数据集的值域是-∞,∞。c小数定标规范化。
值域是-1010。37使用习题24给出的age数据,回答以下问题:
a使用mi
max规范化将age值35变换到00,10区间。
b使用zscore规范化变换age值35,其中age的标准差为1294岁。
c使用小数定标规范化变换age值35。
d对于给定的数据,你愿意使用哪种方法?陈述你的理由。
解答:
精品文档
f精品文档
39假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215。使用如下每种方法将其划分成三个箱。a等频(等深)划分。b等宽划分。
精品文档
f精品文档
c聚类。解答:a等频(等深)划分。
bi
15101113bi
115355055
b等宽划分。
bi
17291204215
精品文档
f精品文档
每个区间的宽度是:2155370
bi
151011131535505572
bi
1
91
bi
1c聚类。
204215
我们可以使用一种简单的聚类技术:用2个最大的间隙将数据分成3个箱。
bi
1510111315
bi
13550557291
bi
1204215
311使用习题24给出的age数据,a画出一个等宽为10的等宽直方图;b为如下每种抽样技术勾画例子:SRSWOR,SRSWR,聚类抽样,分层抽样。使用大小为5的样本和层“青年”,“中年”和“老年”。解答:a画出一个等宽为10的等宽直方图;
8
7
6
5
4
3
2
1
0
15
25
35
45
55
65
b为如下每种抽样技术勾画例子:SRSWOR,SRSWR,聚类抽样,分层抽
样。使用大小为5的样本和层“青年”,“中年”和“老年”。
元组:
T113T1022T1935T215T1125T2035T316T1225T2135T416T1325T2236T519T1425T2340T620T1530T2445T720T1633T2546T821T1733T2652
精品文档
f精品文档T922T1835T2770
SRSWOR和SRSWR:不是同次的随机抽样结果可以不同,但前者因无放回所以不能有相同的元组。
SRSWOR
5SRSWR
5
T4
16
T7
20
T6
20
T7
20
T10
22
T20
35
T11
25
T21
35
T26
52
T25
46
聚类抽样:设起始聚类共有6类,可抽其中的m类。
Sample1
Sample2
Sample3
Sample4
Sample5
Sample6
T1
13
T6
20T1125T1633T2135T2652
T215T720T1225T1733T2236T2770
T316T821T1325T1835T2340
T416T922T1425T1935T2445T519T1022T1530T2035T2546
Sample2Sample5T620T2135T720T2236T821T2340T922T2445T1022T2546
T113you
gT102r
好听全球资料 返回顶部