数据库的物理组织

本讲(第六章)简要说明

授课目的与要求:掌握无序文件,顺序文件,HASH 文件的文件组织方法。授课难点:支持文件空间动态变化的HASH 技术。

作业安排:p.206 1,2,5,9

文件组织和存储结构

为数据库存储模式设计提供多种可供选择的文件组织方法是本讲要解决的问题。按一定的逻辑结构(如顺序、树)组织关联的数据记录(逻辑文件),并用体现逻辑结构的物理存储形式存到物理设备上。目标:根据用户和系统设计要求,组织时空综合性能最佳,易于维护的文件,为数据库提供方便、灵活的文件访问。

Diameter: 1 inch →15 inchesCylinders:100 →2000Surfaces:1 (CDs) →

2 (floppies) →几十

Sector Size:512B →50K Capacity:360 KB (old floppy)

→几百GB

6. 2 文件组织的基本概念

1. 文件的基本组织方法:

•无序文件顺序文件HASH 文件文件的性能度量:文件存储空间利用率操作的时间耗费(典型操作)文件的重新组织(周期和难易).

3. 逻辑记录与物理记录

物理记录------内外存交换数据的最小单

位,对磁盘而言,控制部件可寻址的最小单位是块(扇段)。一般来说,在同一系统中,块的大小是相同的,512、1024或2048字节等。

逻辑记录:组织用户逻辑文件的基本单

位。

例如:学生基本情况文件中,一个现实学生的学号、姓名、年龄、性别、籍贯等数据组成的一个逻辑记录。

4. 组块方式:

怎样将逻辑记录存放到物理记录(块)中去。

1)定长记录固定组块。

2)变长记录不跨界。

3)变长记录跨界。

4)块列。

Microsoft Office Access将存储在表中的数据划分成大小为2 K的数据页,每个页面包含了一个或多个记录,但记录不能跨越页面。Access采用可变长记录作为标准存储方法,并且可以通过主关键字来对记录进行排序。因为长度可变,所以每个记录都只占据了存储它的实际数据所需的空间。每个页都包含一个头指针,用以创建数据页链表。头指针中包含了两个指针,一个指向它的前驱页面,另一个指向它的后续页面。新的数据将被添加到表的最后一页,这个页面被填满后,则再增加一个页面。Memo和OLE Object字段在页中可以跟记录中的其余

部分分开存储。

6.2 文件的组织方式

无序文件顺序文件散列文件

二、顺序文件

逻辑上按某一关键字(一般为主关键字)顺序排列的文件。

1. 物理结构

1)向量结构,地址连续的空间,地址

顺序实现逻辑顺序。

2)链结构,指针维持逻辑顺序。

3)块链结构,块中地址顺序表示逻辑

顺序,块间指针链接维持逻辑顺序。

顺序文件

2. 查找

1)顺序扫描(向量结构、链结构、块链结构)2)分块查找(向量结构、块链结构)3)折半查找(向量结构)4)探查(向量结构)

HASH文件

2. HASH方法的步骤3. 溢出处理

开寻址列分离溢出区分布溢出区

4. 溢出分析

5. 主要HASH 算法

HASH 文件

6. 支持文件空间动态变化的HASH 技术1)动态HASH 2)可扩展HASH 3)线性HASH

6. 支持文件空间动态变化的HASH 技术

桶号以二进制整数表示,开始时所有记录放在一个桶中。当一个桶溢出时分裂为两个桶:桶号最高位为0的放在一个桶中,桶号最高位为1的放在另一个桶中。当这些桶中又有某个溢出时,该桶又分裂为两个桶按次高位为0的放在一个桶中,次高位为1的放在另一个桶中。

When do we expand file?total # of slots If U > threshold then increase

(and maybe i ) n = U

查询过程:

BEGIN

IF n=0{/*n为溢出计数}THEN m←H j (k)

ELSE

BEGIN

m ←H j (k);

IF m

THEN m ←H j+1(k);END;

搜索值为m 的桶;

END

本讲(第六章)简要说明

授课目的与要求:掌握无序文件,顺序文件,HASH 文件的文件组织方法。授课难点:支持文件空间动态变化的HASH 技术。

作业安排:p.206 1,2,5,9

文件组织和存储结构

为数据库存储模式设计提供多种可供选择的文件组织方法是本讲要解决的问题。按一定的逻辑结构(如顺序、树)组织关联的数据记录(逻辑文件),并用体现逻辑结构的物理存储形式存到物理设备上。目标:根据用户和系统设计要求,组织时空综合性能最佳,易于维护的文件,为数据库提供方便、灵活的文件访问。

Diameter: 1 inch →15 inchesCylinders:100 →2000Surfaces:1 (CDs) →

2 (floppies) →几十

Sector Size:512B →50K Capacity:360 KB (old floppy)

→几百GB

6. 2 文件组织的基本概念

1. 文件的基本组织方法:

•无序文件顺序文件HASH 文件文件的性能度量:文件存储空间利用率操作的时间耗费(典型操作)文件的重新组织(周期和难易).

3. 逻辑记录与物理记录

物理记录------内外存交换数据的最小单

位,对磁盘而言,控制部件可寻址的最小单位是块(扇段)。一般来说,在同一系统中,块的大小是相同的,512、1024或2048字节等。

逻辑记录:组织用户逻辑文件的基本单

位。

例如:学生基本情况文件中,一个现实学生的学号、姓名、年龄、性别、籍贯等数据组成的一个逻辑记录。

4. 组块方式:

怎样将逻辑记录存放到物理记录(块)中去。

1)定长记录固定组块。

2)变长记录不跨界。

3)变长记录跨界。

4)块列。

Microsoft Office Access将存储在表中的数据划分成大小为2 K的数据页,每个页面包含了一个或多个记录,但记录不能跨越页面。Access采用可变长记录作为标准存储方法,并且可以通过主关键字来对记录进行排序。因为长度可变,所以每个记录都只占据了存储它的实际数据所需的空间。每个页都包含一个头指针,用以创建数据页链表。头指针中包含了两个指针,一个指向它的前驱页面,另一个指向它的后续页面。新的数据将被添加到表的最后一页,这个页面被填满后,则再增加一个页面。Memo和OLE Object字段在页中可以跟记录中的其余

部分分开存储。

6.2 文件的组织方式

无序文件顺序文件散列文件

二、顺序文件

逻辑上按某一关键字(一般为主关键字)顺序排列的文件。

1. 物理结构

1)向量结构,地址连续的空间,地址

顺序实现逻辑顺序。

2)链结构,指针维持逻辑顺序。

3)块链结构,块中地址顺序表示逻辑

顺序,块间指针链接维持逻辑顺序。

顺序文件

2. 查找

1)顺序扫描(向量结构、链结构、块链结构)2)分块查找(向量结构、块链结构)3)折半查找(向量结构)4)探查(向量结构)

HASH文件

2. HASH方法的步骤3. 溢出处理

开寻址列分离溢出区分布溢出区

4. 溢出分析

5. 主要HASH 算法

HASH 文件

6. 支持文件空间动态变化的HASH 技术1)动态HASH 2)可扩展HASH 3)线性HASH

6. 支持文件空间动态变化的HASH 技术

桶号以二进制整数表示,开始时所有记录放在一个桶中。当一个桶溢出时分裂为两个桶:桶号最高位为0的放在一个桶中,桶号最高位为1的放在另一个桶中。当这些桶中又有某个溢出时,该桶又分裂为两个桶按次高位为0的放在一个桶中,次高位为1的放在另一个桶中。

When do we expand file?total # of slots If U > threshold then increase

(and maybe i ) n = U

查询过程:

BEGIN

IF n=0{/*n为溢出计数}THEN m←H j (k)

ELSE

BEGIN

m ←H j (k);

IF m

THEN m ←H j+1(k);END;

搜索值为m 的桶;

END


相关内容

  • 数据库设计课后答案
  • 第六章 数据库设计 习题解答和解析 1. 1. 试述数据库设计过程. 答:这里只概要列出数据库设计过程的六个阶段: (1)需求分析;(2)概念结构设计;(3)逻辑结构设计;(4)数据库物理设计;(5)数据库实施;(6)数据库运 行和维护.这是一个完整的实际数据库及其应用系统的设计过程.不仅包括设计数 ...

  • [数据库基础]复习题(选修课)
  • 第一篇 绪 论 1.试述数据.数据库.数据库系统.数据库管理系统的概念. 答:(1)数据(Data ):描述事物的符号记录称为数据.数据的种类有数字.文字.图形.图像.声音.正文等.数据与其语义是不可分的.(2)数据库(DataBase ,简称DB ):数据库是长期储存在计算机内的.有组织的.可共享 ...

  • 网络体系结构的基本原理
  • 计算机网络由多个互连的结点组成,结点之间要不断地交换数据和控制信息,要做到有条不紊地交换数据,每个结点就必须遵守一整套合理而严谨的结构化管理体系.计算机网络就是按照高度结构化设计方法采用功能分层原理来实现的,即计算机网络体系结构的内容. 网络体系结构及协议的概念 网络体系和网络体系结构 网络体系(N ...

  • 三五-六课堂教学策略
  • 三五-六"课堂教学策略 临沂市教研室 高中物理新授课教学策略 新授课是以新知生成和方法探究立意的一种课型,要注重互动性,体现过程性,着眼探究性.高中物理新授课主要有概念新授课与规律新授课.概念新授课教学倡导"比较建构式"教学策略,即通过比较不同现象(或物质)的共同属性. ...

  • 外文电子期刊数据库
  • AMS 电子期刊数据库 美国数学学会(American Mathematical Society ,简称AMS )创建于1888年,多年来一直致力于促进全球数学研究的发展及其应用,也为数学教育服务 AACR 美国癌症研究期刊数据库 链接 截止 日期 2011 年12 月31 日 详细 描述 美国癌症 ...

  • [软件架构设计文档]模板
  • 目 录 1. 文档简介 1.1 1.2 1.3 1.4 2. 文档目的 文档范围 定义.缩写词和缩略语 参考资料 4 4 4 4 4 4 4 5 5 5 5 6 6 6 6 6 6 7 8 10 11 11 11 12 12 12 13 13 13 13 14 14 14 14 15 16 架构描述 ...

  • 课外物理实验的设计
  •  物理学是研究自然界中各种物理现象的规律和物质结构的一门科学。它是以实验为基础的科学。所有的物理知识,包括物理概念、定律和理论,都是在实验的基础上建立起来的。因此,培养学生的实验操作能力,掌握物理学的研究方法,养成实事求是的科学态度,对学生今后学好物理会起到促进作用。这就是当前我们贯彻和实施素质教育 ...

  • 七层网络模型
  • 第五节 OSI各层的功能 (1)物理层----定义了为建立.维护和拆除物理链路所需的机械的.电气的.功能的和规程的特性,其作用是使原始的数据比特流能在物理媒体上传输.具体涉及接插件的规格."0"."1"信号的电平表示.收发双方的协调等内容. (2)数据链路层- ...

  • 大型项目中如何开展数据库设计工作
  • 大型项目中如何开展数据库设计工作 本文基于我在上海证券交易所第三代监察系统项目的实践描述如何在大型项目中开展数据库设计工作,本文避免过多的描述具体实现的技术细节,侧重于从软件工程角度描述数据库设计的整体流程以及项目各个阶段的工作侧重点. 1. 开展数据库设计工作所需条件 对于基于数据信息处理的大型行 ...