数据库设计规范化的五个要求

数据库设计规范化的五个要求通常情况下，可以从两个方面来判断数据库是否设计的比较规范。一是看看是否拥有大量的窄表，二是宽表的数量是否足够的少。若符合这两个条件，则可以说明这个数据库的规范化水平还是比较高的。当然这是两个泛泛而谈的指标。为了达到数据库设计规范化的要求，一般来说，需要符合以下五个要求。

要求一：表中应该避免可为空的列。

虽然表中允许空列，但是，空字段是一种比较特殊的数据类型。数据库在处理的时候，需要进行特殊的处理。如此的话，就会增加数据库处理记录的复杂性。当表中有比较多的空字段时，在同等条件下，数据库处理的性能会降低许多。

所以，虽然在数据库表设计的时候，允许表中具有空字段，但是，我们应该尽量避免。若确实需要的话，我们可以通过一些折中的方式，来处理这些空字段，让其对数据库性能的影响降低到最少。

一是通过设置默认值的形式，来避免空字段的产生。如在一个人事管理系统中，有时候身份证号码字段可能允许为空。因为不是每个人都可以记住自己的身份证号码。而在员工报到的时候，可能身份证没有带在身边。所以，身份证号码字段往往不能及时提供。为此，身份证号码字段可以允许为空，以满足这些特殊情况的需要。但是，在数据库设计的时候，则可以做一些处理。如当用户没有输入内容的时候，则把这个字段的默认值设置为0或者为N/A。以避免空字段的产生。

二是若一张表中，允许为空的列比较多，接近表全部列数的三分之一。而且，这些列在大部分情况下，都是可有可无的。若数据库管理员遇到这种情况，笔者建议另外建立一张副表，以保存这些列。然后通过关键字把主表跟这张副表关联起来。将数据存储在两个独立的表中使得主表的设计更为简单，同时也能够满足存储空值信息的需要。要求二：表不应该有重复的值或者列。

如现在有一个进销存管理系统，这个系统中有一张产品基本信息表中。这个产品开发有时候可以是一个人完成，而有时候又需要多个人合作才能够完成。所以，在产品基本信息表产品开发者这个字段中，有时候可能需要填入多个开发者的名字。

如进销存管理中，还需要对客户的联系人进行管理。有时候，企业可能只知道客户一个采购员的姓名。但是在必要的情况下，企业需要对客户的采购代表、仓库人员、财务人员共同进行管理。因为在订单上，可能需要填入采购代表的名字; 可是在出货单上，则需要填入仓库管理人员的名字等等。

为了解决这个问题，有多种实现方式。但是，若设计不合理的话在，则会导致重复的值或者列。如我们也可以这么设计，把客户信息、联系人都放入同一张表中。为了解决多个联系人的问题，可以设置第一联系人、第一联系人电话、第二联系人、第二联系人电话等等。若还有第三联系人、第四联系人等等，则往往还需要加入更多的字段。

可是这么设计的话，会产生一系列的问题。如客户的采购员流动性比较大，在一年内换了六个采购员。此时，在系统中该如何管理呢? 难道就建立六个联系人字段? 这不但会导致空字段的增加，还需要频繁的更改数据库表结构。明显，这么做是不合理的。也有人说，可以

直接修改采购员的名字呀。可是这么处理的话，会把原先采购订单上采购员的名字也改变了。因为采购单上客户采购员信息在数据库中存储的不是采购员的名字，而只是采购员对应的一个编号。在编号不改而名字改变了的情况下，采购订单上显示的就是更改后的名字。这不利于时候的追踪。

所以，在数据库设计的时候要尽量避免这种重复的值或者列的产生。笔者建议，若数据库管理员遇到这种情况，可以改变一下策略。如把客户联系人另外设置一张表。然后通过客户ID 把供应商信息表跟客户联系人信息表连接起来。也就是说，尽量将重复的值放置到一张独立的表中进行管理。然后通过视图或者其他手段把这些独立的表联系起来。要求三：表中记录应该有一个唯一的标识符。

在数据库表设计的时候，数据库管理员应该养成一个好习惯，用一个ID 号来唯一的标识行记录，而不要通过名字、编号等字段来对纪录进行区分。每个表都应该有一个ID 列，任何两个记录都不可以共享同一个ID 值。另外，这个ID 值最好有数据库来进行自动管理，而不要把这个任务给前台应用程序。否则的话，很容易产生ID 值不统一的情况。

另外，在数据库设计的时候，最好还能够加入行号。如在销售订单管理中，ID 号是用户不能够维护的。但是，行号用户就可以维护。如在销售订单的行中，用户可以通过调整行号的大小来对订单行进行排序。通常情况下，ID 列是以1为单位递进的。但是，行号就要以10为单位累进。如此，正常情况下，行号就以10、 20、30依次扩展下去。若此时用户需要把行号为30的纪录调到第一行显示。此时，用户在不能够更改ID 列的情况下，可以更改行号来实现。如可以把行号改为1，在排序时就可以按行号来进行排序。如此的话，原来行号为30的纪录现在行号变为了1，就可以在第一行中显示。这是在实际应用程序设计中对ID 列的一个有效补充。这个内容在教科书上是没有的。需要在实际应用程序设计中，才会掌握到这个技巧。

要求四：数据库对象要有统一的前缀名。

一个比较复杂的应用系统，其对应的数据库表往往以千计。若让数据库管理员看到对象名就了解这个数据库对象所起的作用，恐怕会比较困难。而且在数据库对象引用的时候，数据库管理员也会为不能迅速找到所需要的数据库对象而头疼。

为此，笔者建立，在开发数据库之前，最好能够花一定的时间，去制定一个数据库对象的前缀命名规范。如笔者在数据库设计时，喜欢跟前台应用程序协商，确定合理的命名规范。笔者最常用的是根据前台应用程序的模块来定义后台数据库对象前缀名。如跟物料管理模块相关的表可以用M 为前缀; 而以订单管理相关的，则可以利用C 作为前缀。具体采用什么前缀可以以用户的爱好而定义。但是，需要注意的是，这个命名规范应该在数据库管理员与前台应用程序开发者之间达成共识，并且严格按照这个命名规范来定义对象名。

其次，表、视图、函数等最好也有统一的前缀。如视图可以用V 为前缀，而函数则可以利用F 为前缀。如此数据库管理员无论是在日常管理还是对象引用的时候，都能够在最短的时间内找到自己所需要的对象。

要求五：尽量只存储单一实体类型的数据。

这里将的实体类型跟数据类型不是一回事，要注意区分。这里讲的实体类型是指所需要描述对象的本身。笔者举一个例子，估计大家就可以明白其中的内容了。如现在有一个图书馆里系统，有图书基本信息、作者信息两个实体对象。若用户要把这两个实体对象信息放在同一张表中也是可以的。如可以把表设计成图书名字、图书作者等等。可是如此设计的话，会给后续的维护带来不少的麻烦。

如当后续有图书出版时，则需要为每次出版的图书增加作者信息，这无疑会增加额外的存储空间，也会增加记录的长度。而且若作者的情况有所改变，如住址改变了以后，则还需要去更改每本书的记录。同时，若这个作者的图书从数据库中全部删除之后，这个作者的信息也就荡然无存了。很明显，这不符合数据库设计规范化的需求。

遇到这种情况时，笔者建议可以把上面这张表分解成三种独立的表，分别为图书基本信息表、作者基本信息表、图书与作者对应表等等。如此设计以后，以上遇到的所有问题就都引刃而解了。

以上五条是在数据库设计时达到规范化水平的基本要求。除了这些另外还有很多细节方面的要求，如数据类型、存储过程等等。而且，数据库规范往往没有技术方面的严格限制，主要依靠数据库管理员日常工作经验的累积。

数据库设计中的反规范技术探讨

1. 数据库设计简述

数据库设计是把现实世界的商业模型与需求转换成数据库的模型的过程，它是建立数据库应用系统的核心问题。设计的关键是如何使设计的数据库能合理地存储用户的数据，方便用户进行数据处理。

数据库设计完全是人的问题，而不是数据库管理系统的问题。系统不管设计是好是坏，照样运行。数据库设计应当由数据库管理员和系统分析员一起和用户一道工作，了解各个用户的要求，共同为整个数据库做出恰当的、完整的设计。

数据库及其应用的性能和调优都是建立在良好的数据库设计的基础上，数据库的数据是一切操作的基础，如果数据库设计不好，则其它一切调优方法提高数据库性能的效果都是有限的。

数据的规范化

1.1. 范式概述

规范化理论是研究如何将一个不好的关系模式转化为好的关系模式的理论，规范化理论是围绕范式而建立的。规范化理论认为，一个关系数据库中所有的关系，都应满足一定的规范(约束条件) 。规范化理论把关系应满足的规范要求分为几级，满足最低要求的一级叫做第一范式(1NF)，在第一范式的基础上提出了第二范式(2NF)，在第二范式的基础上又提出了第

三范式(3NF)，以后又提出了BCNF 范式，4NF ，5NF 。范式的等级越高，应满足的约束集条件也越严格。规范的每一级别都依赖于它的前一级别，例如若一个关系模式满足2NF ，则一定满足1NF 。下面我们只介绍1NF ，2NF ，3NF 范式。

1.2. 1NF

1NF 是关系模型的最低要求，它的规则是：

每一列必须是原子的，不能分成多个子列。

每一行和列的位置只能有一个值。

不能具有多值列。

例：如果要求一个学生一行，一个学生可选多门课，则下面的“学生”表就不满足1NF ： student(s－no,s －name,class －no)

其中：s －no 为学号，s －name 为学生姓名，class －no 为课程号。因为一个学生可选多门课，所以列class －no 有多个值，所以空不符合1NF 。

规范化就是把它分成如下两个表：“学生”表和“选课”表，则这两个表就都满足1NF 了。

student(s－no,s －name)

stu －class(s－no,class －no)

1.3. 2NF

对于满足2NF 的表，除满足 1NF 外，非主码的列必须依赖于所有的主码，而不是组合主码的一部分。如果满足1NF 的表的主码只有一列，则它自动满足2NF 。例：下面的“选课”表，不符合2NF 。

stu －class(s－no,class －no,class －name)

其中：class －name 为课程名称。因为词表的主码是： (s－no,class －no), 非主码列class －name 依赖于组合主码的一部分class －no, 所以它不符合2NF 。

对该表规范化也是把它分解成两个表：“选课”表和“课程”表，则它们就都满足2NF 了。

stu －class(s－no,class －no)

class(class－no,class －name)

1.4. 3NF

3NF 的规则是除满足2NF 外，任一非主码列不能依赖于其它非主码列。例：下面的“课程”表，不符合3NF 。

class(class－no,class －name,teacher －no,teacher －name)

其中：teacher －no 为任课教师号，teacher －name 为任课教师姓名。因为非主码列teacher －name 依赖于另一非主码列teacher －no, 所以它不符合3NF 。其解决办法也是把它分解成两个表：“课程”表和 “教师”表，则它们就都满足3NF 了。

class(class－no,class －name,teacher －no)

teacher(teacher－no,teacher －name)

1.5. 小结

当一个表是规范的，则其非主码列依赖于主码列。从关系模型的角度来看，表满足3NF 最符合标准，这样的设计容易维护。一个完全规范化的设计并不总能生成最优的性能，因此通常是先按照3NF 设计，如果有性能问题，再通过反规范来解决。

数据库中的数据规范化的优点是减少了数据冗余，节约了存储空间，相应逻辑和物理的I/O次数减少，同时加快了增、删、改的速度，但是对完全规范的数据库查询，通常需要更多的连接操作，从而影响查询的速度。因此，有时为了提高某些查询或应用的性能而破坏规范规则，即反规范。

2. 数据的反规范

2.1. 反规范的好处

是否规范化的程度越高越好? 这要根据需要来决定，因为“分离”越深，产生的关系越多，关系过多，连接操作越频繁，而连接操作是最费时间的，特别对以查询为主的数据库应用来说，频繁的连接会影响查询速度。所以，关系有时故意保留成非规范化的，或者规范化以后又反规范了，这样做通常是为了改进性能。例如帐户系统中的“帐户”表B －TB01，它的列busi －balance(企业帐户的总余额) 就违反规范，其中的值可以通过下面的查询获得：

select busi－code,sum(acc－balance)

from B －TB06

group by busi－code

如果B －TB01中没有该列，若想获得busi －name(企业名称) 和企业帐户的总余额，

则需要做连接操作：

select busi－name,sum(acc－balance)

from B－TB01,B －TB06 where B－TB01.busi －code=B－TB06.busi －code

group by busi－code

如果经常做这种查询，则就有必要在B －TB01中加入列busi －balance ，相应的代价则是必须在表B －TB06上创建增、删、改的触发器来维护B －TB01表上busi －balance 列的值。类似的情况在决策支持系统中经常发生。

反规范的好处是降低连接操作的需求、降低外码和索引的数目，还可能减少表的数目，相应带来的问题是可能出现数据的完整性问题。加快查询速度，但会降低修改速度。因此决定做反规范时，一定要权衡利弊，仔细分析应用的数据存取需求和实际的性能特点，好的索引和其它方法经常能够解决性能问题，而不必采用反规范这种方法。

2.2. 常用的反规范技术

在进行反规范操作之前，要充分考虑数据的存取需求、常用表的大小、一些特殊的计算(例如合计) 、数据的物理存储位置等。常用的反规范技术有增加冗余列、增加派生列、重新组表和分割表。

2.2.1. 增加冗余列

增加冗余列是指在多个表中具有相同的列，它常用来在查询时避免连接操作。例如前面例子中，如果经常检索一门课的任课教师姓名，则需要做class 和teacher 表的连接查询：

select class－name,teacher －name

from class,teacher

where class.teacher －no=teacher.teacher－no

这样的话就可以在class 表中增加一列 teacher －name 就不需要连接操作了。

增加冗余列可以在查询时避免连接操作，但它需要更多的磁盘空间，同时增加表维护的工作量。

2.2.2. 增加派生列

增加派生列指增加的列来自其它表中的数据，由它们计算生成。它的作用是在查询

时减少连接操作，避免使用集函数。例如前面所讲的账户系统中的表B －TB01的列 busi －balance 就是派生列。派生列也具有与冗余列同样的缺点。

2.2.3. 重新组表

重新组表指如果许多用户需要查看两个表连接出来的结果数据，则把这两个表重新组成一个表来减少连接而提高性能。例如，用户经常需要同时查看课程号，课程名称，任课教师号，任课教师姓名，则可把表class(class－no,class －name,teacher －no) 和表 teacher(teacher－no,teacher －name) 合并成一个表 class(class－no,class －name,teacher －no,teacher －name) 。这样可提高性能，但需要更多的磁盘空间，同时也损失了数据在概念上的独立性。

2.2.4. 分割表

有时对表做分割可以提高性能。表分割有两种方式：

1水平分割：根据一列或多列数据的值把数据行放到两个独立的表中。水平分割通常在下面的情况下使用:A 表很大，分割后可以降低在查询时需要读的数据和索引的页数，同时也降低了索引的层数，提高查询速度。B 表中的数据本来就有独立性，例如表中分别记录各个地区的数据或不同时期的数据，特别是有些数据常用，而另外一些数据不常用。

C 需要把数据存放到多个介质上。例如法规表law 就可以分成两个表active －law 和inactive －law 。activea －authors 表中的内容是正生效的法规，是经常使用的，而inactive －law 表则使已经作废的法规，不常被查询。水平分割会给应用增加复杂度，它通常在查询时需要多个表名，查询所有数据需要union 操作。在许多数据库应用中，这种复杂性会超过它带来的优点，因为只要索引关键字不大，则在索引用于查询时，表中增加两到三倍数据量，查询时也就增加读一个索引层的磁盘次数。

2垂直分割：把主码和一些列放到一个表，然后把主码和另外的列放到另一个表中。如果一个表中某些列常用，而另外一些列不常用，则可以采用垂直分割，另外垂直分割可以使得数据行变小，一个数据页就能存放更多的数据，在查询时就会减少I/O次数。其缺点是需要管理冗余列，查询所有数据需要join 操作。

3. 反规范技术需要维护数据的完整性

无论使用何种反规范技术，都需要一定的管理来维护数据的完整性，常用的方法是批处理维护、应用逻辑和触发器。批处理维护是指对复制列或派生列的修改积累一定的时间后，运行一批处理作业或存储过程对复制或派生列进行修改，这只能在对实时性要求不高的情况下使用。数据的完整性也可由应用逻辑来实现，这就要求必须在同一事务中对所有涉及的表进行增、删、改操作。用应用逻辑来实现数据的完整性风险较大，因为同一逻辑必须在所有的应用中使用和维护，容易遗漏，特别是在需求变化时，不易于维护。另一种方式就是使用触发器，对数据的任何修改立即触发对复制列或派生列的相应修改。触发器是实时的，而且相应的处理逻辑只在一个地方出现，易于维护。一般来说，是解决这类问题的最好的办法。

4. 结束语

数据库的反规范设计可以提高查询性能。常用的反规范技术有增加冗余列、增加派生列、重新组表和分割表。但反规范技术需要维护数据的完整性。因此在做反规范时，一定要权衡利弊，仔细分析应用的数据存取需求和实际的性能特点。

Oracle 数据库设计阶段性能优化策略

通过对Oracle 数据库系统物理结构和逻辑结构的分析，阐述了在Oralce 数据库设计开发阶段性能优化的一些策略和方法。

Oracle 是目前使用最为广泛的大型数据库管理系统，提高Oracle 数据库系统的运行效率，是整个计算机信息系统高效运转的前提和保证。影响Oracle 数据库应用系统性能的因素很多，既有软件方面的因素，也包括数据运行的硬件环境、网络环境、数据库管理和维护方面的因素等。数据库系统设计开发阶段是Oracle 应用优化的最佳阶段，也是主动优化阶段，能达到以最小成本获得最大性能增益的目的。通过对其逻辑存储结构和物理存储结构设计进行优化，使之在满足需求条件下，时空开销性能最佳，可以解决数据库系统运行过程中性能的渐进性下降或性能突降等问题，以保证系统运行的优良性能。

Oracle 数据库的逻辑结构和物理结构

Oracle 数据库的逻辑结构是由一些数据库对象组成，如数据库表空间、表、索引、段、视图、存储过程、触发器等。数据库的逻辑存储结构(表空间等) 决定了数据库的物理空间是如何被使用的，数据库对象如表、索引等分布在各个表空间中。

Oracle 数据库的物理结构从操作系统一级查看，是由一个个的文件组成，从物理上可划分为：数据文件、日志文件、控制文件和参数文件。数据文件中存放了所有的数据信息; 日志文件存放数据库运行期间产生的日志信息，它被重复覆盖使用，若不采用归档方式的话，已被覆盖的日志信息将无法恢复；控制文件记录了整个数据库的关键结构信息，它若被破坏，整个数据库将无法工作和恢复；参数文件中设置了很多Oracle 数据库的配置参数，当数据库启动时，会读取这些信息。

逻辑结构的优化

逻辑结构优化用通俗的话来说就是通过增加、减少或调整逻辑结构来提高应用的效率，下面通过对基本表的设计及索引、聚簇的讨论来分析ORACLE 逻辑结构的优化。

1、基本表扩展:

数据库性能包括存储空间需求量的大小和查询响应时间的长短两个方面。为了优化数据库性能，需要对数据库中的表进行规范化。一般来说，逻辑数据库设计满足第三范式的表结构容易维护且基本满足实际应用的要求。所以，实际应用中一般都按照第三范式的标准进行规范化，从而保证了数据库的一致性和完整性，设计人员往往会设计过多的表间关联，以尽可能地降低数据冗余。但在实际应用中这种做法有时不利于系统运行性能的优化:如过程从

多表获取数据时引发大量的连接操作，在需要部分数据时要扫描整个表等，这都消耗了磁盘的I/O 和CPU 时间。

为解决这一问题，在设计表时应同时考虑对某些表进行反规范化，方法有以下几种：一是分割表。分割表可分为水平分割表和垂直分割表两种:水平分割是按照行将一个表分割为多个表，这可以提高每个表的查询速度，但查询、更新时要选择不同的表，统计时要汇总多个表，因此应用程序会更复杂。垂直分割是对于一个列很多的表，若某些列的访问频率远远高于其它列，就可以将主键和这些列作为一个表，将主键和其它列作为另外一个表。通过减少列的宽度，增加了每个数据页的行数，一次I/O就可以扫描更多的行，从而提高了访问每一个表的速度。但是由于造成了多表连接，所以应该在同时查询或更新不同分割表中的列的情况比较少的情况下使用。二是保留冗余列。当两个或多个表在查询中经常需要连接时，可以在其中一个表上增加若干冗余的列，以避免表之间的连接过于频繁，一般在冗余列的数据不经常变动的情况下使用。三是增加派生列。派生列是由表中的其它多个列的计算所得，增加派生列可以减少统计运算，在数据汇总时可以大大缩短运算时间。

因此，在数据库的设计中，数据应当按两种类别进行组织：频繁访问的数据和频繁修改的数据。对于频繁访问但是不频繁修改的数据，内部设计应当物理不规范化。对于频繁修改但并不频繁访问的数据，内部设计应当物理规范化。有时还需将规范化的表作为逻辑数据库设计的基础，然后再根据整个应用系统的需要，物理地非规范化数据。规范与反规范都是建立在实际的操作基础之上的约束，脱离了实际两者都没有意义。只有把两者合理地结合在一起，才能相互补充，发挥各自的优点。

2、索引和聚簇:

创建索引是提高检索效率最有效的方法之一，索引把表中的逻辑值映射到安全的 RowID ，能快速定位数据的物理地址，可以大大加快数据库的查询速度，一个建有合理索引的数据库应用系统可能比一个没有建立索引的数据库应用系统效率高几十倍，但并不是索引越多越好，在那些经常需要修改的数据列上建立索引，将导致索引B*树的不断重组，造成系统性能的下降和存储空间的浪费。对于一个大型表建立的索引，有时并不能改善数据查询速度，反而会影响整个数据库的性能。这主要是和SGA 的数据管理方式有关，Oracle 在进行数据块高速缓存管理时，索引数据比普通数据具有更高的驻留权限，在进行空间竞争时，Oracle 会先移出普通数据，对建有索引的大型表进行数据查询时，索引数据可能会用完所有的数据块缓存空间，Oracle 不得不频繁地进行磁盘读写来获取数据，所以，在对一个大型表进行分区之后，可以根据相应的分区建立分区索引。

Oracle 提供了另一种方法来提高查询速度，就是聚簇(Cluster)。所谓聚簇，简单地说就是把几个表放在一起，按一定公共属性混合存放。聚簇根据共同码值将多个表的数据存储在同一个Oracle 块中，这时检索一组Oracle 块就同时得到两个表的数据，这样就可以减少需要存储的Oracle 块，从而提高应用程序的性能。

对于逻辑结构的优化，还应将表数据和索引数据分开表空间存储，分别使用独立的表空间。因为如果将表数据和索引数据放在一起，表数据的I/O操作和索引的I/O操作将产生影响系统性能的I/O竞争，降低系统的响应效率。将表数据和索引数据存放在不同的表空间中，并在物理层面将这两个表空间的数据文件放在不同的物理磁盘上，就可以避免这种竞争了。

物理结构的优化

数据库的数据最终是存储在物理磁盘上的，对数据进行访问就是对这些物理磁盘进行读写，因此对于这些物理存储的优化是系统优化的一个重要部分。对于物理存储结构优化，主要是合理地分配逻辑结构的物理存储地址，这样虽不能减少对物理存储的读写次数，但却可以使这些读写尽量并行，减少磁盘读写竞争，从而提高效率，也可以通过对物理存储进行精密的计算减少不必要的物理存储结构扩充，从而提高系统利用率。

1、磁盘读写并行优化:

对于数据库的物理读写，Oracle 系统本身会进行尽可能的并行优化，例如在一个最简单的表检索操作中，如果表结构和检索域上的索引不在一个物理结构上，那么在检索的过程中，对索引的检索和对表的检索就是并行进行的。

2、操作并行优化:

操作并行的优化是基于操作语句的统计结果，首先是统计各个表的访问频率，表之间的连接频率，根据这些数据按如下原则分配表空间和物理磁盘，减少系统进程和用户进程的磁盘I/O竞争; 把需要连接的表格在表空间/物理磁盘上分开; 把高频访问的表格在表空间/物理磁盘上分开; 把经常需要进行检索的表格的表结构和索引在表空间/物理磁盘上分开。

3、减少存储结构扩展:

如果应用系统的数据库比较脆弱，并在不断地增长或缩小，这样的系统在非动态变化周期内效率合理，但是当在动态变化周期内的时候，性能却很差，这是由于Oracle 的动态扩展造成的。在动态扩张的过程中，Oracle 必须根据存储的要求，在创建行、行变化获取缺省值时，扩展和分配新的存储空间，而且表格的扩展往往并不是事情的终结，还可能导致数据文件、表空间的增长，这些扩展会导致在线系统反应缓慢。对于这样的系统，最好的办法就是在建立的时候预先分配足够的大小和合适的增长幅度。在一个对象建立的时候要根据应用充分地计算他们的大小，然后再根据这些数据来定义对象Initial 、Next 和Minextents 的值，使数据库在物理存储上和动态增长次数上达到一个比较好的平衡点，使这些对象既不经常发生增长，也不过多地占用数据库。

结论

优化Oracle 数据库对提高计算机系统的可用性和效率, 具有非常重要的意义, 特别是在Oracle 数据库设计开发阶段，对逻辑结构和物理结构进行有效的优化设计，创建一个规划布局合理的数据库，可以获得最小的系统开销，能从根本上大大提高应用系统的整体性能，对于以后的数据库性能调整和利用都有很大的益处。（T006）

要求一：表中应该避免可为空的列。

要求四：数据库对象要有统一的前缀名。

要求五：尽量只存储单一实体类型的数据。

数据库设计中的反规范技术探讨

1. 数据库设计简述

数据的规范化

1.1. 范式概述

1.2. 1NF

1NF 是关系模型的最低要求，它的规则是：

每一列必须是原子的，不能分成多个子列。

每一行和列的位置只能有一个值。

不能具有多值列。

例：如果要求一个学生一行，一个学生可选多门课，则下面的“学生”表就不满足1NF ： student(s－no,s －name,class －no)

其中：s －no 为学号，s －name 为学生姓名，class －no 为课程号。因为一个学生可选多门课，所以列class －no 有多个值，所以空不符合1NF 。

规范化就是把它分成如下两个表：“学生”表和“选课”表，则这两个表就都满足1NF 了。

student(s－no,s －name)

stu －class(s－no,class －no)

1.3. 2NF

stu －class(s－no,class －no,class －name)

其中：class －name 为课程名称。因为词表的主码是： (s－no,class －no), 非主码列class －name 依赖于组合主码的一部分class －no, 所以它不符合2NF 。

对该表规范化也是把它分解成两个表：“选课”表和“课程”表，则它们就都满足2NF 了。

stu －class(s－no,class －no)

class(class－no,class －name)

1.4. 3NF

3NF 的规则是除满足2NF 外，任一非主码列不能依赖于其它非主码列。例：下面的“课程”表，不符合3NF 。

class(class－no,class －name,teacher －no,teacher －name)

class(class－no,class －name,teacher －no)

teacher(teacher－no,teacher －name)

1.5. 小结

2. 数据的反规范

2.1. 反规范的好处

select busi－code,sum(acc－balance)

from B －TB06

group by busi－code

如果B －TB01中没有该列，若想获得busi －name(企业名称) 和企业帐户的总余额，

则需要做连接操作：

select busi－name,sum(acc－balance)

from B－TB01,B －TB06 where B－TB01.busi －code=B－TB06.busi －code

group by busi－code

2.2. 常用的反规范技术

2.2.1. 增加冗余列

select class－name,teacher －name

from class,teacher

where class.teacher －no=teacher.teacher－no

这样的话就可以在class 表中增加一列 teacher －name 就不需要连接操作了。

增加冗余列可以在查询时避免连接操作，但它需要更多的磁盘空间，同时增加表维护的工作量。

2.2.2. 增加派生列

增加派生列指增加的列来自其它表中的数据，由它们计算生成。它的作用是在查询

时减少连接操作，避免使用集函数。例如前面所讲的账户系统中的表B －TB01的列 busi －balance 就是派生列。派生列也具有与冗余列同样的缺点。

2.2.3. 重新组表

2.2.4. 分割表

有时对表做分割可以提高性能。表分割有两种方式：

3. 反规范技术需要维护数据的完整性

4. 结束语

Oracle 数据库设计阶段性能优化策略

通过对Oracle 数据库系统物理结构和逻辑结构的分析，阐述了在Oralce 数据库设计开发阶段性能优化的一些策略和方法。

Oracle 数据库的逻辑结构和物理结构

逻辑结构的优化

1、基本表扩展:

多表获取数据时引发大量的连接操作，在需要部分数据时要扫描整个表等，这都消耗了磁盘的I/O 和CPU 时间。

2、索引和聚簇:

物理结构的优化

1、磁盘读写并行优化:

2、操作并行优化:

3、减少存储结构扩展:

结论

数据库设计规范化的五个要求

相关内容

热门内容

标签