怎么过滤用户输入的元数据

2020-09-25 科技 57阅读
当今世界发达国家在教育现代化方面有较大的投入,其教育技术的发展水平较高,表现在理论上,形成适应新信息社会迅猛发展的各种现代教学理论和认知科学理论流派,在教育和教学过程中,采用了数字化音像技术、卫星广播电视技术、多媒体计算机和人工智能技术、互联网络技术和虚拟现实技术等多种现代信息技术,使得教学信息显示多媒体化,教学信息处理数字化,教学信息储存光盘化,教学信息传输网络化,教学过程智能化。形成有多媒体组合课堂教学,卫星电视广播教学,多媒体计算机个别化交互学习,互联网络远程通讯学习,虚拟仿真教学等多种教学方式。从而促使教学观念、教学内容、教学手段、教学理论和教学管理都发生重大的变化。在我国,教育技术专业的设置,开展教育技术研究和应用起步较晚。1983年,本学科作为全国第一个创办的教育技术专业,一开始就十分注重结合我国实际情况,开展教育技术理论体系、现代教育技术环境和现代媒体的开发理论、技术和应用的研究,尤其近十年来,利用广东省重点学科的经费,建立了多媒体技术研究实验室和教育电视研究实验室,开展基于多媒体技术和基于网络教学环境的研究,研究开发多媒体化的现代教学资源,取得了丰富的研究成果,并形成本学科的特色,这就是紧密结合中国的实际,探索并建立结合我国实际的教育技术基础理论体系;理论联系实际,面向基础教育,积极开展教育试验,探索教学规律。近十年来,在教育技术专业办学模式和课程体系研究、多媒体组合教学设计理论、多媒体教学软件设计理论和技术以及未来教育学的理论体系方面都取得了重要成果。并通过在全国100 多所中小学校中所开展的新型教学模式的试验探索研究,为全国各地校长、骨干教师和教育技术骨干的培训、推广这些新的理论与技术成果,对广东高校和全国许多省市的基础教育推广运用现代教育技术促进教学改革方面起了重要的指导和推动作用。
但对比发达国家的发展现状,本学科与国际先进水平相比较,仍存在很大差距。表现在缺乏高层次的教育技术专门人才,现代信息技术在教学中的应用水平较低;表现在多媒体计算机的应用仅起步,网络化环境还未建立,现代化教学资源,如多媒体教学软件、基于网络的教材都十分贫乏,教学观念、教学模式仍然停留在以教师为中心的传统模式上,因此,教育技术研究存在较大的空间。我们必须创造条件,重点扶持,加大投入,加强研究,逐步把这一差距缩小。
地理信息标准可以划分为五个层次,即国际标准、地区标准、国家标准、地方标准、其他标准。标准化工作可以从两方面进行:一是以已经发布实施的信息技术(IT)标准为基础,直接引用或者经过修编采用;二是研制地理空间数据标准,包括数据定义、数据描述、数据处理等方面的标准。
目前,正在制订标准和规范的重要单位和部门有:ISO/TC211(国际标准化组织TC211专题组)、FGDC(美国联邦地理数据委员会)、CEN/TC287(欧洲标准化委员会)、OGC(美国OpenGIS协会)、MEGRIN9(欧洲地图事务组织)、CGSD(加拿大标准委员会)、NASA(DIF美国航天航空局)。他们主要致力于:参考模型标准、数据描述(定义)标准、数据描述(技术)标准、数据应用模式标准、数据质量标准、数据定位、传输标准以及无数据标准等内容的研究。
图5.2"数字贵州"的关键技术框图
"数字贵州"中数据标准与规范主要包括以下两方面的内容:
(一)技术标准:
(1)参考系统标准:是指地理参考系统,或大地坐标等标准,是综合地球数据的基础标准。全球定位系统(GPS)技术的应用,提供了精确的地心坐标数据。要求将参考系统数据集存贮至一个精确的国家参考系统中,并要求明确规定国家参考系统与地心参考系统之间的关系,如果两者不同的话。
(2)数据模型标准:分概念数据模型与逻辑数据模型(或数据结构标准),另外还有物理数据模型或模型文件结构是在数据转换标准中实现的。概念模型为以空间数据形式表示现实世界所提供的一种模式。该模式还说明了基础数据集的空间和层理要素以及确立数据集间关系的语义结构。然后将概念层表示为一个或多个逻辑数据模型,来具体规定如何定义数据集间的关系。在该层上应对拓扑或栅格数据结构等予以规定。
(3)数据字典标准:是以概念数据模型为基础,提供基础数据集的空间与层次要素的标准定义。如公路可能有一系列的属性(如等级、铺路材料、宽度等),而等级又可分为一级、二级及三级公路。数据字典对这些术语的定义必须完全一致,从而对它们进行准确解释,并在GIS应用中对数据进行有效的集成。为确保一致性,每一基础数据要开发数据字典,并进行交叉参考。
(4)数据质量标准:数据质量标准可以是描述性的,也可以是指示性的,或者两者兼而有之。描述性标准以"真实地标记"为基础,要求数据生产者报告对数据质量的已知部分。这就使数据的使用者能够有根据地判断出数据的适用性。描述性数据质量标准要求生产者提供以下5个主要特征信息:系层、位置转换、层性转换、逻辑一致性及完整性。指示性标准将规定每一特征在这一特征应用中的质量参考。
(5)数据转换标准:提供了不同计算机环境间数据转换的一种中间格式。它们包括一整套使数据按字段、记录和文件要求进行编码的规划,以便通过指定的介质进行转换。数据模型是研制编码规则的先决条件,转换标准的中介性质是一种主要的特征。转换标准优化后可使所有的数据以及元数据(Metadata)数据进行有效的通信,而对产品和数据库结构进行优化后则可进行有效的存贮、应用及维护。
(6)元数据(Metadata)标准:元数据是数据的数据,用来对数据或数据集进行描述或说明。它在地理信息中用于描述地理数据集的内容、质量、表示方式、空间参照系、管理方式以数据集的其它特征,它是实现"数字贵州"中空间数据集共享的核心标准之一。目前,国际上各大标准与规范组织之间关于元数据的内容体系有一定的分岐。FGDC认为Metadata是"关于数据内容、质量、条件、以及其他特征的数据",它把Metadata分为标识信息、数据质量信息、空间数据组织信息、空间参照系信息、实体和属性信息、发行信息,以及Metadata参考信息等七个部分进行研究。CEN/TC287认为Metadata是"描述地理数据集内容、表示、空间参考系、质量以及管理的数据",它把数据集分为标识信息、数据集综述信息、数据集质量元素、空间参照系信息、范围信息、数据定义、分类信息、管理信息、Metadata参考以及Metadata语言等十个部分进行研究。ISO/TC211对于Metadata的概念认识与FGDC相同,但在内容划分是仍有明显的差异,它把Metadata分为标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、应用要素分类信息、发行信息,以及Metadata参考信息等八个部分进行研究。虽然以上各组织在内容划分上有一定差异,但其内容体系总体上都反映元数据有下列特点:a) Metadata是用于描述信息资源的高度结构化数据;b) Metadata可以组织和管理信息,并可以挖掘信息资源,通过它可以在Intranet或Internet上准确地查询所需要的信息;c)在从不同资料或组织获取Metadata时,还可以通过对相同的Metadata元素进行比较和对比,获取最新的资料。因此,可以按照把Metadata分为两个层次进行研究,其中第一个层次是目录层,它所提供的Metadata复合元素和数据元素是"数字贵州"中查询地理数据的目录信息,并相对地概括了第二层中的一些必选项信息,是Metadata体系内容中比较宏观的信息;第二层是Metadata标准的主体,它由8个标准部分和4个引用部分组成。其中标准部分包括标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、实体和属性信息、发行信息、以及Metadata参考信息等8个方面的内容;引用部分包括引用信息、时间范围、联系信息以及地址信息,各个部分按照具体的复合元素和数据元素组织。
(二)系统安全标准:在Internet-Web上运行的"数字贵州"技术系统网络的地学空间数据实现共享过程中,可能会出现安全问题,如:故意对数据或程序的破坏、计算机病毒、逻辑炸弹、错误指向、程序错误、黑客、辐射、硬件故障搭线窃听、严重的误操作、数据泄漏、盗用、伪造、假冒、诈骗或火灾等破坏。因此,建立"数字贵州"技术系统的安全体系非常重要。关于系统安全标准请详见5.5节"信息安全防护技术"。
5.3 数据集成与数据共享
在信息社会中,每时每刻都有大量来源不同的地理数据产生,分布地存贮。在网络环境下,信息要在不同软件中分布地处理,并且能够在网络中实时发布。因此,如何使不同的地理信息系统软件、用户能迅速便捷地获取这些来源不同的数据,并将它们集成起来进行分析,如何使这些集成数据能在不同的系统下相互可操作以及在异构分布数据中获取所需的数据信息,即实现数据集成与与数据共享就变得非常关键。
解决数据集成与共享一方面需要国家出台相应的数据管理政策,另一方面需要加强软件系统之间数据集成与共享的技术研究,即多格式数据共享问题。目前实现多格式数据共享的方式大致有三种,即:数据格式转换模式、数据互操作模式和直接数据访问模式。
(一)数据格式转换模式
格式转换模式就是把其他格式的数据经过专门的数据转换程序进行转换,变成本系统的数据格式,这是当前GIS软件系统共享数据的主要办法。数据转换的核心是数据格式的转换。基于数据通用交换标准的数据交换,尽管在格式转换过程中增加了语义控制,但其核心仍是数据格式转换,一般地,数据格式转换采用以下三种方式:
(1)直接转换-相关表。在两个系统之间通过关联表,直接将输入数据转换成输出数据。这种方法是记录之间的转换,只对小的转换量才有意义;而且由于它是针对记录逐个地进行转换,只对小的转换量才有意义;而且由于它是针对记录逐个进行转换,没有存贮功能,因此不能保证转换过程中语义的正确性。
(2)直接转换-转换器。另一个转换方法是通过转换器实现,转换器是一个内部数据模型,转换器通过对输入数据的类型及值按照转换规则进行转换,得到指定的数据模型及值,与使用关联表相比,它具有更详细的语义转换功能,也具有一定的存贮功能。
(3)基于空间数据转换标准的转换。无论采用关联表还是采用转换器进行直接转换,它仅仅是两系统之间达成的协议,即两个系统之间都必须有一个转换模型,而且为了使另一个系统和该系统能够进行直接转换,必须公开各自的数据结构及数据格式。为此,可采用一种空间数据的转换标准来实现地理信息系统数据的转换,转换标准是一个大家都遵守、并且很全面的一系列规则。转换标准可以将不同系统中的数据转换成统一的标准格式,以共其他系统调用。为了实现转换,窨数据的转换标准必须能够表示现实世界空间实体的一系列属性和关系,同时它必须提供转换机制,以保证对这些属性和关系的描述结构不会改变,并能被接收者正确地调用,同时它还应具有以下功能特点:具有处理矢量、栅格、网格、属性数据及其他辅助数据的能力;实现的方法必须独立于系统,且可以扩展,以便在需要时能包括新的空间信息。
许多GIS软件为了实现与其他软件交换数据,制订了明码的交换格式,如ArcInfo的E00格式、ArcView的Shape格式、MapInfo的Mif格式等。通过交换格式可以实现不同软件之间的数据转换。
数据转换模式的弊病是显而易见的,由于缺乏对空间对象统一的描述方法,从而使得不同数据格式描述空间对象时采用的数据模型不同,因而转换后不能完全准确地表达原数据的信息,经常性地造成一些信息丢失。
美国国家空间数据协会(NSDI)制定了统一的空间数据格式规范SDTS(Spatial Data Transformation Standard),包括几何坐标、投影、拓扑关系、属性数据、数据字典,也包括栅格格式和矢量格式等不同的空间数据格式的转换标准。许多软件利用SDTS提供了标准的空间数据交换格式。目前,ESRI在ARC/INFO中提供了SDTSIMPORT以及SDTSEXPORT模块,Intergraph公司在MGE产品系列中也支持SDTS矢量格式。SDTS在一定程度上解决了不同数据格式之间缺乏统一的空间对象描述基础的问题。但SDTS目前还很不完善,还不能完全概括空间对象的不同描述方法,还不能统一为各个层次以及从不同应用领域为空间数据转换提供统一的标准,也还没有为数据的集中和分布式处理提供解决方案,所有的数据仍需要经过格式转换才能进到系统中,不能自动同步更新。
(二)数据互操作模式
伴随着客户机/服务器体系结构在地理信息系统领域的广泛应用以及网络技术的发展,数据交换方法已不能满足技术发展和应用的需求,而数据(GIS)的互操作则成为数据共享的新途径。
数据互操作模式是OpenGIS Consortium (OGC) 制定的规范。OGC是为了发展开放式地理数据系统、研究地学空间信息标准化以及处理方法的一个非盈利性组织。GIS互操作是指在异构数据库和分布计算的情况下,GIS用户在相互理解的基础上,能透明地获取所需的信息。OGC为数据互操作制定了统一的规范,从而使得一个系统同时支持不同的空间数据格式成为可能。根据OGC颁布的规范,可以把提供数据源的软件称为数据服务器(Data Servers),把使用数据的软件称为数据客户(Data Clients),数据客户使用某种数据的过程就是发出数据请求,由数据服务器提供服务的过程,其最终目的是使数据客户能够读取任意数据服务器提供的空间数据。OGC规范基于OMG的CORBA、Microsoft的OLE/COM以及SQL等,为实现不同平台间服务器和客户端之间数据请求和服务提供了统一的协议。OGC规范正得到OMG和ISO的承认,从而逐渐成为一种国际标准,将被越来越多的GIS软件以及研究者所接受和采纳。目前,还没有商业化GIS软件完全支持这一规范。
数据互操作为多源数据集成提供了崭新的思路和规范,它将GIS带入了开放的时代,从而为空间数据集中式管理、分布式存储与共享提供了操作的依据。OGC标准将计算机软件领域的非空间数据处理标准成功地应用到空间数据上,但是它更多地采用了OpenGIS协议的空间数据服务软件和空间数据客户软件,对于那些已经存在的大量非OpenGIS标准的空间数据格式的处理办法还缺乏标准的规范。从目前来看,非OpenGIS标准的空间数据格式仍然占据已有数据的主体,而且非OpenGIS标准的GIS软件仍在产生大量非OpenGIS标准的空间数据,如何继续使用这些GIS软件和共享这些空间数据成为OpenGIS标准不可解决的问题。
数据互操作规范为多源数据集成带来了新的模式,但这一模式在应用中存在一定局限性:首先,为真正实现各种格式数据之间的互操作,需要每种格式的宿主软件都按照着统一的规范实现数据访问接口,在一定时期内还不现实;其次,一个软件访问其他软件的数据格式时是通过数据服务器实现的,这个数据服务器实际上就是被访问数据格式的宿主软件,也就是说,用户必须同时拥有这两个GIS软件,并且同时运行,才能完成数据互操作过程。最后,即使以后新建的GIS软件都支持OpenGIS,现有的GIS软件生产出来的空间数据也要转化到OpenGIS标准。
(三)直接数据访问模式
直接数据访问是指在一个GIS软件中实现对其他软件数据格式的直接访问,用户可以使用单个GIS软件存取多种数据格式。直接数据访问不仅避免了繁琐的数据转换,而且在一个GIS软件中访问某种软件的数据格式不要求用户拥有该数据格式的宿主软件,更不需要该软件运行。直接数据访问提供了一种更为经济实用的多源数据共享模式。
直接数据访问同样要建立在对要访问的数据格式的充分了解的基础上,如果要访问的数据的格式不公开,就非破译该格式不可,还要保证破译完全正确,这样才能真正与该格式的宿主软件实现数据共享。如果宿主软件数据格式发生变化,各数据集成软件不得不重新研究该宿主软件数据格式,提供升级版本,而宿主软件的数据格式发生变化时往往不对外声明,这样,其他数据集成软件对基于这种GIS软件数据格式的数据的处理必定存在滞后性。
此外,许多软件开发商正在着手研究解决数据共享的新模式。有些厂商认为,由于一般的GIS数据具有一些的空间数据的通性,因此可以定义一个包含各种属性的元数据文件,在此基础上,采用面向对象的思路,利用C++语言对继承、封装、多态性和抽象基类的支持,定义一个包含纯虚函数、不可实例化的抽象基类,这个基类应具备GIS空间数据读写的基本接口。各GIS软件提供一个从这个抽象基类派生的类来实例化抽象基类,在这个派生类中完成其定义的数据格式文件中数据的读写工作。在新的模式中,不管GIS空间数据是以文件方式存储还是以数据库方式存储,都将空间数据以数据库的方式管理;在定义好面向抽象GIS数据格式的抽象基类和统一接口的基础上,由各GIS软件厂商完成存取自己格式数据的子类的动态连接库(类似于ODBC中各数据库系统的驱动程序)。实现厂商一次编程,其他开发者拿来就用,省却大量的重复劳动,加快开发进程。
5.4 国家基础空间数据仓库群组建技术
分布在不同地点、不同部门的分布式数据库与信息系统,由高速计算机有线(光缆)与无线(通信卫星)相连接,并组成WebGIS,Object Web GIS 和ComGIS实现同构系统的远程互操作和互运算;能过OpenGIS的标准与规范,实现异构系统间的远程互操作和互运算。但对于"数字贵州"的海量数据和频繁交互过程来说,它还需要通过中间组织的帮助来实现,包括:空间数据仓库(Spatial data ware house)、空间数据站(Spatial data station)、空间数据交换中心(Spatial data clearing house)。
(一)空间数据仓库的概念和特点
空间数据仓库是指支持管理、决策过程的,面向主题的、集成的随时间而变化的、持久的和具有空间坐标的地球数据的集合。它将根据一定的主题内容集成来自不同数据中的数据,数据在结构上具有综合性;它可以截取从瞬态到区段,直到全体等不同时间尺度上的信息,可以从多个专业应用系统中寻找答案。空间数据仓库将数据的时间属性及空间属性紧密地结合起来,通过构建面向分析的多值空间数据模型,利用多维分析方法,从多个不同的角度进行分析比较,提取隐藏在数据中的信息,实现面向数据和面向模型的分析方法的统一,数据仓库是指随时间不断更新的数据库。
空间数据仓库是数据仓库的一种特殊形式。数据仓库是90年代发展起来的一种数据存贮、管理和技术。著名的数据仓库专家W.H.Inmon在其著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
根据数据仓库概念的含义,数据仓库拥有以下四个特点:
1、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。作为决策支持系统(Decision-making Support System,简称DSS),数据仓库系统包括:① 数据仓库技术;② 联机分析处理技术(On-Line Analytical Processing,简称OLAP);③ 数据挖掘技术(Data Mining,简称DM)。
(二)空间数据仓库的主要功能
空间数据仓库的主要任务是将来源于分散在不同地点、不同单位的分布式数据库中的类型不同、结构不同、存贮格式不同、内容与格式丰富多彩的的原始数据,进行标准化、过滤与匹配、净化,标明时间戳和确认数据质量的处理,即求精过程,然后再根据任务的需要,将来源于分布式数据库的不同性质、不同格式的数据再进行集成与分割、概括与聚集、预测与推导、翻译与格式化、转换与再映象处理,最后进行数据仓库的建模、概括、聚集、调整与建立结构化查询等功能。
(三)空间数据仓库的数据组织及体系结构
1.空间数据仓库的数据组织结构:
数据仓库中的数据分为四个级别:早期细节级、当前细节级、轻度综合级、高度综合级。源数据经过综合后,首先进入当前细节级,并根据具体需要进行进一步的综合,从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级由此可见,数据仓库中存在着不同的综合级别,一般称之为"粒度"。粒度越大,表示细节程度越低,综合程度越高。
数据仓库中还有一种重要的数据--元数据(metadata)。在数据仓库环境下,主要有两种元数据:第一种是为了从操作性环境向数据仓库转化而建立的元数据,包含了所有源数据项名、属性及其在数据仓库中的转化;第二种元数据在数据仓库中是用来和终端用户的多维商业模型/前端工具之间建立映射,此种元数据称之为DSS元数据,常用来开发更先进的决策支持工具。
图5.3 空间数据仓库的数据组织结构
2.空间数据仓库的数据组织形式
空间数据仓库中常见的数据组织形式为:
简单堆积文件: 它将每日由数据库中提取并加工的数据逐天积累并存储起来。
轮转综合文件: 数据存储单位被分为日、周、月、年等几个级别。在一个星期的七天中,数据被逐一记录在每日数据集中;然后,七天的数据被综合并记录在周数据集中;接下去的一个星期,日数据集被重新使用,以记录新数据。同理,周数据集达到五个后,数据再一次被综合并记入月数据集。以此类推。轮转综合结构十分简捷,数据量较简单堆积结构大大减少。当然,它是以损失数据细节为代价的,越久远的数据,细节损失越多。
简化直接文件: 它类似于简单堆积文件,但它是间隔一定时间的数据库快照,比如每隔一星期或一个月作一次。
连续文件: 通过两个连续的简化直接文件,可以生成另一种连续文件,它是通过比较两个简单直接文件的不同而生成的。当然,连续文件同新的简单直接文件也可生成新的连续文件。
对于各种文件结构的最终实现,在关系数据库中仍然要依靠"表"这种最基本的结构。
3.空间数据仓库的数据追加
如何定期向数据仓库追加数据也是一个十分重要的技术。我们知道,数据仓库的数据是 来自OLTP的数据库中,问题是我们如何知道究竟哪些数据是在上一次追加过程之后新生成 的。常用的技术和方法有:
·时标方法: 如果数据含有时标,对新插入或更新的数据记录,在记录中加更新时的时标,那么只需根据时标判断即可。但并非所有的数据库中的数据都含有时标。
·DELTA文件: 它是由应用生成的,记录了应用所改变的所有内容。利用DELTA文件效率 很高,它避免了扫描整个数据库,但同样的问题是生成DELTA文件的应用并不普遍。此外,还有更改应用代码的方法,使得应用在生成新数据时可以自动将其记录下来。但应用成千上万,且修改代码十分繁琐,这种方法很难实现。
·前后映象文件的方法: 在抽取数据前后对数据库各作一次快照,然后比较两幅快照的不同从而确定新数据。它占用大量资源,对性能影响极大,因此并无多大实际意义。
·日志文件: 最可取的技术大概是利用日志文件了,因为它是DB的固有机制,不会影响O LTP的性能。同时,它还具有DELTA文件的优越性质,提取数据只要局限日志文件即可,不用扫描整个数据库。当然,原来日志文件的格式是依据DB系统的要求而确定的,它包含的数据对于数据仓库而言可能有许多冗余。比如,对一个记录的多次更新,日志文件将全部变化过程都记录下来;而对于数据仓库,只需要最终结果。但比较而言,日志文件仍然是最可行的一种选择。
4.空间数据仓库的体系结构:
整个数据仓库系统是一个包含四个层次的体系结构,包括:
数据源:是数据仓库系统的基础,是整个系统的数据源泉。包括贵州省内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各
声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com