Sunway-科技报告数据库

Sunway-科技报告数据库

(sunway-STR)

Sunway科技报告数据库

科技报告很大程度上展示了一个国家或一个机构的科学研究和技术开发水平,也是了解他们科技创新情况的重要渠道。为适应广大用户对国外科技报告的需要,尚唯公司推出了《sunway-科技报告数据库》。本材料对科技报告数据库产品及服务做简要介绍。

一、关于科技报告

科技报告是一种完整而真实反映科研机构或人员所从事科研活动的技术内

容和经验的特种文献,在当前知识信息传播和利用中起着越来越重要的作用,因此世界各国在科技文献收集和应用中都将它列于首位。

科技报告的内容是关于某科研项目或活动的正式报告或记录,大多是研究设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和发展项目的成果进展情况的报告,通常还包括撰写人对研究的建议和结论。由于科技报告在内容上一般具有一定的保密性,往往以内部资料的形式出现,或在一定时期后公开发表。作为一种科技文献类型,科技报告有其自身的特点:

1、不拘形式,每份报告无论篇幅大小均独立成册,编有序号,即报告号,常以研究的执行机构(Performing organization) 或主管部门(Sponsor)的缩写字母加上顺序号组成;

2、科技报告在发布之前通常不会像其它文献那样必须要通过独立的复杂的审核过程,也不会像正式出版物那样要等待漫长的出版周期, 时效性强,发表及时,报道速度块;

3、研究内容往往涉及尖端项目和前沿课题,内容新颖,多为最新研究成果,有较强的前瞻性,许多最新的科研成果和探索往往最先出现在科技报告中;

4、内容详实专深,既反映成功经验,又有技术失败教训,往往

附有详尽的数据、图表和事实资料;

5、发行范围受到控制,大部分属于保密文献,只有小部分在一定范围公开或半公开发行,绝大部分要在相当长的一段时期之后才被解密公开。

各个国家都有自己的科技报告,除了政府部门收集出版的政府报告,一些大型研究机构和高等院校也都有自己的科技报告,其中数量最大、品种最多的是美国政府部门出版的政府报告,其收集、整理、加工和报道工作做得很规范,是广大科技工作者经常使用的科技文献。这些报告涉及学科范围有:数学、物理、化学、天文、地理、农业、医药、工程、航空航天、军工、能源、交通运输、环保、及社会科学等许多领域,系统全面记录了数十年来美国科技发展的成就与经验,是美国科技信息中的一个重要组成部分。美国政府报告主要有四大报告:行政系统的PB报告、军事系统的AD报告、航空与宇航系统的NASA报告、原子能和能源管理系统的DOE报告。

二、Sunway-科技报告数据库介绍

Sunway-科技报告数据库是本公司特种文献整合服务平台的一个子系统。该库是一个题录文摘数据库,通过订购和馆际交流获得报告全文。

1、收录范围

本库主要收录国外政府部门出版的技术报告,也收录研究机构和大学的科技报告,主要包括:

DOE 报告: 是由美国能源部 ( Department of Energy) 所属科研机构及其合同单位所产生的科研报告 ,报告的内容包括物 理 、化学 、材料 、生物 、环境 、能源等领域 。这些报告涉及的项目一般都是由政府部门主持的重大或尖端的课 题 , 因此内容十分新颖 。

DTIC报告:由美国国防技术信息中心(Defense Technical Information Center)收集整理和出版。报告以国防部各个合同户的研究报告为主,内容涉及与国防科技有关的各个方面,资料主要来源于美国国防部所属的陆海空三军的科研单位、公司、大

专院校和外国研究机构及国际组织等。其内容不仅包括军事方面,也广泛涉及许多技术领域,如生物医学、环境污染和控制、行为科学、社会科学、航空航天、地球、物理、材料工程技术等。

NASA报告:美国国家航空和宇航局(National Aeronautics & Space

Administration)出版的报告,主要来源于美国国家宇航局所属的各研究中心、试验室、合同公司企业以及大学研究所,包括一些国外研究机构。报告内容侧重于航空和空间技术领域,同时也广泛涉及许多基础学科和技术学科,如物理、化学、机械仪表、电子、材料等。

PB报告:由美国商务部出版局(Office of Publication Board ,简称PB)出版的报告。资料主要来源于美国国内各研究机构的技术报告,内容逐步侧重于工农业生产和民用工程方面。

其他报告:本数据库也收录了其他政府机构、社会团体、研究机构、大学的科技报告和经济方面的研究报告,例如 惠普实验室技术报告(HP Labs technical

Reports)、斯坦福大学的技术报告(Stanford Computer Seience Technical Reports)、IBM 研究报告(IBM Research Reports)、世界银行组织的报告(Documents & Reports of the WorldBank Group)、华盛顿大学经济系提供的经济学科的报告等。

2、数据库特点

(1)收录总量:本库包括题录文摘库和全文两部分,目前题录文摘数据收录量已超过200万个记录,通过订购和馆际交流获得的报告全文数量已超过70万篇。

(2)收录年限:19xx年至今。

(3)数据增量:每年新增约5万个科技报告。

(4)数据更新:中心网站及时更新,镜像站点半年更新一次。

(5)全文质量:PDF文档。

(6)数据容量:题录检索系统约占 200 个 G,全文约占 1T。 (7)检索方式:快速检索、高级检索、分类导航、二次检索等。 (8)分类体系:包括 30 个类目:工程学 航空学 军事科学 地球科学和海 洋学 空间科学和空 间技术 物理学 天文学和天体 物理学 核科学和技术 宇航学 生命科学 农业 推进、发动机 和燃料 能源储存、转 换和利用 可再生能源 测试设备、研 导弹技术 究设施和复 印技术 通信 航空技术 环境科学 电力生产输送和 能量转换 数学和计算机科 学 电子技术和应用 流体学 化学 矿物燃料 生物与医药 科学 社会和信息 科学 导航、 探测和 对抗 材料科学大气科学军械3、产品展示 首页检索结果列表页面

题录数据页面

Sunway科技报告数据库

4、检索说明

简单检索:用户在相应检索框中输入一个检索词(如关键词、报告号等)进行检索。

高级检索:在相应检索框中用布尔算符“and、or、not”(与、或、非)将检索项连接起来进行逻辑组配检索;利用逻辑运算符可扩大或缩小检索范围 , 有利于提高检全或检准率 ; “and”缩小检索范围 ,and 两边的检索词必须同时在 选定字段中出现才能命中 ,例如 , 要检索同时含有“传感器”和 “自动控制”的 记 录 , 应 输 入 : sensor AND automatic control;“or”扩大检索范围,or 两边的检索词在选定字段中出现一个即可命中 ;“not”缩小检索范围 ,包含 not 前面的检索词但不包含not 后面的检索词 , 如 “air pollution”NOT ozone 。

词组检索:检索词可采用一个词组,如 high performance computing , 系统除

了检索出包含有该短 语的记录还会检索出同时包含 high 、performance 、

computing 的记录 , 如果只想检索出包含有该词组的记录则应将该词组加引号 ,如“high performance computing”。

截词检索:本系统采用后截断,前方一致的截词检索,即在检索框中至少键入一个词的前3个字符和一个截词符“※”来完成一个词和它的同词根的检索,如键入comput※则可检出包含computer, computers,computing 的结果。

通配符检索:这种检索实际上是中间截词检索,当用户不能确定英文检索词拼写是否正确时,或当某些拼写可替换时,或当仅知道某词的一部分时,可使用通配符“ ?”,检索出具有相同前缀的词 。例如键入colo?r,可检出包括color、colour、colonizer、colorimeter的记录。

5、检索步骤

本系统的查询检索步骤如下:

(1)登录《特种文献整合服务平台》主页面,用户按事先规定的方式(帐号方式或IP方式)进入“科技报告数据库”。

(2)在检索框左边的下拉菜单中选择检索字段,如题名、文摘、作者、报告号、关键词、出版时间等。

(3)在检索框内输入英文检索词,按下搜索按钮,系统执行检索并产生一个命中记录集合,以页的格式将记录显示出来;所显示的记录按年代排序,由近及远。

(4)想要了解某命中记录的详细情况,点击该记录标题,便显示包括文摘在内的全记录。

(5)导航浏览: 进入科技报告页面,然后在中文主题分类导航系统中选择想要浏览的学科(一级分类)或专业(二级分类),点击主题词即显示该学科或专业的文献题录,可浏览英文题名,也可看题名的中文翻译;如要详细了解其中某篇报告,可点

击该报告题目,则显示其全记录,包括题名、报告号、文摘、机构、作者、出版日期、关键词等字段。

(6)全文获取:在检记录的每个标题后面有一个标识,对PDF标识,点击后在线显示全文并可打印,对E-mail标识,点击后显示全文获取框,在相应框内键入报告号、题目及E-mail邮箱,发送后,报告全文将在3-5日内返回。

三、Sunway-科技报告数据库订购使用模式

1、镜像站方式

将《sunway-科技报告数据库》(题录文摘版)安装到用户本地,由尚唯公司负责维护和更新,用户在本地进行查询检索,通过互联网远程在线获取科技报告的全文文献。用户可按专辑定制。

2、网络访问方式

通过互联网远程访问《sunway-科技报告数据库》的中心网站,采用账号或者限定IP的方式进行绑定,在线进行查询检索与获取全文。

3、全文委托加工(数据定制)

全文委托加工是用户单位根据重点学科、专业、热门研究课题等要求,从sunway-STR中抽取相应科技报告数据建成专题科技报告服务系统,包含题录数据和全文数据,并安装在用户单位内部网上使用的方式。数据完全根据用户要求进行定制,能针对性地满足需求,需要的数据才购买,不需要的数据就不购买。

 

第二篇:数据库新技术

数据库新技术综述

摘要:综述数据库新技术,指出数据库技术目前的研究状态和发展趋势,介绍一些数据库新技术的最新动态,并指出数据库应用所面临的挑战,指出数据库技术当今的研究热点和未来的发展趋势。

关键词:数据库;面向对象数据库;分布式数据库;数据仓库;数据挖掘;联机分析处理;发展

一、引言:

自从计算机问世以来,就有了处理数据、管理数据的需求,由此,计算机技术新的研究分支——数据库技术应运而生。随着计算机应用领域的不断扩展和多媒体技术的发展,数据库已经是计算机科学技术中发展最快、应用最广泛的重要分支之一。目前,数据库技术已经相当成熟,被广泛应用于各行各业中,成为现代信息技术的主要组成部分,是现代计算机信息系统和计算机应用的基础和核心。 另外,各种学科与数据库技术的有机结合,从而使数据库领域中新内容、新应用、新技术层出不穷,形成了各种各样的数据库系统:面向对象数据库系统、分布式数据库系统、知识数据库系统、模糊数据库系统、并行数据库系统、多媒体数据库系统等;数据库系统被应用到特定的领域后,又出现了工程数据库、演绎数据库、时态数据库、统计数据库、空间数据库、科学数据库、文献数据库等;他们继承了传统数据库的成果和技术,加以发展优化,从而形成的新的数据库,视为“进化”的数据库。可以说新一代数据库技术的研究与发展呈现了百花齐放的局面。

首先我们来了解一下数据库新技术有哪些:面向对象数据库;分布式数据库;数据仓库;数据挖掘;联机分析处理等。

二、概述新技术

(一).面向对象数据库技术

面向对象是一种认识方法学,也是一种新的程序设计方法学。把面向对象的方法和数据库技术结合起来可以使数据库系统的分析、设计最大程度地与人们对客观世界的认识相一致。面向对象数据库系统是为了满足新的数据库应用需要而产生的新一代数据库系统。

其优点为:

(1).易维护:可读性高且方便低成本;

(2).质量高:在设计时,可重用现有的,在以前的项目的领域中已被测试过的类使系统满足业务需求并具有较高的质量;

(3).效率高:在软件开发时,根据设计的需要对现实世界的事物进行抽象,产生类。使用这样的方法解决问题,接近于日常生活和自然的思考方式,势必提高软件开发的效率和质量。

(4).易扩展:由于继承、封装、多态的特性,自然设计出高内聚、低耦合的系统结构,使得系统更灵活、更容易扩展,而且成本较低。

面向对象数据库研究的另一个进展是在现有关系数据库中加入许多纯面向对象数据库的功能。在商业应用中对关系模型的面向对象扩展着重于性能优化,处理各种环境的对象的物理表示的优化和增加SQL模型以赋予面向对象特征。如Versant、UNISQL、O2等, 它们均具有关系数据库的基本功能,采用类似于SQL的语言,用户很容易掌握。

(二).分布式数据库技术

分布式数据库是指:数据物理上被存放在网络的多个节点上,逻辑上是一个整体。其拥有3种模式:存储模式、逻辑模式、用户模式。

典型特点:

1. 三性

自主性:单个DBMS的本地运算不因多数据库系统中其他DBMS的加入而受影响;单个DBMS处理查询和优化查询的方式不受访问多数据库的全局查询执行的影响;系统已执行的操作在单个DBMS加入或者离开多数据库联盟是不会受到伤害。

异质性:硬件的异质性;网络协议的差异性;数据管理器的多样性。 分布性:数据分布、控制分布、管理分布。

2. 特点

1. 在分布式数据库系统里不强调集中控制概念,它具有一个以全局数据库管理员为基础的分层控制结构,但是每个局部数据库管理员都具有高度的自主权。

2. 在分布式数据库系统中数据独立性概念也同样重要,然而增加了一个新的概念,就是分布式透明性。所谓分布式透明性就是在编写程序时好象数据没有被分布一样,因此把数据进行转移不会影响程序的正确性。但程序的执行速度会有所降低。

3. 集中式数据库系统不同,数据冗余在分布式系统中被看作是所需要的特性,其原因在于:首先,如果在需要的节点复制数据,则可以提高局部的应用性。其次,当某节点发生故障时,可以操作其它节点上的复制数据,因此这可以增加系统的有效性。当然,在分布式系统中对最佳冗余度的评价是很复杂的。

3. 迅速发展的原因

(1). 它可以解决组织机构分散而数据需要相互联系的问题。比如银行系统,

总行与各分行处于不同的城市或城市中的各个地区,在业务上它们需要处理各自的数据,也需要彼此之间的交换和处理,这就需要分布式的系统。

(2). 如果一个组织机构需要增加新的相对自主的组织单位来扩充机构,则

分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。

(3). 均衡负载的需要。数据的分解采用使局部应用达到最大,这使得各处

理机之间的相互干扰降到最低。负载在各处理机之间分担,可以避免临界瓶颈。

(4). 当现有机构中已存在几个数据库系统,而且实现全局应用的必要性增

加时,就可以由这些数据库自下而上构成分布式数据库系统。

(5). 相等规模的分布式数据库系统在出现故障的几率上不会比集中式数据

库系统低,但由于其故障的影响仅限于局部数据应用,因此就整个系统来讲它的可靠性是比较高的。

(三).数据仓库

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓

库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支持的目的而创建。 为企业提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。

1. 定义:

数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。

2. 特点:

(1).效率足够高

数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。

(2).数据质量

数据仓库所提供的各种信息,肯定要准确的数据,但由于数据仓库流程通

常分为多个步骤,包括数据清洗,装载,查询,展现等等,复杂的架构会更多层次,那么由于数据源有脏数据或者代码不严谨,都可以导致数据失真,客户看到错误的信息就可能导致分析出错误的决策,造成损失,而不是效益。

(3).扩展性

之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就能很稳定运行。

3. 从数据库到数据仓库

企业的数据处理大致分为两类:一类是操作型处理,也称为联机事务处理,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。另一类是分析型处理,一般针对某些主题的历史数据进行分析,支持管理决策。

数据库已经在信息技术领域有了广泛的应用,我们社会生活的各个部门,几乎都有各种各样的数据库保存着与我们的生活息息相关的各种数据。作为数据库的一个分支,数据仓库概念的提出,相对于数据库从时间上就近得多。美国著名信息工程专家WilliamInmON博士在90年代初提出了数据仓库概念的一个表述,认为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于对管理决策过程的支持。”

(四).数据挖掘

数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并 通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 数据挖掘流程图:

1. 数据挖掘与数据仓库的关系

若将Data Warehousing(数据仓库)比喻作矿坑,Data Mining就是深入矿坑采 矿的工作。毕竟Data Mining不是一种无中生有的魔术,也不是点石成金的炼金术,若没有够丰富完整的数据,是很难期待Data Mining能挖掘出什么有意义的信息的。

2. 数据挖掘的主要功能

Data Mining实际应用功能可分为三大类六分项来说明:Classification和Clustering属于分类区隔类;Regression和Time-series属于推算预测类;Association和Sequence则属于序列规则类。

3. 数据挖掘的过程

数据开采以数据库中的数据为数据源,整个过程可分为数据集成、数据选择、预处理、数据开采、结果表达和解析等过程。开采的范围可针对多媒体数据库、数据仓库、Web数据库、主动型数据库、时间型及概率型数据库等。采用的技术有人工神经网络、决策树、遗传算法、规则归纳、分类、聚类、减维、模式识别、不确定性处理等。发现的知识有广义型知识、特征型知识、差异型知识、关联型知识、预测型知识、偏离型知识。目前数据采掘的研究和应用所面临的主要挑战是:对大型数据库的数据采掘方法;对非结构和无结构数据库中的数据采掘操作;用户参与的交互采掘;对采掘得到的知识的证实技术;知识的解释和表达机制;由于数据库的更新,原有知识的修正;采掘所得知识库的建立、使用和维护。

(五). 联机分析处理

联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员 的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对 象的需求,制定正确的方案。

1. 联机分析处理的作用

联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。

2. 主要特点

直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型,在这里,维指的是用户的分析角度。例如对销售数据的分析,时间周期是一个维度,产品类别、 分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进 行多角度综合分析,具有极大的分析灵活性。这也是联机分析处理被广泛关注的根本原因,它从设计理念和真正实现上都与旧有的管理信息系统有着本质的区别。

3. 体系结构

数据仓库与OLAP的关系是互补的,现代OLAP系统一般以数据仓库作为

基础,即从数据仓库中抽取详细数据的一个子集并经过必要的聚集存储到OLAP存储器中供前端分析工具读取。

三、结束语:

数据库系统的功能从早期的数据存储、查询到联机事务处理,再到数据挖掘,从单纯的数据库发展到与之相关的模型库、知识库的集成,其所取得成就是令人瞩目的。当然,所有这些都还有许多局限性,还有许多关键问题等待解决,而且,随着应用领域日益广泛,硬件技术的不断提高,数据库技术还要面临新的挑战。当前数据库技术的发展呈现出与多种学科知识相结合的趋势,凡是有数据(广义的)产生的领域就可能需要数据库技术的支持,它们相结合后即刻就会出现一种新的数据库成员而壮大数据库家族。

对于广大的数据库用户来讲,主要有两个方面的要求:一个是希望得到自己所需要的数据或者信息;另一个是能够方便地接受和使用这些数据或信息。

前一类要求应通过工程的软、硬件环境支持和数据库设计来实现;后一类要求则应为用户提供良好的用户界面和完善的应用支持来达到。新一代的数据库技术应能完成新应用的要求。这些新的课题有待于数据库研究者及所有计算机工作者的努力。

相关推荐