天津市科技计划项目申请书

说  明

1、此样式文件用于辅助申报单位填写项目申请书,项目申报以系统生成的申请书为准。

2、此申请书样式文件中的内容少于正式申请书填写内容。

3、申请书样式文件中的“重点领域”和“优先方向”请参考《20##-20##年天津市科技支撑计划重点项目征集指南》。

4、正式申请书中有关内容以选项形式提供,需要在申报系统中选择。


计划类别:天津市科技支撑计划                                     项目类别: 重点项目

 

天津市科技计划项目(课题)

申请书

项目名称:

经费总额:               万元,其中,申请市财政资助:           万元

项目负责人:  

主承担单位:

第二承担单位:

第三承担单位:

联系人电话:                                       

通讯地址:  

邮政编码:                                        

局级主管部门:

申请日期:        

天津市科学技术委员会制

二○##年


填写说明

1. 本申请书及其附件是项目评审、评估、论证的唯一依据。项目申请单位和申请人必须实事求是填写本申请书,确保项目信息表与资金预算、实施方案中的内容和数据完全一致,并提供真实而必要的证明材料。一旦发现申报材料中有弄虚作假行为,市科委将取消其立项资格。

2. 本申请书适用于天津市科技计划项目,申请人必须按照“项目征集指南”填写科技计划、项目类别及其重点领域的具体名称。

3. 项目申报材料包括:

(1)《天津市科技支撑计划项目申请书》统一用A4纸打印和复印,左侧装订成册。请不要另行制作封面,不采用胶圈、文件夹等带有突出棱边的装订方式。内容包括:

a. 项目信息表(表中的各栏目不得空缺,无相关内容时填“无”,不得超过规定字数,不得改动表格的格式和内容,数字一律取整数,单位名称要写全称);

b. 项目实施方案;

c. 天津市科技计划项目资金预算书;

d. 附件(发明专利证书、小试成果报告、科技查新报告、样品检测报告以及其它能说明项目技术水平和来源、知识产权归属等的证明材料,承担单位间的合作协议等)。


一、项目信息表





二、项目实施方案

 

1.研究目的、意义和必要性(包括项目提出的背景和必要性,国内外现状和技术发展趋势、市场需求分析,本项目在产业链发展中的地位与作用,说明项目产业化前景以及对相关技术与产品及其产业的带动作用等)

2.研究目标(包括总体目标、可取得的成果和能形成的知识产权情况)

3.主要研究开发内容(必须清晰地叙述研究开发的具体内容及其要点)

4.项目创新点及拟解决的关键技术问题(包括主要技术特点、创新点,需要解决的技术问题等)

5. 研究方法和工艺技术路线(尽可能清楚地叙述研究的具体方法和技术路线,包括技术原理、实验方法、工艺路线、技术性能指标以及可行性分析等)

6.总经费预算、资金筹措方式及来源(包括项目总投资概算、新增资金筹措及来源、资金使用计划等)

7.项目进度安排(包括实施年限、每半年的进度安排等)

8.预期的经济、社会效益分析及成果应用、产业化衔接情况(包括产品成本分析、产品单位售价与盈利预测、项目投资评价、经济效益指标、社会效益或应用效果、成果转化和产业化安排等)

9.研究工作基础及条件(包括现有技术和工作基础、已具备的实施条件、国内外的专利情况、研究队伍和产学研情况、是否取得前期成果,国家和市财政资金前期资助情况及其与本项目之间的关系等)

10.承担单位简介及合作方式(包括承担单位的实力、生产经营状况、财务状况以及合作的具体形式等)

11.项目负责人及主要成员简介(姓名、性别、年龄、学历、学位、技术职称与职务以及与本项目相关的主要工作业绩、获奖、入选国家和市级人才计划情况等)

12.风险分析(包括技术、人员、市场、政策和项目承担单位等方面)

13.其它

(建议使用三号黑体字打印标题、小三号仿宋字打印正文,上下左右边框不低于25mm,行间距适当。)


三、天津市科技计划项目资金预算书

项目名称:

计划及类别:

所属专项或领域:

起止时间:

经费总额:     万元,其中:申请财政资助     万元

主承担单位(公章):

开户银行及账号:

项目负责人:

联系地址:

联系电话:

传真:

电子邮箱:

局级主管部门:

天津市科学技术委员会

二○##年制
《天津市科技计划项目资金预算表》填报说明

1.     封面“项目名称”

应与项目申请书中的名称一致,并写全称。

2.     封面“起止时间”

指项目自申请立项至结题验收的起止时间,按“хххх年хх月--хххх年хх月”的格式填列。

3.     封面“项目负责人”

项目负责人指直接参与研究的项目组负责人员。

4.     封面“主管部门”

主管部门应根据市科委确定的该项目承担单位主管部门填写。此处应加盖主管部门公章。承担单位为民营企业或确无主管部门的,可不填列主管部门,不加盖主管部门公章。

5.     需要填写的预算表

天津市科技计划项目资金预算表共有8张,均需认真填写。其中,除项目资金预算总表外,表1-表6为项目资金预算明细表(表2-2为大型设备购置申请表)。

6.     预算支出科目说明   

(1)人员费,指直接参加科技项目研究开发或科技创新体系建设研究人员支出的工资性费用。列入的人员要与项目合同中确定的参加人员(数)一致。科技项目组成员所在单位有事业费拨款的,由所在单位按照国家规定的标准从事业费中及时足额支付给科技项目组成员,并按规定在科技项目资金预算的相关科目中列示,不得在政府资助的科技项目资金中重复列支。国家另有规定的,按照有关规定执行。

(2)设备费,指科技项目研究开发或科技创新体系建设过程中所必需的专用仪器、设备的购置和维修费用;样品、样机购置费及设备试制费。科技项目资金所购置和试制的单台价值在5万元以上(含5万元)的仪器设备(含样机)需单独列示。单台价值在5万元以上(含5万元)的仪器设备优先通过协作共用的方式解决,如确需购买,由市科委批准。

(3)能源材料费,指科技项目研究开发或科技创新体系建设过程中所支付的原材料、燃料动力、低值易耗品的购置等费用。一次购置但可重复使用(使用寿命在一年以下)且单台价值在1万元以下(不含1万元)的各类仪器设备,在能源材料费项下列支。

(4)试验外协费,指科技项目研究开发或科技创新体系建设过程中发生的试验、加工、测试等费用或带料外加工费用及因委托外单位或合作单位进行的试验、加工、测试等发生的费用。发生试验外协费超过该项科技项目资金预算的20%或单项外协费超过1万元(包括1万元)时,必须与协作单位签订相关的合同书。

(5)租赁费,指科技项目研究开发或科技创新体系建设过程中租赁专用仪器、设备、场地、试验基地等所发生的费用。

(6)信息费,指科技项目研究开发或科技创新体系建设过程中发生的信息检索费、论文版面费、数据调查费和上机费等。

(7)差旅费,指在科技项目研究开发或科技创新体系建设过程中,为科技项目研究开发或科技创新体系建设而进行国内调研考察、现场试验等工作所发生的交通、住宿等费用。出境(含港澳台)差旅费只能通过申请国际科技合作与交流计划项目列支。

(8)会议费,指科技项目研究开发或科技创新体系建设过程中组织召开的与科技项目研究开发或科技创新体系建设有关的专题技术、学术会议的费用。

(9)国际科技合作与交流费,指用于市科委列入科技计划的国际科技合作与交流计划项目的费用。

(10)贷款贴息费,指市科委给予使用银行贷款的计划项目实行贷款贴息的补助资金。

(11)管理费,指科技项目承担单位及受托管理单位为组织管理科技项目而支出的相关费用。包括现有仪器设备和房屋使用费或折旧、直接管理人员费用和其他相关管理支出。科技项目承担单位及受托管理单位所提取的管理费一般不得超过科技项目财政拨款额的5%。

(12)其他费用,指除上述费用之外与科技项目研究开发或科技创新体系建设有关的其他费用。

(13)期初运行费,指科技创新平台建设初期(一般不超过两年)正常启动运行所需的人员费、办公设备费、专利技术引进费等相关一次性费用。此费用仅限于科技创新体系建设项目中列支。

注:项目承担单位除须填报《天津市科技计划项目资金预算表》外,还可根据具体情况对某些预算支出科目补充说明。本预算表需提交书面材料和电子文本。


项目资金预算总表

                                              单位:万元


1  

人员费预算明细表

                                                                                                           单位:万元

注:1.本表(8)、(9)列合计数与预算总表人员费预算数一致。

2.本表(8)列=本表(6)列×本表(7)列。
表2-1                               

设备费预算明细表

单位:万元

注: 1.只填写单价在1万元以上的仪器设备,其中(2)列仅适用于设备购置,设备试制不需填列。

2.本表(5)列、(6)列合计数分别与预算总表中预算数一致。

3.本表(5)列=本表(3)列×本表(4)列。


表2-2                 

大型设备购置申请表

注:1.本表适合于单价在5万元以上(含5万元)的购置设备

  2.每个设备填制一张表,若空间不够,可另附页。


表3                           

能源材料费预算明细表

单位:万元

注:1.本表(5)列=本表(3)列×本表(4)列。

2.本表(5)列、(6)列合计数分别与预算总表中预算数一致。


表4                    

试验外协费预算明细表

                                                                    单位:万元

注:1.本表(4)列=本表(2)列×本表(3)列。

2.本表(4)列、(5)列合计数分别与预算总表中预算数一致。

表5                                

租赁费预算明细表

单位:万元

注:1.本表(2)列、(3)列合计数分别与预算总表中预算数一致。

表6

                            

期初运行费预算明细表

                                                                                                          单位:万元

注:1. 本表仅限于科技创新体系建设项目填写。

    2. 本表(2)、(3)列合计数与预算总表期初运行费预算数一致。


四、附件明细表

(后附“附件明细表”中文件的复印件,包括:发明专利证书、小试成果报告、科技查新报告、样品检测报告以及其它能说明项目技术水平和来源、知识产权归属等情况的证明材料,承担单位间的合作协议等文件的复印件)

 

第二篇:天津市科技发展计划项目申请书

附件3

天津市科技发展计划项目申请书

(科技工程、科技攻关、应用基础研究重点项目和社会发展科技项目适用)

1. 项目简表

2. 项目实施方案(提纲)

3. 天津市国际科技合作资助经费申请表

4. 天津市科技发展计划项目预算表

5. 天津市科技发展计划项目技术开发合同书草本

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

项目申请编号:

天津市科技发展计划项目申请书

(科技工程、科技攻关、应用基础研究重点项目和社会发展科技项目适用)

工程、专项名称: 软件技术及产品专项

项目名称:基于Web挖掘和NLP技术的面向领域的智能检索系统

申请资助经费数额: 25万

项目负责人: 何丕廉

主申报单位:天津大学电子信息与工程学院计算机科学与技术系

局级主管部门: 天津大学

联系电话: 022-27402114 传真: 022-27406538

通讯地址: 天津大学电子信息工程学院计算机科学与技术系

邮政编码: 300072 E-mail:

申请日期: 20xx年8月

天津市科学技术委员会

二○○三年制

天津市科技发展计划项目申请书

填 报 说 明

1. 本申请书及其附件是项目评审、评估、立项的唯一依据。项目申请单位和申请人必须实事求是填写本申请书,并提供真实而必要的证明材料。一旦发现申报材料中有弄虚作假行为,市科委将取消其立项资格。

2. 本申请书适用于科技攻关计划(重点项目和培育项目)、应用基础研究计划(重点项目)和社会发展科技计划项目的申报。申报上述项目时,特别注意在申请书首页选中相应的项目类别。在填写“工程、专项名称:”一栏时注意:

(1)科技工程、科技攻关重点项目,按照“指南”填写工程、专项的具体名称。

(2)应用基础研究重点项目,按照“指南”填写相应的技术领域名称。

(3)科技攻关培育项目、社会发展计划项目可以不填写。

3. 申报社会发展计划项目可以不填写经济效益及经济指标相关内容。

4. 国际科技合作项目不单独受理,必须与上款所述项目一并申请,其申请经费列入相关项目总预算。

5.项目申请者可以从市科委网站下载本申请书(详见市科委网站http://www.)。

6. 项目申报材料包括:

(1)《天津市科技发展计划项目申请书》统一用A4纸打印和复印,左侧装订成册,一式七份,内容包括:

a. 项目简表(项目简表中的各栏目不得空缺,无此内容时填“无”,数字一律取整数,单位名称要写全称);

b. 项目实施方案(提纲);

c. 国际科技合作资助申请表(必要时填报);

d. 天津市科技发展计划项目预算表;

e. 天津市科技发展计划项目技术开发合同书;

f. 附件(发明专利证书、小试鉴定报告、科技查新报告、样品检测报告以及其它能说明项目技术水平和来源、知识产权归属等的证明材料,承担单位间的合作协议等)。

(2)《天津市科技发展计划项目申请材料形式审查表》用A4纸打印,一式一份(此表不要装订,另附。形式审查部分由市科委有关部门填写)。

(3)申报书的软盘(电子文档)一张。其中“项目简表”还需单独存盘。

7.为了充分体现公平、公正、透明的政务公开原则,市科委将对所有立项项目以适当方式对外公告,并接受社会监督。因此,市科委保留对所有申请和资助项目及其成果对外公布和宣传项目名称、承担单位、项目负责人、起止年月、资助经费、执行情况和项目(成果)简介等项目基本信息的权利,而无须事前征得项目单位和个人同意。市科委承诺并要求所有接触到项目材料的单位和个人(包括市科委、项目主管部门和中介机构的工作人员以及项目评审专家等)有保证技术核心秘密不泄露的义务。如不同意此款的单位和个人必须特别声明,市科委将不予受理项目申请。

1. 项 目 简 表

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

2. 项目实施方案(提纲)

1.研究目的、意义和必要性(主要包括项目提出的背景和必要性。国内外现状和技术发展趋势、市场需求分析。本项目在产业链发展中的地位与作用,说明项目产业化前景以及对相关技术与产品及其产业的带动作用等。)

我们正处于“信息爆炸”的时代,因特网是最主要的信息源。然而,因特网信息使用技术的发展往往跟不上因特网信息的增长。搜索引擎可以为人们查找与关键词相关的文档,但返回的结果往往是文档数量太多而命中率不高。如何合理地挖掘和利用Web信息,使因特网的巨大作用和潜能得以发挥,一直是具有挑战性的课题。

现有的Web搜索引擎普遍存在以下两方面的问题[1,2,3]:

首先,绝大部分搜索引擎,如国外的Google (), Yahoo (),国内的天网(/),百度()等都属于通用型的信息检索系统,它们索引的内容覆盖到所有领域。然而,由于Web信息量增长极快,作为开发和维护此类搜索引擎的实体,出于经济和技术等方面的考虑,往往不能也无法做到把Web空间上的所有内容都收录进来,因此出现搜索不完全的现象。在信息选取的策略方面,也会出现某些倾向性。比如,出于商业利益上的考虑,大部分搜索引擎都会优先搜索本国站点,优先搜索商业价值高的.com站点,而对于其他国家的许多站点就相对忽略。此外,由于其服务器存储容量的限制,Google等还规定每个站点最多索引3000个页面[4]。这样,对于某个特定的领域或主题,通用搜索引擎无法保证在信息采集方面做到真正的全面。从另一方面看,通用搜索引擎的海量存储不利于对索引内容的实时更新,存在更新成本高、频率低、周期长等问题,无法保证提供给用户的信息总是最新的,并不可避免地出现大量的“空链接”[5]。

其次就是检索模式单一,检索精度低[6,7]。目前搜索引擎在检索的时候主要还是基于传统的“关键词匹配”,常常会因为关键词存在歧义性影响查询的准确性。再加上Web信息数量庞大,而用户在进行Web信息检索时输入的查询关键词通常比较简单(70%的情况下只输入单个词[8]),导致查询结果集膨胀,用户必须在大量的与自己查询意图相关和不相关的结果集中寻找自己需要的东西。

九十年代之后,国外出现了面向领域(或主题)的Web信息检索系统,例如CiteSeer(http://www.CiteSeer.com),Coral(http://www.)[9,10]。面向领域(或主题)的Web搜索引擎追求的是“小而全,小而精”[11]:由于搜索范围小,可以对该领域的内容进行全面索引;由于信息存储量相对较小,索引数据库的更新速度较快[12];还可以充分结合领域知识的特点,在优化信息抽取、丰富查询模式、提高检索精度等方面做更多的工作。比如,可以建立更加结构化的索引数据库以支持用户多种查询功能,可以分析本领域特定访问群体的查询特点以提供更加专门化、个性化的查询功能。而且,由于用户查询的范围限定在某个特定领域,可以在一定程度上避免查询词的歧义性,从而提高查询的准确度。总之,建立面向领域的高性能信息检索系统,不但在特定领域信息覆盖量、信息更新速度等方面有明显的优势,提高了检索质量,而且可以满足用户的特定查询需求。因此,面向领域(或主题)的Web信息检索系统是今后的重要发展方向。目前国内尚未出现成熟的面向领域的检索系统。

本课题开发面向领域的Web信息检索技术,对于我市实施信息化带动现代化有积极意义。天津市是我国北方的经贸中心,近年一直保持经济快速增长的强劲势头,全市经济发展已经全面驶入了快车道。为了不断迎接新挑战,抢占发展先机,做到与国际接轨,各企事业单位和各级行政部门的工作人员和决策者都需要随时获取确切而全面的相关信息资料。本课题所开发的高性能智能检索系统将为用户提供本领域全面而确切的相关信息,将成为企事业单位工作人员和决策者的得力助手和信息秘书。

当今任何行业的发展都离不开信息的带动和支持。面向领域的检索系统可为相关行业提供准确、全面、及时的信息,有利于掌握市场动向,做出正确决策,优化资源配置,提高行业的经济效益和服务水平。

参考文献:

[1] Andrew McCallum, Kamal Nigam etc, Building Domain-Specific Search Engines with Machine Learning

Techniques, School of Computer Science, Carnegie Mellon University,2002.

[2] Soumen Chkrabariti,Martin van den Berg,Byron Dom, Focused crawling:a new approach to topic-sepcific

Web resource discovery, published by Elsevier Science B.V.,1999.

[3] M.Diligenti, F.Mcoetzee,S.Lawrence,C.L.Giles and M.Gori, Focused Crawling Using Context

Graphs ,2000.

[4] Ph.D. in Computer Science at the University of Washington, Seattle. Areas of interest: Information

Retrieval, User Interfaces, Machine Learning and Knowledge Discovery.M.S. received 1997.

[5] Krellenstein, M., Chief Technology Officer, Northern Light Technology LLC. The added value of

classification intelligence. Talk at the 2001 Search Engines and Beyond Conference, 2001.

[6] Boyan, J., Freitag, D. and Joachims, T. A machine architecture for optimizing Web search engines. In

Proceedings of the AAAI-99 Workshop on Internet based Information Systems, 1999.

[7] Robert Steele, Techniques for Specialized Search Engines,Department of Computer Systems,University of

Technology ,Sydney,2001.

[8] Brin, S. and Page, L. The anatomy of a large-scale hypertextual Web search engine. In Proceedings of the

Seventh International Web Wide World Conference (WWW7), 1998.

[9] http://www.CiteSeer.com.

[10] http://www..

[11] Taher H.Haveliwala,Topic-Sentsitive PageRank, Computer Science Department,Standford

University,2002.

[12] Guha, S., Rastogi, R. and Shim, K. CURE: An efficient clustering algorithm for large databases. In Proceedings of the ACM-SIGMOD 1998 International Conference on Management of Data (SIGMOD’98), 73-84, 1998.

2.基础条件(主要包括项目前期工作、现有技术基础和工作基础、国内外的专利情况、研究队伍和产学研情况该项目产业链条中的位置和作用等)

课题组在相关领域具有很强的学术背景。自20世纪90年代以来,一直从事人工智能、自然语言处理和信息检索方面的研究,已开发出拥有自主版权的信息检索辅助系统,包括中文分词工具、分词性能评价工具、中文文本分类工具、简易词性标注工具及词共现模型研究工具等,并发表几十篇相关论文。

本课题组与亚洲微软研究院合作建立了计算语言学研究室。多次派遣访问学生到亚洲微软研究参加并出色完成高水平的研究工作。与亚洲微软研究院合作参加TREC-10,取得了优异的成绩。

研究小组成员具有计算机和语言处理等多重研究背景,学科交叉将保证本课题高水平完成。项目负责人有完成多项国家自然科学基金项目的经验,刚刚完成的国家自然科学基金高技术项目被评为优秀,项目组成员老中青结合,梯队组成合理。

项目主要参加人田梅是天津科技信息研究所高级工程师,长期从事国内外科技信息咨询,互联网信息资源开发与利用,在信息检索领域具有丰富的经验。

项目主要参加人王中(天津大学在读博士生)任中信证券(天津)电脑部经理,在证券信息咨询领域积累了多年的经验,掌握大量翔实可靠的相关数据。

3.主要研究内容

本课题应用多项Web挖掘和自然语言处理(NLP)技术,结合面向领域信息检索的特点,研究基于拓扑结构挖掘的动态聚类、基于超链接分析的自动摘要和基于访问模式挖掘的查询扩展等项创新性的技术,开发面向领域的智能信息检索系统,为用户准确定位信息资源并提供高质量的检索结果。

本项目研究的关键技术主要有三点:

? 基于拓扑结构挖掘的动态聚类

当前检索系统使用的文本聚类方法,一般是通过向量空间模型将文本标准化,形成基于距离或密度的文本层次聚类。这些方法没有充分考虑Web拓扑结构的特点,准确度还有较大的提高空间。

考虑到网站的设计者在规划网站页面时,总会根据内容特点将其放到一个合适的位置,通过Anchor文本对其内容进行适当的描述,以吸引用户浏览相关内容,我们拟采用“基于拓扑结构挖掘的动态聚类”的新思路。依据Web页面文本所在的位置,挖掘出网页在网站中的层次类别信息,通过这些信息进行动态聚类。把网站的聚类层次结构看作是一个树形目录,基于拓扑结构挖掘的动态聚类就是将这个树形目录进行归并,动态生成一个“聚类树”,从而为用户提供一种“动态的目录聚类查询服务”。 ? 基于超链接分析的自动摘要

当前绝大部分Web信息检索系统的返回结果中不包含目标网页的摘要,只提供包含检索词的部分文本,用户难以通过这些文本确定目标页面的中心内容,只有在打开目标网页后才能知道是否是所需要的信息。显然,如果提供目标网页的摘要,可为用户节省大量的时间和精力。国内外对文本摘要技术的研究已有多年,但主要是针对纯文本而设计的。

考虑到网页及其链接比纯文本包含更丰富的信息,我们拟采用“基于超链接分析的自动摘要”方法,利用半结构化网页提供的隐含信息来提高网页文本摘要的精确度。为了充分利用这些信息,首先挖掘出网页的超链接信息,得到所有链接到该网页的文本,并根据语法/语义规则进行噪音过滤,得到该网页的特权候选摘要语句;然后利用HTML标识的知识和纯文本的词、句、段及篇章知识,计算网

页中每个词句的权重;最后根据字数的要求提取权重值较大者形成网页摘要。

? 基于访问模式挖掘的查询扩展

目前查询扩展主要有两种途径:查询前扩展和查询后扩展。查询前扩展就是根据同义词词典、语义蕴涵词典来扩展查询检索项,在提交查询时把与检索项相关的词汇或短语添加到检索条件中;查询后扩展则是在查询后应用相关反馈法发现与查询检索项相关的词汇和短语,把它们添加到检索条件中,再次进行检索。然而,增加检索项容易引入噪音,导致检索到的不相关文本增多。另一方面,查询扩展可能由于引入不适当的关键词产生主题漂移现象。

针对上述情况,我们拟采用“基于访问模式挖掘的查询扩展”方法。通过对用户以往搜索记录的分析,即Web日志挖掘,推测用户的搜索偏好,将偏好近似的用户分类。根据已经建立的用户查询模型产生该类用户的访问模式,由此设计反映访问特征的查询扩展方法。从单一的、静态的、当前的检索过程来看,该方法具有查询前扩展的优点;而从群体的,动态的,历史的检索过程来看,该方法又具有查询后扩展的优点。该方法突破了单一扩展模式的局限,可以在一定程度上抑制噪音,避免主题漂移。

本课题的预期结果是开发面向领域的智能信息检索系统,针对领域用户提出的查询,系统提供全面、准确、精练的相关信息。计划分别面向高等教育和证券信息咨询两个领域进行开发,为今后面向其它领域的开发应用积累经验。

下面举例说明与传统的信息检索系统相比,本课题开发的系统具有的优势。假设某用户需要检索与高等教育的现状和改革相关的研究论文,如果使用通用网站搜索,在上输入查询“高等教育的现状和改革”,检索到的文档数量将会大得惊人(例如,17800篇)。假设该用户想要得到的只是相关的研究论文,而通用搜索引擎会把包含“高等教育”,“现状”和“改革”的所有相关报道连同研究论文一同呈现出来,其中大部分并不是该用户想要的。如果使用本课题开发的面向高等教育的智能信息检索系统,将会根据该用户以往的搜索偏好,重点搜索用户喜好的内容,至少会将该用户感兴趣的研究论文放在前面。提交的信息不但准确,而且更全面,还能够提供文本摘要,有利于用户快速掌握目标页面的中心内容。

再看看证券信息咨询领域,目前市场上主要有三种类型的检索服务系统:综合性网站(例如新浪)、专业资讯网站(例如和讯.cn)和证券公司网站(例如中信证券)。这些检索系统的共同特点是用户必须输入具体的证券代码,证券简称等信息,检索结果也只是一些数据信息的简单罗列,例如走势图、股本结构、财务数据等,不能全面反映股市的状况,无法把行业信息、宏观经济走势、国家政策调整等许多更为丰富的信息提供给投资者进行决策。本课题完成的面向证券信息咨询领域的智能检索系统将有效地解决上述问题。首先,系统对证券领域的特征信息进行抽取,通过机器学习把证券代码、价格、成交量、技术指标、财务指标等数据信息与相关的文本信息绑定起来,建立特征信息库。其次,在此基础上对证券领域的结构化信息和文本信息进行动态聚类、索引和自动摘要,并通过进一步整理形成客户需要的输出形式。最后,通过对用户Web日志的挖掘进行归纳学习,发现并获得用户的习惯性访问模式,从而设计出个性化的查询扩展方法;同时可以发现客户对某些证券、板块、行业及其技术指标、财务指标的兴趣,建立这些项目间的相关性模型,通过相关性模型建立有关文本、数据的快速检索,明显地提高客户查询的响应速度和咨询质量。

4.研究目标(包括总体目标、实施年限和进度安排、考核指标等)

总体目标:

完成面向高等教育领域和证券信息咨询领域的高性能智能检索软件系统。

实施年限和进度安排:

20xx年4月-6月 调研、资料准备、总体设计

20xx年7月-12月 文本收集、搭建基本研究系统平台

1) 面向领域的文本收集 建立基本的爬行器,在因特网上收集高等教育领域和证券信息咨询领

域的资料。

2) 建立与领域内容相关的结构化索引数据库 考虑高等教育领域和证券信息咨询领域的特点,

建立与领域内容相关的结构化索引数据库,并为每个页面提取其网站自身的类别信息。

3) 确定PageRank分类策略

4) 利用目前较成熟的传统算法和技术,实现基本的聚类、摘要和查询扩展,搭建基本研究系统

平台

本阶段预计完成系统基础平台的建设,完成高水平论文2篇。

20xx年1月-12月 深入研究与集成

1) 在前述系统平台的基础上,对聚类模型、摘要提取算法和查询扩展方法进行改进。

2) 通过本系统在试运行期间提供的日志文件挖掘用户访问模型,研究其与查询扩展相结合的方

案。在支持传统关键词查询的基础上实现“查询扩展功能”和“动态的目录聚类查询服务”。设计并实现个性化查询扩展。

3) 开发个性化、多功能信息查询接口,实现用户输入的自动检错。

4) 建立面向高等教育和证券信息咨询领域的高性能智能检索系统原型投入试运行。

本阶段预计完成技术报告,申请专利2项,并发表高水平论文2-3篇。

20xx年1月-2月:系统评测与验收

本阶段将提供系统评测报告和研究工作报告,进行项目验收。

申请软件系统的自主版权。

5.主要技术特点和创新点(包括主要技术特点、创新点和关键技术、技术工艺路线、专利和知识产权等)

技术路线:

合理吸收、有效利用现有的成熟方法,在相关领域已有的研究结果之上,加入我们提出的“基于拓扑结构挖掘的动态聚类”、“基于超链接分析的自动摘要”、“基于访问模式挖掘的查询扩展”等新方

法。以集成化的技术路线完成智能检索系统的研究和开发,将数据挖掘、自然语言处理等人工智能技术与网络、数据库技术相融合。具体分以下三个阶段实现。

阶段一 搭建试验平台。建立结构化的面向高等教育领域和证券信息咨询领域的Web信息检索系统,开发爬行器、后台数据库和前台界面。这一阶段主要是实现当今大部分Web信息检索系统所具有的基本功能。试运行该Web信息检索系统,搜集相当齐全的关于高等教育领域和证券信息咨询领域的Web页面。

阶段二 技术探索。深入研究如下3方面的关键技术:

1)动态聚类:通过挖掘网站自身的拓扑结构/布局,获取该网站中表征页面分类特征的结构信息,利用分类特征标识进行聚类。利用语义分析、贝叶斯算法、决策树等技术将这些树形目录加以削减、结合、归并,动态生成一个“层次结构聚类树”。

2)自动摘要:挖掘网页链接中相关联的Anchor文本和其所在段落所提供的隐含的、带有导航性描述内容的关键字词句,利用半结构化网页提供的隐含信息来提高网页文本摘要的精确度。首先进行结构挖掘,挖掘出所有通过超链接指向该网页的文本,并根据语法/语义规则进行噪音过滤,得到该网页的特权候选摘要语句;然后进行内容挖掘,通过HTML标识的知识和纯文本的词、句、段及篇章知识,计算网页文本中每句话的权重;最后根据字数要求,通过关联度分析、语法分析生成摘要。

3)查询扩展:应用相关反馈法,综合使用查询前扩展和查询后扩展两种方法,通过Web日志挖掘得到用户的查询习惯和兴趣特点,建立个性化的查询扩展模型。利用该模型,结合词共现和语义分析技术,对查询进行修改、扩展并自动选择搜索策略。

阶段三 系统集成。将第二阶段的研究成果整合到试验平台系统中,并进行系统评测和改进。

拟解决的关键问题:

1) 基于网站拓扑结构挖掘的动态聚类模型

2) 超链接分析与Web结构挖掘相结合的摘要形成技术

3) 基于用户访问模式的查询扩展方法

6.总投资预算、资金筹措方式及来源(包括项目总投资概算、新增资金筹措及来源、资金使用计划等)

项目的总投资预算为50万元,其中25万元申请市政府拨款,在与中信证券合作的基础上,由天津大学和中信证券自筹25万元经费。随着项目的进展和市场前景的变换,根据形势决定新增资金的数目。目前申请的资金11万元用于服务器等设备的购置和词典、语料库等语言处理工具的购买。9万元用于购买微机、人工处理语料等能源耗材费用。其它资金用于实验测试、会议差旅等。

7.预期成果的经济、社会、环境效益分析及成果应用、产业化衔接情况(包括产品成本分析、产品单位售价与盈利预测、经济效益分析、项目投资评价、社会效益分析等)

信息需求已成为企业最重要的资源需求之一,而专门行业对其所需要的信息又具有特殊性,这导

致了对面向领域的检索系统的迫切需求。而目前国内尚无此类系统,广泛的行业应用空间为本项目的产出/投入比提供了坚实的保证。巨大的市场潜力也确保了项目投资可顺利回收并获取丰厚赢利。同时,本项目不仅填补了我国在这方面的空白,而且将推动行业的信息化步伐。

随着我国经济的发展,证券行业知识更新的速度越来越快,投资者对证券知识以及相关经济、法律、各行业等背景信息的关注程度和咨询需求越来越高;同时,目前证券行业垄断性低,全国有百余家证券公司,市场竞争激烈,相互之间在不断地压低成本、提高服务质量,面向证券领域的智能检索系统对提高证券公司的核心竞争力有着重要的作用。目前,证券行业的网上交易相当流行,我们的系统可以嵌入网上交易中为投资者提供便捷、及时的定制信息服务;同时,可以为证券公司客户服务中心的建设提供信息检索方面的核心技术,因此,面向证券领域的智能检索系统具有良好的市场前景。

我们预计在全国百余家证券公司实现30%的市场占有率,每套计划售价15万元,可实现销售额450余万元;每家证券公司的年维护费1万元,每年的维护费总额计30万余元。

在教育领域,我们将着重以社会效益为主,以普及教育知识为目的,为广大师生提供便利的信息服务,同时有助于提高学校管理效率。我们计划向全国1000多所高校免费赠送智能检索系统,同时每年向每所学校收取技术维护费1000元,每年的维护费总额预计100万元。

更有效的出售形式是:掌握本项目的核心技术后,我们可以向各个行业的企事业单位转让核心技术,这些技术可以嵌入到其它软件产品。而且通过这种方式,购买方可以自己在行业内进行扩展。这样,因为不需要承担向具体行业扩展的任务,所以我们可以只专心于研究专有的核心技术,同样可获得良好的经济效益。

8.风险分析(包括技术、人员、市场、政策和项目承担单位等方面)

本项目中用到了一些成熟技术,也用到一些自主开发的关键技术。关键技术利用现有语料库已经得到初步验证。集成这些技术的过程中可能出现磨合的问题,但经过反复调试是可以解决的,技术风险很小。任何新的软件系统都有一定的市场风险,但是本系统的市场很广阔,加上发展信息产业为我国长期方针,因此市场风险不大,更没有政策风险。

9.承担单位简介及合作方式(如有国际科技合作内容请简要叙述合作内容、方式、主要合作人员等)

本项目的承担单位天津大学是教育部直属重点大学,是中国近代第一所大学。

10.项目负责人及主要成员简介(姓名、性别、年龄、学历、学位、技术职称与职务以及与项目相关的主要工作业绩等)

项目负责人

何丕廉 男 60岁,研究生,天津大学信息学院教授 博士生导师 天津大学-微软研究院计算语言学

研究室主任

1968 北京大学物理系研究生毕业

1981-1983 日本神户大学系统工程系访问学者

1996.7-12 美国罗德爱兰大学计算机系高级访问学者

近期发表的与本项目有关的主要论著:

1. 一种基于上下文的中文信息检索查询扩展,中文信息学报, Vol.16, No. 6, 2002.11

2. 利用人工和自动生成的资源进行中文信息检索查询扩展,计算机工程与应用, Vol.38 , No.21,

2002.11

3. Query Expansion for Chinese Information Retrieval by Using a Decaying Co-occurrence Model,

Transactions of Tianjin University, Vol.8 No.3 ,2002.3

4. On Difficulties of Chinese-English Machine Translation, IEEE Proceeding of 2002 International

Conference on Machine Learning and Cybernetics(ICMLC-2002),Nov. 2002 Beijing, China

5. Dynamic Clustering Analysis of Documents Based on Cluster Centroids,IEEE Proceeding of 2003

International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003 ,Xian, China

6. Algorithm of Documents Clustering Based on Minimum Spanning Tree,IEEE Proceeding of 2003

International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003 ,Xian, China

7. Chinese Segmentation System Based on Document Self-Matching for Identifying the Unknown Words,

IEEE Proceeding of 2003 International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003,Xian, China

8. Web 日志挖掘中的数据预处理技术研究,计算机应用Vol.23, No.5 ,2003.5

9. 基于结构挖掘的Web文本自动分类技术, 计算机应用Vol.3, No.7 ,2003. , 2003.7

10. Performance of Two Information Retrieval Systems in Chinese IR: SMART System and Okapi System ,

IEEE Region 10 Technical Conference on Computers, Communications, Control and Power Engineering(TENCON’02) Oct. 28-31,2002 Beijing, China

11. 中文分词对中文信息检索系统性能的影响,计算机工程与应用,Vol.39 ,No.19 2003

12. 基于向量空间模型的词共现研究及其在文本分类中的应用,计算机应用Vol.23,No.6,2003

13. 时间延迟反馈神经网络及其在股市预测中的应用,南京大学学报(自然科学),2000.10

14. 自适应随机链路状态路由算法,计算机研究与发展, Vol.39, No.11, 2002.11

15. 语音/数据同帧传输方法,天津大学学报, Vol.35, No.5 Sep. 2002

16. 二值图象压缩标准-JBIG2,计算机工程与应用, Vol.38 No.13, 2002.7

17. 神经网络与模糊技术的结合与发展,计算机应研究Vol.18 No.5,2001.5

18. 模糊聚类神经网络的非对称性学习算法,计算机研究与发展,Vol.38 No.3, 2001.3

19. 基于神经网络的时间序列鲁棒预测,控制与决策, Vol.16 No.3,2001.3

20. 基于预测复杂性的神经网络预测子辨识,信息与控制Vol.30 No.1,2001.2

21. PHP在Web数据库的应用研究,计算机工程,2000.9, Vol.26 No.9

22. 基于WWW的学习语义网络导引图,ICCE'98,1998

23. 论数据库技术与人工智能的融合,计算机工程与设计,1999.10 Vol.20 No.5

24. 适用于高必要嵌入维的混沌时间序列预测算法,天津大学学报,Vol.32 No.5 1999.9

科研成果及获奖情况:

1 智能化课件写作系统,国家自然科学基金(主持),1989 完成

2人工智能在微波电路CAD中的应用,国家自然科学基金(参加),1993完成

3 师生同步协作的超媒体虚拟教室,国家自然科学基金高技术项目(主持),2000完成

4基于CSCW的远程教学环境,天津市自然科学基金重点科学基金(主持),2002完成

4 超媒体智能CAI系统,天津市自然科学基金(主持),1998 完成

5 交互式程序自动生成系统,天津市自然科学基金(主持),1995 完成

6 实用多机系统的研制与开发,天津市自然科学基金项目(参加),1996 完成

7教育网络管理系统,九五攻关项目(参加),已商品化,1993 完成

8 通用报表生成程序系统 ,中国计算机用户协会软件应用成果奖 ,1985

9 企业管理自动化多层微机局部网络 ,天津市科学技术进步三等奖 ,1986

10 微型机及其应用课程教学改革及实践 ,天津市优秀教学成果三等奖 ,1993

11通用课件写作系统CACAS,全国首届最佳CAI软件二等奖(软件平台最高奖), 1994

12网上虚拟教室——同步浏览与交互学习,天津市教委一等软件,1999

主要参加人

孙学军 男 57岁,本科,副教授,19xx年至今一直从事计算网络与机通信方面的教学和科研工作。主要论著和科研成果如下:

[1] A New Mobility Management and Routing Scheme for Mobile Computing Environments, Journal of

Tianjin University, 2002. Vol.8(4).

[2] Agent-Based Approach for Universal Personal Computing, IEEE APCCA 2000, 2000.12

[3] Self-Adaptively Randomized Loop-Free Routing Algorithm, ASIAN MIRROR, 2001(34)

[4] Research on Sharing Compressed File in Different Systems. IEEE APCCAS 2000 2000.12

[5] 语音/数据同帧传输方法,天津大学学报,2002. Vol.35(5)

[6] 自适应随机链路状态路由算法,计算机研究与发展,2002.11

[7] 语音与数据综合传输的带宽利用率,计算机工程,2003.12

[8] 未来因特网的移动性支持,计算机应用研究,2003.12

[9] 基于神经网络时间序列鲁棒预测,控制与决策,2001,Vol.16(3)

[10] 锁相式跳频器快速锁定的研究,国家自然科学基金,1989.12

[11] 师生同步协作的多媒体虚拟教室,国家自然科学基金,2000.12

[12] 基于CSCW的远程教学环境,天津市重点基金,2001.12

[13] 智能化网络多媒体教学支撑环境及软件库,天津市重点基金,2002.9~2004.3

田梅 女 48岁,本科,天津市科技信息研究所高级工程师 天津市科技情报学会会员 天津市图书馆学会会员 天津市科技信息研究所网络与信息资源建设领导小组成员

19xx年8-11月赴日参加 JICA 信息处理人员培训

19xx年5-6月赴美参加VAX7610操作系统培训

19xx年11月初率先在本市主讲Internet 培训课。

参加《天津联科信息网络系统研究》课题,获19xx年"天津市最佳科技信息成果一等奖"。 20xx年 先后完成的互联网上免费全文科技期刊网址等信息200余条、互联网上世界各国专利免费全文检索报告及跟踪报告、DIALOG5000种刊物试用评估报告。

20xx年 研究分析了IHS国际标准,并对NSSN和Techstreet两个免费国际标准检索系统加以研究分析。

长期从事国内外科技信息咨询。目前参加天津市科技信息研究所为天津市政府有关本市发展决策的专题信息Web挖掘工作。

发表论文:

1. 美国公司产品数据文献的特点,情报理论与实践,89年第六期

2. 试论情报需求及其满足,天津市科学技术情报学会第六届学术年会,90年12月

3. Internet信息特性,纪念中国科技情报事业创建四十周年学术会议,优秀论文,96年10月

4. 全球最大的网间网Internet及其信息服务,软件,96年第8期

5. 基于兴趣爱好的智能搜索引擎ISEBI,全国计算机辅助教育学会第十届学术会议论文集,大连理工

大学出版社,2001.7

6. Coupled Dynamical System and the Solution of Gambling Game Problems, International Joint

Conference on Neural Networks, the Neural Networks Council of IEEE, Washington DC, July 15-19, 2001

7. On Difficulties of Chinese-English Machine Translation, IEEE Proceeding of 2002 International

Conference on Machine Learning and Cybernetics (ICMLC-2002), Nov. 2002, EI检索03127407060

8. Algorithm of Documents Clustering Based on Minimum Spanning Tree,IEEE Proceeding of 2003

International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003

王中 男 35岁,河北工业大学计算机应用硕士学位,天津大学计算机系在读博士,中信证券股份有限公司(天津)电脑部经理,高级工程师。曾主持设计开发了“中信证券天津地区三家营业部区域集中交易系统”、“中信证券与天津建设银行的银证通交易系统”和“远程中间件交易平台”等项目的研制工作。

发表论文:

1. LINUX 防火墙分析,河北工业大学学报,20xx年第2期

2. Realization and Evaluation of a Decaying Co-occurrence Model Based on Parallel Computing, IEEE Proceeding of 2003 International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003

陈霞 女 34岁,天津大学计算机系讲师,博士生在读。研究兴趣:智能CAI,CSCW,基于Web的应用技术,数据挖掘,信息检索等。

发表论文:

1. 一个通用数据库型CAI的设计与实现,第八届全国CBE学会论文集(获优秀论文奖)

2. Design and Implementation of Web-based Network School Developing Tools, Proceedings of the

international conference CBLIS’99 (Computer Based Learning in Science) ,Nethrlands,1999

3. 基于CSCL网络虚拟教室的设计与实现,GCCCE2000第四届全球华人教育资讯科技大会论文集,

新加坡,2000

4. 利用人工和自动生成的资源进行中文信息检索查询扩展,计算机工程与应用,2002

5. Web使用挖掘中的数据预处理技术研究,计算机应用,2003,5

郑小慎 女 30岁,天津大学计算机系博士生在读。研究兴趣:信息检索,自然语言处理,数据挖掘,智能CAI等

发表论文:

1. Xiaoshen Zheng, Pilian He, Fuyong Yuan. Dynamic Clustering Analysis of Documents Based on

Cluster Centroids,,IEEE Proceeding of 2003 International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003 ,Xian, China

2. Xiaoshen Zheng, Pilian He, Mei Tian. Algorithm of Documents Clustering Based on Minimum

Spanning Tree,,IEEE Proceeding of 2003 International Conference on Machine Learning and Cybernetics (ICMLC-2003), Nov. 2003 ,Xian, China

3. Realization and Evaluation of a Decaying Co-occurrence Model Based on Parallel Computing,

IEEE Proceeding of 2003 International Conference on Machine Learning and Cybernetics

(ICMLC-2003), Nov. 2003

4. Xiaoshen Zheng, Pilian He, Mei Tian. On Difficulties of Chinese-English Machine Translation. The

first International Conference on Machine Learning and Cybernetics(ICMLC-2002),

Nov.,2002, Beijing, China(已经被EI检索,检索号码:03127407060)

5. 基于信噪比的教学评测模型,计算机应用研究(精扩本),2002(1)

6. 智能计算机辅助教学评测系统算法分析,微计算机应用,2002(2)

汪洋 男 39岁,天津大学计算网络中心工程师

孙越恒 男 29岁,天津大学计算机系博士生在读。

雷鸣 男 26岁,天津大学计算机系博士生在读。

聂颂 男 25岁,天津大学计算机系硕士生在读

吴光远 男 24岁, 天津大学计算机系硕士生在读

谢振亮 男 24岁,天津大学计算机系硕士生在读

赵伟 女 24岁,天津大学计算机系硕士生在读

刘涛 男 24岁,天津大学计算机系硕士生在读

陈治纲 男 23岁,天津大学计算机系硕士生在读

刘志为 男 24岁,天津大学计算机系硕士生在读

吴步丹 女 23岁,天津大学计算机系硕士生在读

11.附件(包括发明专利证书、小试鉴定报告、科技查新报告、样品检测报告以及其它能说明项目技术水平和来源、知识产权归属等的证明材料,承担单位间的合作协议等)

*社会发展科技计划项目按此提纲编制实施方案,涉及经济指标部分可改为社会效益指标。

3. 天津市国际科技合作资助经费申请表

(只限具备国际科技合作条件的科技攻关和应用基础研究重点项目填报)

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

天津市科技发展计划项目申请书

4. 天津市科技发展计划项目经费预算表

表1、总表 金额单位:万元

天津市科技发展计划项目申请书

表2、大型设备购置申请表

天津市科技发展计划项目申请书

2.每种购置设备填制一张表,若空间不够,可另附页。

表3、设备购置表预算明细表

金额单位:万元

天津市科技发展计划项目申请书

注:1.只填写单价在1万元以上的仪器设备,其中(2)列仅适用于设备购置,设备试制不需填列。 2.本表(5)列、(6)列合计数分别与预算总表中预算数一致。

表4、能源材料费预算表明细表

金额单位:万元

天津市科技发展计划项目申请书

2.本表(5)列、(6)列合计数分别与预算总表中预算数一致。

表5、试验及外协费用预算明细表

金额单位:万元

天津市科技发展计划项目申请书

注:1.本表(4)列=本表(3)列×本表(2)列。

2.本表(4)列、(5)列合计数分别与预算总表中预算数一致。

6、小型改造费预算明细表

金额单位:万元

天津市科技发展计划项目申请书

注:1.本表(4)列=本表(2)列×本表(3)列。

2.本表(4)列、(5)列合计数分别与预算总表中预算数一致,

《天津市科技发展计划项目经费预算表》编制说明

天津市科技发展计划项目预算书包括6张预算表,所有项目均需认真填写。其中,第1张为项目经费预算总表,表1-5为项目经费预算部分支出科目明细表。

(1)设备购置费,指项目研究过程中所必需的专用仪器、设备的购置和维修费用,研究项目的样品、样机购置费及设备试制费,包括为此发生的运输、包装、装卸、安装和调试费用(含运输保险费和进口关税等)。其中从国外引进的仪器、设备、样品、样机的购置费包括海关关税和运输保险费用。项目所购置和试制的单台价值在5万元以上(含5万元)的仪器设备(含样机)需单独列示,单台价值在20万元以上的仪器设备原则上通过协作共用的方式解决,如确需购买,需经市科委批准备案。

(2)能源材料费,指项目研究过程中所支付的原材料、燃料动力、低值易耗品的购置等费用。包括研究所需的水、电、燃料、原材料、辅助材料、低值易耗品、零配件、半成品、实验动物等的购置费用,以及为此发生的运杂包装费用。水电消耗可单独计量。未经计量的水电消耗,计提数不得超过项目拨款额的5%。一次购置但可重复使用(使用寿命在一年以下)的设备(含小型样品、样机购置项目),单台价值在1万元以下(不含1万元)的各类仪器设备,在能源材料费项下列支。

(3)试验及外协费,指项目研究过程中发生的租赁费用、带料外加工费用及因本单位不具备条件而委托外单位或合作单位进行的试验、加工、测试、计算等发生的费用。发生试验外协费时,必须与协作单位签订相关的合同书。

(4)小型改造费,指中间试验(扩试)及重点实验室装备项目必须发生的车间(实验室)改造及装修费,包括经市科委专项批准的400平方米以下的零星土建支出(不含落地大修或落地重建项目)。

(5)资料印刷费,指项目研究开发过程中发生的专用书刊、资料、翻译、复印、印刷等费用。

(6)租赁费,指项目研究开发过程中租赁专用仪器、设备、场地、试验基地等所发生的费用。

(7)会议及差旅费,指项目研究过程中,为项目研究而进行调研考察、现场试验等工作所发生的交通、住宿、通讯等费用,及组织召开的与项目研究有关的专题学术研讨、

技术咨询、论证等会议的费用。

(8)鉴定验收费,指项目在成果鉴定、验收时所发生的费用。鉴定、验收费的开支仅限于根据《科学技术成果鉴定办法》(国家科委第19号令)中规定必须进行鉴定、验收的项目。

(9)管理费,指项目依托单位和承担单位为组织管理项目而支出的各项费用。包括现有仪器设备和房屋使用费或折旧、直接管理人员费用和其他相关管理支出。项目依托单位和承担单位所提取的管理费总和不得超过项目总预算的5%,并且单个项目的提取额最高不得超过5万元。(企业及负责主持科技项目的各级科技管理部门不得以任何形式提取管理费)

(10)其他费用,指除上述费用之外与项目研究有关的其他费用。

5. 天津市科技发展计划项目技术开发合同草本

项 目 名 称 基于Web挖掘和NLP技术的面向领域的智能检索系统 委托单位(甲方) 天津市科委 研究单位(乙方) 天津大学 担保单位(丙方) 联系电话(乙方) 27402114 联系人(乙方) 何丕廉 邮政编码(乙方) 300072

联系地址(乙方) 天津大学电子信息工程学院

填 写 说 明

1.本合同系天津市科学技术委员会(以下简称“市科委”)为加强项目管理、规范合同各方职责和义务而设计的。甲方为市科委,乙方为项目依托单位。

2.项目申报单位在申报项目时请同时填写本合同书(须在合同书封面加盖公章)。合同书内容须与项目申报书完全一致。申报单位在申报项目时连同项目申报书一并报送。项目批准后正式签定项目合同时,将以本合同为依据签定正式合同。

3.任务书各项内容填写应当实事求是,用钢笔填写或计算机打印填报(A4),字迹要工整清楚,页面整洁。

4.填写内容涉及到外文名称,要写清全称和缩写字母。

5.市科技经费是指市科委管理的财政经费;国家有关部委拨款是指国家有关部、委、局所拨科技经费;经费预算中的“其他”一栏是指市科委以外的各级财政拨款和承担单位融资、集资、入股等各种形式的经费来源,本栏需具体填写。

根据《中华人民共和国技术合同法》的规定,合同各方就 天津市科技发展计划的 基于Web挖掘和NLP技术的面向领域的智能检索系统项目的研制,经协商一致,签定本合同。

第一条、项目研制(标的)的内容、形式和要求:

1) 建立基本的爬行器,在因特网上收集高等教育领域和证券信息咨询领域的资料;

2) 依据高等教育领域和证券信息咨询领域的特点,建立与领域内容相关的结构化索引数据库;

3) 采用Web挖掘利用目前较成熟的传统算法和技术,实现基本的聚类、摘要和查询扩展,搭建基本研究系统平台;

4) 通过本系统在试运行期间提供的日志文件挖掘用户访问模型,研究其与查询扩展相结合的方案。在支持传统关键词查询的基础上实现“查询扩展功能”和“动态的目录聚类查询服务”。设计并实现个性化查询扩展;

5) 开发个性化、多功能信息查询接口,实现用户输入的自动检错;

6) 完成面向高等教育领域和证券信息咨询领域的高性能智能检索软件系统。

第二条、项目的总体考核指标(包括技术、经济、社会及其他指标):

1) 面向证券信息咨询领域的软件系统,预计在全国百余家证券公司实现30%的市场占有率,每套计划售价15万元,可实现销售额450余万元;每家证券公司的年维护费1万元,每年的维护费总额计30万余元。

2) 面向高等教育领域的软件系统,计划向全国1000多所高校免费赠送智能检索系统,同时每年向每个学校收取技术维护费1000元,每年的维护费总额预计100万元。

3) 掌握本项目的核心技术后,我们可以向各个行业的企事业单位转让核心技术,这些技术可以嵌入到其它软件产品。而且通过这种方式,购买方可以自己在行业内进行扩展。这样,因为不需要承担向具体行业扩展的任务,所以我们可以只专心于研究专有的核心技术,同样可获得良好的经济效益。

第三条、项目研制计划进度:

20xx年4月-6月 调研、资料准备、总体设计

20xx年7月-12月 文本收集、搭建基本研究系统平台 20xx年1月-12月 深入研究与集成

20xx年1月-2月 系统评测与验收

第四条、技术协作和技术指导内容:

第五条、名词和术语的解释:

经费预算与支出概算

单位:万元

天津市科技发展计划项目申请书

用 款 计 划 表

(甲方资金)

单位:万元

天津市科技发展计划项目申请书

购置仪器设备及其他资产明细表

单位:万元

天津市科技发展计划项目申请书

相关推荐