1、我 国 专 利 信 息 数 据 库 建 设 原 则 与 利 用 体 系 研 究 *唐 思慧 *魏 静雯 1( 湘潭 大学 公共 管理 学院 湘 潭 4105)摘 要 : 专 利信 息作 为技 术信 息 , 具 有很 强的 经济 效益 和法 律作 用 。 专 利信 息数 据库 建设 的好坏 直接 影响 着专 利事 业的 发展 。 文 章通 过对 专利 信息 数据 库建 设现 状的 分析 , 提 出数 据库 建设 应坚 持标 引准 确与 规范 化原 则 、 公 共服 务与 市场 服务 相结 合原 则 、 信 息全 面整 合与 专题 分类 相结 合原 则等 , 并 就专 利信 息利 用体 系建 立进
2、 行了 阐述 , 以 期对 专利 信息 数据 库建 设有 所裨 益。 关 键词 : 专 利信 息数 据库 ; 基 本原 则; 利 用体 系OnthePrinciplesandUtilzationSystem forPatentIform ationDatbaseConstructioniChinaTangSihuiWeiJingwen(PublicMangem ntScholofXiangtanUniversityXiangtan4105)Abstract:atentiform ationasthetchnicalinform ation,hasstrongeconm icandlegalef
3、ct.Patentinform ationdatbaseconstructionwilhaveadirectim pactonthedevlopm entofthepatentcause.Basedonthecurentsituationftheconstructionfpatentinform ationdatbase,thedatbaseconstructionshouldinsitonthefolwingprinciples:acurateindexingandstandarization,com binationofpublicserviceandm arketservice,thef
4、ulintegrationofpatentinform ationandproerprojectclasifcationandson.Thearticlefinalyintroducestheutilzationsytem ofpatentinform ation,inordertobenfitthepatentinform ationdatbaseconstruction.K eyK K K words:patentiform ationdatbase;basicprinciple;utilzationsytem专利文献包含着极其重要和全面的专利技术信息, 95%技术信息能在专利文件中找到
5、。 它同时又具有经济效益和法律作用 , 通过专利申请和专利主体转移的手 续 等 , 可 以 发 现 经 济 活 动 的 导 向 , 也 是 判 断 侵 权 的 最 主 要 依 据 。 我 国 自 1985年 4月 1日 专利法 的颁布和实施以来 , 专利信息内容不断增多 , 专利信息数据库的建设相应增加 , 形成了大量的专题性专利信息数据库和综合性专利信息数据库 。 专利信息数据库在促进科学技术进步和经济社会发展中起到了至关重要的作用 , 公众通过检索专利信息数据库 , 一方面可避免重复地发明创作 , 节省大量的科研资金;另一方面,可寻找专利侵权或无效证据,维护自身已有的专利权 。从 当 前
6、我 国 专 利 信 息 数 据 库 的 建 设 来 看 , 尽 管 形 成 了 许 多 的 专 利 信 息 数 据系国家社会科学基金重大招标项目 “ 国家知识产权文献与信息资料库建设研究 ” ( 201,项目编 号10& ZD13)的阶段性成果。1唐思慧 , 湘潭大学公共管理学院副教授 , 管理学博士 , 硕士生导师 , 湘潭大学知识产权研究中心研究人员 。魏静雯,湘潭大学公共管理学院 201级研究生。库 , 并开发了相应的专利信息检索软件和检索平台 , 但专利信息的检索效率和满意度并不高 , 并不能满足各行业的专利信息检索需求 , 使得更多的用户不得不利用国外的专利信息检索平台来检索国内的专
7、利 。 这说明我国的专利信息 没有得到有效的组织和管理 , 专利已成为各大领域发展的一块短板 。 在当前 , 研究我国专利信息数据库的建设非常必要 。 本文将从分析我国专利信息数据库建设的现状入手 , 对我国专利信息数据库建设的基本原则及体系进行探讨 , 以期对我国专利信息数据库建设有所裨益。 1我 国 专 利 信 息 数 据 库 建 设 的 现 状1.我 国 专 利 信 息 数 据 库 建 设 取 得 的 成 绩我 国 专 利 信 息 数 据 库 建 设 发 展 较 晚 , 据 统 计 , 2003年 之 前 , 我 国 仅 建 立 了13个专题数据库 。 随着国家知识产权战略制定工作领导小
8、组 于 2005年成立 , 2008年 6月 5日 国家知识产权战略纲要 的正式发布 , 我国专利信息数据库建设得到快速发展,各类专题性的专利信息数据库和综合性专利信息数据库不断增多 。我国专题性专利信息数据库 , 数量大约 700个左右 , 其中国家知识产权局专利文献部和知识产权出版社开发建设了影响比较大的 20余个,深度加工和标引的中国药物专利数据库,以及为其他企事业单位等用户开发建设的约 100个 。 地方知识产权局系统开发建成 300多个;社会信息服务机构开发建成约 200个 ; 全国科技信息机构约有 30个;其他机构比如大学和网站建有 20多个等1。综合性专利信息数据库也不断增多 ,
9、 并实现了网上检索 , 如中国专利数据库( 1998年 6月 10日开通 ) 、 CNIPR中外专利数据库服务平台 ( 1999年 6月开通 ) 、上海知识产权 ( 专利信息 ) 公共服务平台 ( 2009年 6月 9日开通 ) 、 国家重点产业专利信息检索平台 ( 2010年 2月 25日开通 ) 等 , 上述专利信息服务平台均向公众提供免费专利检索服务 。 CNIPR中外专利数据库服务平台对于有批量下载专利全文的用户实行付费使用 , 上海知识产权 ( 专利信息 ) 公共服务平台仅为注册用户提供个性化服务,并保留历史检索式以建立专题数据库和深加工数据库 。 上述专利检索平台适用于专业的专利检
10、索人员使用 。 另外 , 各省市知识产权局也纷纷建立专利信息检索平台,以方便各地用户检索。另 外 , 为 方 便 没 有 专 利 检 索 经 验 的 普 通 用 户 的 检 索 需 要 , 百 度 、 SooPAT等搜 索 引 擎 提 供 免 费 的 中 国 专 利 信 息 的 检 索 服 务 ; 万 方 、 CNKI等 数 据 库 也 提 供 有偿的专利信息检索服务 。 此外 , 东方灵盾中外专利检索及分析平台 、 北京彼速专利搜索引擎、保定大为 PatentEX专利信息创新平台 也提供付费专利信息检索等服务。 总的来说 , 专利信息检索平台不断增加 , 为我国提高自主创新能力 , 建设创新
11、型国家 , 应对各种严峻的挑战做出了贡献 。 但目前我国专利信息数据库建设存在诸多问题,远远无法满足知识产权战略的要求。 1.2我 国 专 利 信 息 数 据 库 建 设 存 在 的 问 题1.2.1公共专利信息数据库定位不清,标引不规范,检索效率不高目前国内已建立了众多公共专利数据库以满足公众对专利信息的需求 。 其中中国知识产权网以其丰富的资源,权威而有可靠的来源向国内外提供专利服务 ,用户必须购买专利文献阅读卡并成功进行用户注册 , 才能使用专利数据库服务平台提供的全部功能 , 中国专利信息中心提供的专利服务也是收费利用的模式这对于公众利用专利信息形成了某种阻碍 。 信息既有公共属性 ,
12、 也有私权属性 。 因而 ,政府的公共服务与市场主体的专门服务同样不可或缺 , 政府只能做到公共服务部分 , 不可能完全替代市场 , 专利信息作为不属于保密范围的政务信息 , 政府应当根据政务信息公开条例的相关规定 , 向公众提供免费的基础数据服务 , 合理界定公共服务与市场服务的界限,而不是搞 “ 一刀切 ” ,将专利信息全部纳入商业化的收费服务范围,混淆了公共服务与市场服务的界限。 专利标引是建立专利数据库系统 , 进行专利检索的重要环节 , 是进行专利信息分析获取竞争情报的基础和关键 。2目前数据库的标引和著录工作没有统一的规范 , 常用的情报检索语言主要是分类和主题检索语言 , 其中如
13、关键词 、 主题词的标引深度不足 , 一些细小专深的主题的揭示和检索存在困难 。 标引不全或不准确直接导致了查全率和查准率偏低 , 检索结果不准确 , 使得本已存在的专利信息无法得到有效利用而失去其价值。1.2.商业性专利信息数据库开发不足,缺乏竞争力数据库建设所需技术要求数据库建设必须纳入商业因素 , 以市场推动专利信息数据库服务的提高 。 目前商业数据库主要的利用者是获取经过深加工的专利信息以了解对手 、 提高自身竞争力的企业和对知识产权这一领域有较深研究的科研工作者,他们的需求是针对自身行业或领域的实际需要的,具有极强的针对性 。国 外 已 经 有 相 当 成 功 的 商 业 性 专 利
14、 信 息 数 据 库 , 如 INNOGRAPHY, Delphion、DIALOG、德温特等,但使用费比较高。国内已有东方灵盾中外专利检索及分析平台、 保定大为 PatentEX专利信息创新平台 等少数商业性数据库,总体而言,虽然可以满足用户的一般性需求 , 所提供的服务针对性 、 应用性以及个性化仍有待进一步加强 , 用户和受众相对有限 ,市场竞争力不足。 1.2.3相关过程数据公开不充分,缺乏有效整合机制与集成平台目前数据库建设在数据收集和处理方面存在着诸多问题 , 例如基础数据不全面和数据范围与类型不清 。 前者是因为基础数据一般掌握在政府手中 , 某些散落在司法部门或个人手中 , 全
15、面收集存在困难 , 后者则是由于数据库建设中缺乏合理的分类标准,特别是专利授权程序、维权程序与专利运营活动中的过程数据 ,譬如专利授权的中间文件(如审查意见通知书、专利无效请求书与答辩书等 ) 、专利运营中的商情数据 、 专利维权中的诉讼数据等均在国内现有专利数据库中无法体现。 缺乏有效的集成平台 , 也是专利信息无法进行有效整合的原因之一 。 来源不同 的 各 类 专 利 信 息 在 收 集 之 后 , 在 集 成 共 享 方 面 缺 乏 有 效 的 集 成 平 台 。 自 2005年起 , 国内专题性的专利数据库建设进入了快速发展时期 , 至今已建立起相当多的专题性的专利数据库 , 并且大
16、多是自主开发而成 , 原始专利数据全部或大部分由购买而来 , 尤其社会民营服务机构的数据基本由购买取得 , 因此这些专题数据库都采取收费服务方式 , 而且彼此之间缺乏整合与沟通 , 用户在查询所需信息时 ,要跨越不同的数据库进行查询 , 尤其某些数据库因为其开发者身份而使其他用户使用受到限制。 2专 利 信 息 数 据 库 建 设 的 基 本 原 则专利数据库建设的基本原则是数据库建设应该遵循的基本价值准则 , 它的确立可以为专利信息数据建设提供共通的原则和制度,具体表现为以下几个方面 。2.1标 引 准 确 与 规 范 化 原 则专 利 数 据 库 建 设 有 效 利 用 的 前 提 是 专
17、 利 信 息 与 相 关 数 据 的 准 确 、 规 范 化 标引 。 如果标引不准确 , 可能会使公众漏检相关的重要信息 , 使专利信息的收集不全面 , 不能做出有效 、 科学 、 合理的分析与判断 , 从而影响立项 、 研发 、 投资等商业活动,根本上影响专利数据库建设的初衷与效用。 专 利 信 息 库 建 设 的 规 范 化 就 是 要 使 各 种 专 题 性 的 专 利 信 息 库 及 其 未 来 若 干数据库之间能够协调一致 , 克服各数据库间的 技术壁垒和数据隔阂 , 保证各专项数据库之间能够实现资源共享 , 基本数据一数多用 , 从而避免不必要的重复建设和资金浪费。 2.公 共
18、服 务 与 市 场 服 务 相 结 合 原 则公 共 服 务 和 市 场 服 务 是 专 利 信 息 数 据 库 实 现 其 服 务 价 值 的 两 种 相 辅 相 成 的方式 。 公共服务是政府面向公众提供的免费的信息公开利用 , 是一种基础性的信息服务方式 , 市场服务是以市场为导向的严格以用户需求为出发点的有偿的利用方法 。 公共服务与市场服务的结合可以最大限度的实现专利信息数据库的开发和合理利用 。 这是因为 专利数据库的建设必然有数字技术的介入 , 数据库未来的生命 , 必须有商业性的介入 , 公共资金无法全力负担 , 引入市场服务模式 , 才能真正将专利信息数据库建立起来,并最大程
19、度的发挥其作用。 2.3信 息 全 面 整 合 与 专 题 分 类 相 结 合 原 则进 行 专 利 信 息 全 面 整 合 , 积 累 丰 富 的 信 息 资 源 是 提 供 信 息 服 务 的 前 提 和 基础 。 随着科学技术的发展 , 专利信息量剧增 , 而且分布十分分散 , 缺乏有效的整合 , 这些散存的未经过科学整理的专利信息 , 在专利信息数据库中不利于及时全面的检索出来,因此,遵循全面整合专利信息资源的原则,有效整合各种资源 ,建立统一的专利信息服务平台 , 构建不同专业和领域的专利信息库 , 形成大规模 、高质量、专业化的专利信息资源库,开发适合国内检索方式的通用检索系统 ,
20、 为公众提供高效的专利信息服务,是建设有效地专利信息数据库必须面对的问题 。除此之外,专利信息服务也须进行整合,例如数据库系统统一使用某种数据库 ,以 防 出 现 Oracle数 据 库 、 SQLServer数 据 库 等 不 同 的 数 据 库 系 统 同 时 应 用 的 情形 , 防止造成不同的系统之间相互割裂 、 提高维护和管理成本 、 降低系统整体效率。 3在专利信息资源全面收集的基础上 , 专利信息数据库可按照不同的专题进行分类 , 在保证分类全面的前提下实现各种专利信息各归其位 , 以提高用户检索的快捷性和便利性 。 信息全面整合和专题分类的完美结合 , 就可以为专利信息数据库建
21、设打下良好的资源基础。3专 利 信 息 数 据 库 利 用 体 系3.1建 立 法 律 保 障 与 政 策 支 持 体 系 , 为 专 利 信 息 利 用 提 供 保障 支 持专利数据库的建设要以市场做主导 , 政府为补充 。 相关立法和政府部门在数据库建设中应提供必需的法律保障与政策支持,充分发挥国家宏观调控的作用 。其中包括专利信息免费利用的相关政策和数据库共建 、 商业数据库建设及权益维护的相关法律和政策 。 保障基础数据信息的提供 , 譬如有关中间文件的及时公开 ,注意商情数据与诉讼数据的商业秘密保护 , 出台相关法律法规弥补我国在专利数据库利用中相关法律法规的空白 , 保护商业数据库
22、建设者的合法权益 。 对于数据库政府与行业或商业共建的问题 , 应制定文件明确彼此的责任和义务 , 防止相互扯皮推诿越权处理本不应由自身管理的问题 , 保障数据库的共建工作有条不紊的进行。 3.2保 证 信 息 收 集 全 面 , 建 立 完 备 、 更 新 及 时 的 专 利 信 息 资源 体 系 专利信息是专利文献作为主要内容或以专利文献为依据,经分解、加工 、 标引 、 统计 、 分析 、 整合和转化等信息化手段处理 , 并通过各种信息化方式传播而形成的与专利有关的各种信息的总称 , 它包括专利申请 、 审批等各项程序中产生的信息 , 与图书相似 , 专利信息量大 、 变化大 , 基础信
23、息不断产生 ; 但专利与图书不同的是 , 除了基础信息 , 法律信息 、 法律状态 、 国外信息的延伸外溢 、 质押等始终都在变化 , 而 且 , 专利文献资料的实时性和准确性超过一般的图书和档案资料 。 所以在专利的信息收集工作中要注意信息收集的全面性和系统性 , 并注意信息的及时更新 。 同时要注意失效专利信息的收集 。 失效专利包括失效专利和失效专利申请两部分 , 专利信息是一种十分重要的科技信息资源 , 是广大科研人员和科技情报工作者在科技查新中经常需要检索的重要参考资源 , 而失效专利信息是 专 利 信 息 中 特 殊 而 又 具 有 非 常 高 的 开 发 利 用 价 值 的 一
24、部 分 , 是 待 开 发 利 用 的“ 金山 ” 。利用好失效专利,可以使科学研究少走弯路,避免走重复路,是站在前人肩膀上进行再创造的有效途径 。4专利信息由国家专利局 、 法院等政府和司法部门以及个人提供 , 在信息录入时保证信息的真实完整 , 配备专门的软件保证相关信息的及时更新和自动录入。3.完 善 利 用 制 度 , 基 于 信 息 提 供 者 的 功 能 建 立 专 利 信 息 层级 利 用 体 系 专利信息数据库信息服务的提供者不仅有政府 , 还有行业协会 、 联盟以及纯商业化运作的信息服务机构 , 这些信息服务机构按照市场化模式运作 。 基于这些信息提供者提供信息服务的功能,结
25、合用户需求,制定不同的利用服务制度 , 具体来说,即建立起三级金字塔式利用体系。 首先 , 是底层的基础性服务平台 。 这一层服务平台是由政府主导的公共服务平台 , 为公众提供无差别的公共信息服务 , 主要是针对一般的查询利用者 。 在这里用户可以查询到他们所需的一般性信息 , 供公众了解我国专利的发展历史和现状,了解各领域发明创造的成就。 其次 , 是中层服务平台 , 由政府和各行业协会 、 联盟提供专利信息 , 建成介于 公 共 服 务 和 市 场 化 之 间 的 各 行 业 或 产 业 的 专 业 数 据 库 , 由 行 业 中 部 分 企 业 承担其开发利用费用 , 所以其中的信息会收
26、取少量的费用 , 但费用的标准如何确定仍有待商榷。再次 , 是顶层专业化和高端化服务平台 , 这一平台实现完全的商业化 , 主要面向对专利信息的组织和管理要求较高的专业性人员。其基础数据由政府提供 ,商情 、 诉讼等数据以及专利数据进行深加工和信息深度挖掘后向用户提供专业个性化的增殖信息服务 。 做好增殖信息服务时 , 要考虑市场的需求 , 充分发展市场化 功 能 。 目 前 国 外 做 的 比 较 好 的 收 费 专 利 数 据 库 如 STN、 Dialogue, 其 中 STN以其拥有世界上最完全的科技信息而著称 , 它收录了多个国家和专利组织的专利数据库 、 某一主题范围的专利数据库等
27、 , 以其完备的检索手段和优秀的专利服务 ,为我们专利数据库的建设提供了有益的借鉴经验。 3.4提 高 利 用 服 务 水 平 , 形 成 人 性 化 的 利 用 服 务 体 系提高利用服务水平 , 要从改进服务手段 、 提高服务人员综合素质等多方面着手,以人性化的利用服务面貌满足利用者的需求。 3.4.1采取有效措施,提高专利信息的查全率和查准率查全率和查准率是评估检索效果的两个重要技术指标 , 二者是相背的 , 提高了查全率就会降低查准率 , 反之亦然 。 因此 , 如何同时提高查全率和查准率成为了数据库建设中的一大难点 。 笔者认为 , 可以在数据库中采用文本自动分类和聚类技术 , 将收
28、集到的电子文档分别纳入不同的专题数据库中 , 5对数据进行深度挖掘 , 并在投入充足人力物力的基础上 , 对数据进行深度加工和标引 , 以提高查全率和查准率。 3.4.2引入多种搜索技术,实现检索途径的多样性专利是一类具有特殊使用需要和自身特性的重要信息资源 , 通过网络获取感兴趣的专利线索及相关专利的原文资料 , 是一些网络用户比较关心的问题 。 搜索引擎是 网站建设中针对 “ 用户使用网站的便利性 ” 所提供的必要功能 , 同时也是“ 研究网站用户行为的一个有效工具 ” 。高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品 /服务的销售,而且通过对网站访问者搜索行为的深度
29、分析,对于进一步制定更为有效的网络营销策略具 有重要价值 。 专利信息数据库建设中可以引入多种搜索技术 , 如图片引擎 , 将外观设计等的图片与之相连 ; 全文索引 , 可将全文专利数据库相合 ; 垂直搜索引擎 , 检索特设专题专利数据库中信息等等,达到充分提高检索效率的目的。 3.4.3采用统计分析工具,形成专利分析技术平台专利分析法是指对有关的专利文献进行筛选 、 统计 、 分析 , 使之转化成可利用信息的方法 。 6通过专利信息分析 , 企业可以在对所需的专利信息进行研究后 ,制定相关企业技术战略、评估竞争对手、实施反竞争手段。为了迎合企业需求 ,提供高端化的信息服务 , 数据库在建设中
30、应配备专门的信息分析统计工具 , 在建成专利检索数据库的基础上 , 通过使用现有定量和定性分析的方法 , 自主研发专利数据统计分析的专用软件工具 , 形成独特的专利分析技术平台 。 同时 , 采用综合性集成平台技术,向用户提供云服务,满足用户个性化需求。 3.4.加强人员素质建设,提高服务能力态度决定一切 , 要做好专利信息数据库的服务工作 , 工作人员必须首先有以利用者为上帝的工作态度 , 围绕利用需求开展自身工作 , 以认真的工作态度和饱满的工作热情做好信息服务工作 。 有了良好的工作态度 , 还要有扎实的工作能力 。数据库作为高新技术产业 , 需要从业人员具有较强的专业知识和技术 。 除
31、此之外 ,作 为 专 利 信 息 数 据 库 的 工 作 人 员 , 还 要 具 备 专 利 和 相 关 法 律 等 方 面 的 知 识 和 能力 , 以及市场调查能力和综合管理能力 , 以及时了解用户需求 , 实现对数据库的高效管理 。 所以 , 除了在起初人员选用时讲究与专利信息数据库建设和管理相关的专业 , 诸如软件开发 、 信息系统管理 、 知识产权等专业人员以外 , 还要对工作人员进行定期培训,使他们永远跟随专利数据库的发展时代潮流和发展要求 , 在工作中培养适应时代发展的能力 , 掌握数据库建设的现状和未来 , 及时对数据库中相关硬件和软件进行有效的更新和在此基础上的发明创造。专
32、利 信 息 数 据 库 建 设 涉 及 各 个 方 面 , 将 浩 瀚 复 杂 的 专 利 信 息 进 行 科 学 整 理后 , 以便捷的检索利用方式和友好的界面提供给用户 , 需要政府 、 商业专利服务机构和数据库工作人员各方面的努力。 参考文献:1晋 超 ,韩 学岗 .国 内专 题专 利数 据库 的现 状特 点及 发展 建议 J.山 东化 工 ,201(9):212李 宏芳 ,邹 小筑 .中 国专 利数 据库 标引 质量 测评 J.现 代情 报, 201(2):583吕 波 .整 合专 利信 息资 源, 构筑 专利 服务 平台 J.中 国传 媒科 技, 204(5):344东 南大 学图 书馆 编 .书 林望 道 M.南 京: 东南 大学 出版 社, 208:2755苏 新宁 等编 著 .数 据仓 库和 数据 挖掘 M.北 京: 清华 大学 出版 社, 206:256孙 守迁 主编 .设 计信 息学 M.北 京: 机械 工业 出版 社, 208:145