< 返回
百度:电子政务信息共享解决方案

而电子政务的重要性是因为政府信息化是经济信息化和社会信息化的桥梁,因此政府信息的共享程度直接影响到整个社会在信息化过程中信息共享和深入利用的程度,更直接决定了信息化的发展深度和应用程度。

产品简介

百度电子政务信息共享解决方案由专网/内网信息共享平台和政务信息门户共享平台两大部分组成。专网/内网信息共享平台是为政府专网和各级政府机构内网内的大量信息提供信息采集、整合和共享应用;政务信息门户共享平台则是通过对相关政府网站的垂直采集检索,为广大人民群众提供某一地区或行业的各级政府网站信息共享平台,让普通用户访问该共享平台,即可方便的获得他所需要的各级政府的各种公开信息资料。

百度电子政务信息共享解决方案以百度先进的信息整合处理技术为核心,为政府内网和政府信息门户建设高性能信息共享平台,能够将相关地区、机构、组织等多种信息源的信息集中共享,让用户在一个地方即可获取到所需要的各种相关信息,使电子政务由“形象工程”变成“效益工程”,有效提高政府工作效率,大幅提升政府威信和公众形象。

功能特点

强大的信息采集能力

百度电子政务信息共享解决方案是以百度全球第一中文搜索引擎的先进搜索技术为核心,并针对专业用户 所要求的搜索深度深、采集精度高和抓取速度快等进行了专门的优化,不仅能够采集大量丰富的网络信息,还可以采集企事业单位内网的指定文件服务器或共享文件夹中的多种文档信息资源。同时,针对国内政府机构的网络安全保密要求,能够在绝对物理隔离的网络环境中进行内外网信息的采集整合。

安全的信息浏览

百度电子政务信息共享解决方案为用户提供安全可靠的信息浏览方式,可以通过设置用户权限来控制每个用户所能浏览的信息内容。并能够在绝对物理隔离的网络环境中,满足内网用户不用访问外网,即可安全浏览丰富的互联网信息。确保了网络的保密性、安全性和信息丰富性的统一。

准确的自动分类

百度电子政务信息共享解决方案具有灵活准确的自动分类模块,不仅能够根据关键字、布尔逻辑,以及来源等多种信息属性进行自动分类;更采用了先进的knn和svm算法的自然语义智能自动分类。用户可以单独使用关键字分类系统或自然语义智能分类系统,或者将二者组合使用,既能提高分类的准确度,使用起来也更加方便灵活。

全面的检索功能

百度电子政务信息共享解决方案秉承百度全球第一中文搜索引擎的优秀检索功能和性能,为用户提供强大丰富的检索功能。如完全支持布尔逻辑检索、支持n阶渐进检索、支持同义词检索、支持自定义用户词典等,并可以由系统管理员人工过滤不当网页,为用户提供最为适当的检索结果。

丰富的检索结果展示

百度电子政务信息共享解决方案为用户提供丰富的检索结果展示,能够根据不同政府机构的不同风格与要求定制结果显示模版。检索结果包括智能动态摘要、独有的网页快照,以及多种检索结果排序方式等。能够极大的方便用户对检索结果的浏览查看,提高用户对检索效果的满意度。

基于web的系统管理平台

百度电子政务信息共享解决方案采用标准的b/s架构,系统管理员可以随时随地通过浏览器登陆web的图形管理界面对整个系统的各项功能进行管理和系统维护,操作简单易用,无需专业培训即可迅速上手。

系统架构

百度电子政务信息共享解决方案由信息采集模块、索引模块、网页快照模块、分类模块和发布模块等诸多功能模块组件构成。各模块间通过规范的数据接口相联系,但又相对独立。

信息采集模块

信息采集模块包括spider组件和file组件,分别负责网络信息采集和文件系统信息采集。

spider组件:spider组件用来将internet/intranet的信息导入信息库,它采用分布式的三环架构,包括内容抓取模块(crawler)、超链提取模块(extract center,简称ec)和分发中心(distribution center),其中crawler 和ec均支持多线程,分发中心则负责将内容分发至索引模块、cache、发布模块或数据库系统等。

file组件:file组件用来采集内网文件系统中的多种文档信息,目前支持基于ms windows和linux两大操作系统的多种文件系统,包括fat32、ntfs、ext、ext16、ext32等。支持的文档类型包括.txt、.rtf、.pdf、.doc、.ppt和.xls等。

索引模块

信息索引模块负责将采集模块所采集的各种类型的信息内容进行解析,并建立索引供用户快速检索查询之用。

第一次创建索引:由信息采集模块对信息源进行提取,将提取获得的信息传送给信息索引模块对获得的数据信息进行快速索引,建立硬盘索引。并在建立好硬盘索引的基础上,启动检索服务,用户即可开始对信息进行检索。

增量式实时索引:百度电子政务信息共享解决方案对不同的信息源采用不同的实时同步机制,将其捕捉到的信息的变化(增、删、改)立即传送给信息采集子系统,该系统经过格式标准化后(xml)提交给信息索引进行即时内存索引,使信息一旦被采集到即可被立刻检索到。

内存和硬盘索引:索引由两部分组成。一部分是内存索引,用于对实时数据进行索引。一部分是硬盘索引,用于对历史积累的大量数据进行索引。检索工作有由两部分索引共同完成。信息索引模块根据数据库更改情况、用户的检索情况,选择合适的时间完成将内存索引向硬盘索引的合并。

用户检索的响应:当用户提交一个检索时,该检索经过检索请求接口后,在内核中由内存实时索引检索和硬盘索引检索共同完成。检索的结果通过检索响应接口提交给用户。

网页快照模块

百度wst独有的网页快照模块能够在本地保存网页被采集时的内容,正如该网页被用照相机拍下一幅快照一样,所以称之为网页快照。通过网页快照能够提高网页访问速度,用户通过浏览网页快照即可在本地快速浏览网页内容。而且在原网页无法访问的情况下,同样能够通过网页快照了解网页信息。

分类模块

百度电子政务信息共享解决方案具有关键字分类和自然语义智能分类两种分类机制,可提供灵活准确的分类结果。用户可以选用其中一种分类机制,或者将两种组合使用。

关键字分类:关键字分类是以用户设置关键字为基础,可运用布尔逻辑建立关键字规则来实行分类。该分类机制分类速度快、效率高、使用灵活,不需要事先进行机器学习等文本训练,关键字设置完成后即可直接使用,并能够随时进行修改调整,修改同样立即生效。

自然语义智能分类:百度wst采用以knn和svm两种算法为基础的自然语义智能分类机制,能够通过学习一定数量的训练范本进行制定类别的自动分类,经过测试,准确度可达85%以上。

发布模块

百度电子政务信息共享解决方案可让政府内网用户在内网即可浏览采集分类后的各种信息内容,包括网页所附的图片等,而无需访问外网,确保了内网的安全性的同时也丰富了内网信息内容,满足内网用户的信息需求。

静态页面发布:百度wst为了适应大规模用户使用条件下的高访问量和高速度,采用了动态和静态发布相结合的方式。系统根据用户设置,自动将一定数量和主题下的信息发布为静态页面,并定时自动更新。以提高用户对常用页面的访问速度。

动态页面发布:对于非经常访问的页面,百度wst采用动态发布机制,减少数据资源占用,提高数据访问效率和系统效率。

权限控制:百度wst的发布模块具有权限控制功能,不同用户不同的权限能够看到不同范围的信息内容,适应组织内权限级别的要求,保证信息的安全性。