首页

热门导航

当前位置：首页 > 软件 > 网络信息与安全 > InteDRC eInfo网络情报搜索处理系统网络信息与安全

< >

InteDRC eInfo网络情报搜索处理系统网络信息与安全

更新时间：2023-02-21 21:32:26

天喻文档权限管控系统(DocumentRightControl:InteDRC)用于管理和控制文档的权限，某些文档只能某些人以一定的权限使用，可以防止用户泄露企业的技术资料。文档权限管控系统InteDRC由两大部分组成：管理端和客户

价格：: ￥ 立即询价

型号：: eInfo网络情报搜索处理系统

正版保证：: 原装正品

品牌：: InteDRC

质保服务：

货期：: 现货

产品状态：: 成熟产品

发票类型：: 含13%货物增票

产品类型：: 标准规格

物流费用：: 包运费

品牌属国：: 欧美品牌

支付方式：: 公对公付款 公司支付宝

服务区域：

适用场景：

采购提示：为了快速获取报价，请提供准确产品型号、规格。操作如下：

A、查看原购销合同里的产品型号、规格

B、确认实物标签上的P/N号（可以拍照直接提供）

规格：: 0.00元

1台可销售

扫一扫，分享到手机

InteDRC

品牌更多产品>>

品牌介绍

相似商品

产品详情
产品视频
采购说明
常见问题
售后说明
商品评价
资料下载
技术支持

1 建设意义

近年来，随着互联网技术的发展与互联网信息市场的不断完善，网络的功能和网络信息内容发生了急剧的变化。由于网络媒体的交互性、内容的开放性、传播主体的开放性、跨时空等特点，网络已经成为信息交流和信息服务的平台。

借助于互联网通道，采用新的技术手段，对网络上的竞争情报信息进行监测，就可以了解行业生存特点，挖掘情报内涵，从而辅助决策。

我公司采用自主研发的搜索引擎技术、多格式文件内容提取技术、多语种分词分析技术、特征信息挖掘、语义分析、人工智能分析、模式识别、神经网络、海量全文数据存储管理、情报专题推送、分布式系统均衡调度等技术，对互联网上的情报，自动搜索、自动定位、自动分析、自动关联、主题检测、专题聚焦，实现用户的情报监测和专题追踪等信息需求。

2 业务处理功能

2.1 情报采集

2.1.1 采集的范围

可从如下10类情报表现形式中采集情报：

网站或网站频道
在线数据库
网络专题
网络评论专栏
网络即时评论或跟帖
网络论坛言论
博客
帖吧
点击排行
聚合新闻(RSS)

2.1.2 采集的情报类型

类型	文件格式说明
网页文件	html、dhtml、shtml、javascript文件等。
CGI程序执行结果	ASP程序结果、C#程序结果、PHP程序结果、JSP程序结果、Servlet程序结果、C/C++程序结果等。
MS Office文件	Word文件、Excel文件、PowerPoint文件、Visio文件、Outlook文件。
OpenOffice文件	odt文件档案文件、odp简报文件、ods计算表文件、odg图形档案文件、odb资料库文件。
PDF文件	pdf文件。
其它文本格式文件	文本文件、RTF文件、xml文件、java文件等。
图片文件	jpg文件、gif文件、png文件、bmp文件等。
多媒体文件	mp3文件、midi文件、wav文件等。
压缩文件	gzip文件、bzip2文件、tar文件、zip文件、jar文件等。

2.1.3 采集的情报语种

可采集如下11个语种的情报信息：

中文、英文、日文、俄文、德文、法文、韩文、希腊文、捷克文、巴西文、荷兰文等。

2.1.4 采集的智能化

（1）可直接接入互联网采集，也可穿过代理服务器采集。

（2）可分析并处理WEB页重定向的问题。有的网站是在WEB服务器如IIS进行设置重定向的地址，有的则是在首页文件中，使用javascript进行网页重新定向。

（3）可以分析并处理Unix/Linux网站下文件重定向的问题。

（4）可以处理部分网站的花招，自动过滤网站为搜索引擎准备的垃圾信息。有的网站为搜索引擎准备了广告信息、或垃圾信息、或提示禁止搜索的信息等，本系统可模仿正常访问有效避免。

（5）可以突破部分网站的用户名和密码，搜索其内部网页。

（6）可以穿透部分硬件防火墙，同时，防止IP地址被硬件防火墙锁定。

（7）可以分析处理采用网页框架的网页。可以从网页文件、JavaScript程序段中，自动寻找网页链接。对不能分析的复杂的程序，可搜索下载这些程序，以便对搜索程序改进升级。

（8）网页表单是WEB应用程序收集用户真实数据的主要方式。表单允许用户输入信息到不同控件，然后将这些结果提交给WEB服务器，本系统就可以模仿用户自动填写表单，以获取更多的信息。

（9） Cookie使WEB服务器可以标记认可的用户，从而可以标识同一用户发送的后续请求，这样就可以有效地处理页面之间的用户认证问题。

（10）可自动进行排重处理，避免重复搜索，以提高搜索效率。

（11）可搜索IPv4协议的网站，也可搜索IPv6协议的网站。

2.1.5 采集的调度

（1）自动检测采集工作站、自动分配任务、自动均衡性能。

（2）集群中有多台采集工作站运行。

（3）每台采集工作站有多个任务执行。

（4）每个任务有多个线程实施。

（5）在搜索过程中，如果网络出现短暂故障，搜索程序自动判断并自动恢复运行。

（6）可断点续搜。

（7）可全新搜索，也可以增量搜索。

采用集群采集的好处是：

（1）保证了网络读写、CPU运行、磁盘存储、信息处理的最优配合。

（2）多线程可以避免采集工作站长时间的网络等待。

（3）多线程避免了由于程序错误而导致的整个系统崩溃退出，增加了系统的稳定性。

（4）满足超大型业务的处理需要。

2.1.6 采集的性能

在网络速度够快的情况下，单台采集工作站每天可采集259万个网页。

2.2 情报加工

2.2.1 自动分类

根据系统定义的情报分类，将搜索的信息自动归属到该情报分类下。

2.2.2 自动过滤垃圾信息

在网页上，有两部分内容:一部分是网页的主题信息,另一部分是与主题内容无关的导航条、广告信息等内容,我们称为噪音信息。为提高信息质量，必须过滤掉噪音信息。

2.2.3 自动提取文档内容

（1）能分析出网页标题和网页内容。

（2）能分析Word文件、Excel文件、PowerPoint文件、Visio文件、Outlook文件、XML文件、HTML文件、PDF文件、文本文件、RTF文件、Java文件、ZIP压缩文件、BZip压缩文件、GZip压缩文件、TAR压缩文件、MP3文件、MIDI文件、WAV文件等格式文件的内容。