下文将通过开放原始码情报 (Open Source Intelligence) 这一经典案例来做说明,示范如何在Micro Focus IDOL中使用大量已索引的非结构化数据追踪 COVID-19新型冠状病毒的传播。 1,使用Coronavirus关键字 在展示环境中使用Coronavirus (新型冠状病毒) 这个关键字,IDOL便可以在索引的资料库中迅速找出它觉得重要的概念并进行分类。这些资料会以主题地图 (Topic Map) 的方式显示,以便分析人员看到特定主题所有相关数据的快照。 2深入分析详细资料 选择coronavirus cases (新型冠狀病毒病例),IDOL会显示新的主題地图,为分析人员提供更深入的相关资料: 深入分析详细资料 选择Confirmed cases (确诊病例) 后,会出现实时搜索结果。只要点击两下,IDOL便会将2,200万个文件内的数据整合成1,519个档案,并按照日期排列(也可以按照相关性搜索),如下图所示。 从主题地图可以看到南韩已被列为确诊病例的重要国家。若选择South Korea (南韩),搜索结果会缩减至577个档案。以下是搜索democratic values failing in the midst of virus outbreak (民主价值在病毒爆发期间的挫败) 与tourism (旅游) 出现的文件快照。 这正是Micro Focus IDOL的过人之处。它能根据预先设置好的类别来排列文章群组,而其中一个是医疗保健类别。如果按照医疗保健类别 (health category) 筛选,搜索结果会缩减至56篇文章。原本我们的资料库内有2,200万篇文章,现在只需要看56篇文章。 显示在最上方的搜索结果包含了南韩新型冠状病毒确诊病例数的信息 (按日期而非相关性排序)。这就是在本次示范中得到的最新结果,当时南韩新型冠状病毒的确诊病例数增加了476例。将搜索结果储存为Coronavirus (新型冠状病毒) 资料集,就能看到与南韩新型冠状病毒确诊病例相对应的文件趋势。如下图所示,在过去24小时内,与南韩新型冠状病毒确诊病例有直接关联性的文件数量大幅增加。
|
上海望驰安防科技有限公司
地址:上海市浦东灵山路958号5号楼2楼
手机:18049824972
电话:021-50150593
邮箱:sales@ruitde.com