当前位置 :

对开源情报工作的思考与建议

2018-09-06 知远战略与防务研究所 副研究员/蔡丛华(海洋安全战略分析与评估中心)访问次数:

什么是开源情报?

1992年,曾担任美国海军陆战队情报官的戴维·斯蒂尔(David Steele)在《Whole Earth Review》杂志中发表了题为“E3i:Ethics,Ecology,Evolution,and Intelligence”的文章,公开提出了要重视“情报共享和开源情报”,而自9.11事件之后,针对恐怖分子隐藏于社会人群之中而呈现出的不可见性、不确定性特点,美方更加重视“开源情报”的作用。但正如《开源情报研究:理论与实践》手册(知远战略与防务研究所李健所长编写)中所阐述的那样,“开源情报是一个情报门类”,实际上它由来已久,发展的过程则与信息的流通程度紧密相连,古时各国的政情、社情、民情甚至军情的大量公开信息往往是靠“间”(谍报人员)去实地居住较长时期,通过考察、观察、道听途说等方式来获取,而现在则可足不出户利用开放的“互联网”、公开出版物、电视广播等途径来获取。

开源情报,英文为open source intelligence,顾名思义,就是从公开的或开放的来源、资源(open source)得到的情报。情报是为特定对象(客户)服务的,比如政治情报、经济情报、商业情报、技术情报、军事情报等等,许多人总会认为情报是通过某些秘密的特殊途径获得的,而各种关于情报战的影视剧、小说等更是将其神秘化,加深了大众对此的印象。因此,人们往往认为只有通过惊心动魄的秘密手段获取的一张纸条或是一幅图才能发挥巨大的情报作用(殊不知也可能获取了假情报),而公开的、众所能知的信息则是无关紧要且毫无用处的。既然是大家都可以获取的信息,又能有什么用处呢?

实际上,这种认知是错误的,情报是针对特定对象(客户)的,之所以称之为特定对象(客户),是因为他只需要对其有用的某一特定方面的信息,只要能在公开的、众人皆知的信息中综合分析出特定对象(客户)所需要的某一特定方面信息,那么这个信息对该特定对象(客户)而言就是情报,它所发挥的作用与通过秘密的特殊途径得来的情报是相同的。获取途径的不同,决定了风险和代价,显然,通过综合分析公开信息而得到的情报所带来的风险和代价相对而言是非常小的,而这也正是从事开源情报工作人员的价值之所在。

开源情报工作的三个层次

根据获取信息和转化为情报的进程,我认为,可将开源情报工作区分为呈递进关系的三层,即搜集开源信息、整理情报信息、获取开源情报。

开源信息,即是来自于公开的或开放的源头、资源的信息,这里的源头、资源包括但不限于互联网、公开出版物、电视广播、宣传公告等,公开的或开放的信息指的是信息所有者主动或自愿公布的信息,从理论上讲某个黑客通过技术手段获得信息所有者不愿公开的信息并将其公布,那么这类信息也应该算是开源信息,当然,我们不提倡这种黑客行为;

情报信息,则是指对所获取的开源信息根据某类主题或内容以某些准则进行分门别类而形成的信息集,或者称之为情报信息数据库,这里的信息还是原始的开源信息,但是已经合并同类项了,具有了较好的参考价值和一定的情报功用。实际上,扑面而来的海量未处理信息反而会干扰决策或使人束手无策。大家都知道现代社会已经是“信息爆炸”时代,无论登陆网站还是打开手机,总会有各种各样的信息充斥其间、纷乱繁杂、令人目不暇接,但是这些信息很快就会消亡不见,大量繁杂的信息散落在网络的各个角落,这就需要我们去挖掘、搜集、积累和整理;

开源情报,就是根据特定对象(客户)的需求,基于开源信息,更多的是基于情报信息,经过综合分析和研究而得到的成果,体现形式以研究报告或技术报告为主,对于独立从事开源情报工作的单位或个人而言,因为特定对象(客户)存在着多样性和不确定性,既可能有明确的情报需求,也可能面对不确定的情报需求。对于明确的情报需求,搜集信息和研究的针对性强,但通常要求较高,可将其称之为被动型开源情报研究,更多的则是面对不确定的情报需求,这就需要研究特定对象(客户)的类型及可能需求,再有针对性地进行搜集信息和研究,以形成优质情报成果来吸引相关特定对象(客户)的关注和购买,这可称之为主动型开源情报研究。

开展开源情报工作的四个关键环节

由此,我认为开展开源情报工作需要抓好以下几个方面的关键环节:

一是确定研究主题。所有的研究工作必须围绕着某个主题而展开,面对着浩如烟海的信息,离开了一个明确的主题就会变得无从下手。而这个研究主题,我认为无非有三类:第一类,任务型研究主题,通常是有明确的特定对象(客户)以及明确的情报需求,以合约的形式来确定研究内容及时限,这对研究工作的要求较高;第二类,需求型研究主题,通常是独立从事开源情报工作的单位和人员主要采用,没有明确的特定对象(客户),但针对某些特定对象(客户)的可能情报需求来确定研究主题,互联网上以智库、微信号、百家号等名义主动发布的许多研究成果(对其他研究者而言这些也都是开源信息),实际上就属于这一类,采取这种方式既能显示自身的存在也能吸引潜在特定对象(客户)的关注;第三类,兴趣型研究主题,通常是自身具备相关专业方向研究能力的研究人员采用,他们能够充分发挥自身专业优势来选择具有优势的或具有较大影响力的研究主题,因为感兴趣而更能专心致志地完成。与体制内情报工作者不同的是,对于独立从事开源情报研究的工作者而言,不管是哪一类研究主题,确定的时候都必须先问一个问题:它的市场在哪里?也就是说,研究成果最终将为谁所用?能不能用?怎么用?研究成果只有应用于特定对象(客户)时,才能称之为情报。当然,对于特定对象(客户)是否使用了我们也无法实际确认,只能以是否出资购买为标志。否则,它就只能束之高阁或者成为别人参考的研究资料(开源信息)而已。

二是善于运用信息搜索手段。随着互联网的快速发展,利用互联网从事开源情报工作已经成为主流,传统的公开出版物、电视广播、新闻媒体等所承载的大量信息基本上都会镜像到互联网之内(只不过成了收费信息),而各类网站、社交媒体也急剧拓展了互联网所蕴含的开源信息量,这已经成为一个取之不竭、用之不尽的“无底洞”,对于独立从事开源情报工作的单位和个人而言,这是福音,但也是考验,关键在于如何去发现和搜集对自己研究有用的信息,应善于运用信息搜索手段,包括搜索引擎和搜索关键字。搜索引擎,目前可以说是多种多样的,搜网(http://www.sowang.com/link.htm)介绍了多达47个类别的搜索引擎,各个类别下面又有几种至十几种搜索引擎,这之中网站已经整理出了一些专业性搜索引擎,比如音乐、视频、电影、旅游、图书、论坛等等,供大家根据需要选择,我的建议是不要怕浪费时间,每个搜索引擎都试一试,采取淘汰法把自己觉得关系不大、使用不便、搜集能力弱的过滤掉,把搜集能力强、信息广泛、运行速度快的保存下来作为常用,把关系较为紧密、专业性较强、工作可能会使用的保存下来作为备用,比如,百度搜索(https://www.baidu.com/)、360搜索(https://www.so.com/)、搜狗搜索(https://www.sogou.com/)、雅虎搜索(https://sg.yahoo.com/)、维基搜索(https://en.wikipedia.org/)、必应搜索(https://cn.bing.com/)等等。搜索引擎相对而言属于固化工具,而搜索关键字则更能体现出个人的使用特点,同一个关键字通过不同的搜索引擎会呈现出不同的搜索信息序列和内容,不同的关键字通过同一个搜索引擎进行搜索也会呈现出不同的信息序列和内容,可见,关键字的选取是非常重要的,使用关键字搜索必须有不厌其烦的精神。

三是要有信息辨别比对能力。这是独立从事开源情报工作的一项必备能力,过去有人讲指挥员由于缺乏信息导致决策不当而打了败仗,现在则有人讲指挥员由于信息太多导致无法决策,仍旧会打败仗。基本原因就在于指挥员对信息进行辨别比对的能力。这就牵涉到了开源信息所面临的两个核心问题——准确性和时效性,它可能也是导致人们对开源情报抱有怀疑态度的一个重要原因。尽管互联网上的信息鱼龙混杂,但是,真实信息也是大量存在的,比如政府类网站信息、军方网站信息、企业网站信息、院校网站信息等等,对于同一条信息进行多渠道比对通常是能够辨别其真伪和有用程度的,对于网上许多主动发布的研究成果,我建议除了浏览一下基本观点之外,更需要关注的是一些举例类内容和索引,因为把举例类内容通过其他渠道进行进一步核实(比如新闻信息、政府网站信息等),往往就能得到比较真实的信息;而根据索引按图索骥往往能得到该信息的源头并进行拓展,以此也往往能得到自己想要的信息。

为了提高信息的准确度,也可采取多方论证的方式,比如对于地理信息,光有卫星图显然是不够的,采用卫星图、地形图、实景图(照片)等进行综合比对,通常来说就已经能够较为真实地反映出某一区域的实际地理特征。从信息发布的时间而言,开源信息基本上都是过去式,因此追求开源情报的时效性意义不大,开源情报更注重的是综合性和全面性,但这并不意味着对于所获取的信息不讲时效,判断一条信息的有用程度,既取决于其发布的渠道和源头,也与其发布的时间紧密相关。我的建议是,对于搜集到的每一条信息,既要注明其发布的来源也要注明其发布的时间,然后再进行比对和取舍。

四是边研究边积累。能够基于综合性大型情报信息数据库开展工作,这可能是所有独立从事开源情报工作人员的热切期望,但往往很难实现。在从事某一主题研究的过程中,实际上会接触到大量的信息以及信息源头(包括网站、博客、微信号、个人主页等等),尽管这时所浏览到的大量信息可能与本主题没什么关系,但是说不准可用于后续研究的主题。我的建议是尽量保留自己觉得有用的信息,逐步积累,时间长了就能建成自用的小型数据库;此外,对于研究过程中所搜集到的与某一主题相关的信息,必须积累,分门别类、归档综合。信息积累很重要,但我认为对于包括网站、博客、微信号、个人主页等等信息源头的积累则更为重要,只要某条有用信息在此类信息源头出现过,就应该对该源头进行深入挖掘,看看是否隐藏有更多信息,如有,即将其分门别类保存下来,那么对于每一个或每一类保存下来的信息源头,实际上就成为了今后工作中可用的小型情报信息数据库。

[责任编辑:huangxx]

共1条记录/1页  
[收藏]