对于本文的研究流程大体分为四个步骤:第一,比较语料库所生成的关键词。笔者选取布朗语料库作为参照的此表,分别生成小型语料库以及观察语料库,然后根据生成的语料库生成相应的主题词,对其进行排序,选择其中的前十名进行比较,由此可以得出西方新闻报道中的关注点;第二,分析叶诗文(Ye)单词的前后相搭配的词汇,对生成的关键词进行观察,小型语料库和观察语料库的第一个关键词都要是“Ye”;第三,本文所构建的语料库的中心就是叶诗文游泳夺金事件,以此作为关键点,搜索相关的文本,因此,研究中以“Ye”作为搜索的关键词,计算出“Ye”左右大约5个单词范围的相关词汇搭配,并分析这些相关搭配词汇的具体内涵;最后,对于小型语料库与观察语料库中关键词表中差异最大的单词doping(服用兴奋剂)前后相关词汇的搭配进行分析。在前几个步骤的分析中,本文发现小型语料库与观察语料库中差异最大的单词就是观察语料库中的doping(服用兴奋剂),所以再将doping(服用兴奋剂)作为搜索的关键词,对其进行搜索,观察doping(服用兴奋剂)是否与叶诗文(Ye)的关系较为密切。语料库检索的主要的目的就是导出索引行,方便我们对于语义相似的单词进行观察,找到这些单词中的规律。本文在研究的过程中,导出“叶诗文(Ye)”和“doping(服用兴奋剂)”两个单词作为检索词的索引行,其主要的目的就是通过观察可以发现有关报道中相关词汇的含义。