一系列计算完成对预处理后的原始文本实现初步分析。
内容选择是对经过计算权重后的文本单元(即经过步骤Ⅱ权重分析过的文本)选择相应的文本单元子集组成摘要候选集,可根据要求的摘要长度、线性规划、次模函数、启发式算法等选择文本单元;
内容组织是指对候选集的内容进行整理形成最终摘要,可根据字数要求按顺序输出,也有研究者提出使用基于语义信息、模板和神经网路学习的方法来产生符合要求的摘要。
从技术框架的这几个层次的对应描述来看,可以看出无论是权重计算还是内容选择抑或是内容组织此三者都是很重要的。
如果搞不定权重计算和内容选择的话则根本搞不清楚摘要的时候具体对文本哪些地方进行摘要。
如果搞不定内容组织的话更是直观影响用户体验。
在这种情况下,这个时空的人们在进行自动文本摘要方面的研究时也确实是比较重视自动文本摘要的权重计算、内容选择和内容组织这三个方面。
曾经,按照伊芙·卡莉的思维,她是很不理解林灰为什么会对《文本判断甄别比较的一种新方法》这样一个侧重于内容表示的专利很感兴趣的。