1)第105章 没有低级的专利_穿越黑龙江1940
字体:      护眼 关灯
上一章 目录 下一章
  第105章没有低级的专利

  伊芙·卡莉虽然一时有点难以接受这个事实,但她很快将心情平复下来。

  无论是零和博弈也好,还是非零和博弈也罢。

  虽然在和LINHUI的竞争中她们团队落败了,但她输的心服口服。

  LINHUI的算法无论是在实际表现效率上还是算法理论上都是碾压式的领先,而不是领先一点半点。

  如果只领先一点半点,那或许是侥幸而已,但碾压式的领先则意味着无法质疑的实力差距。

  对此伊芙·卡莉认识的很深刻,LINHUI提出来的生成式摘要算法甚至开创了一些前所未有的细分领域研究。

  比较容易知道的全新细分领域有自然语言处理的情感分析。

  这个方向对于以前只进行过抽取式文本摘要研究的伊芙·卡莉来说是个全新的课题。

  但这远远不是全部,LINHUI提出来的生成式摘要算法应该还会涉及很多开创性的东西。

  但由于管中窥豹的原因,伊芙·卡莉暂时还不清楚LINHUI的算法具体涉及到多少开创性的研究。

  虽然不清楚具体涉及多少个全新细分领域。

  但伊芙·卡莉凭借科研人的直觉,LINHUI的算法保守估计要涉及到五六个开创性的细分领域研究。

  然而也正是因此,让伊芙·卡莉很不理解。

  明明LINHUI的算法领先那么多,为什么还要寻求很多“低级”专利的收购呢?

  伊芙·卡莉看了下专利网站上LINHUI灰谋求收购的那几个专利。

  似乎都很“低级”的样子。

  说到低级和高级之分,专利本身拿出来并没有低级和高级的分别。

  但在一个研究体系中却因负责的分工不同所处的层次不同会出现低级和高级之分。

  在LINHUI提出了生成式文本摘要算法之后。

  现在的自动文摘实现方法主要分为抽取式方法和生成式方法。

  经过近期对生成式摘要算法技术路线的研究伊芙·卡莉已经能够很容易的理解生成式文本摘要和传统抽取式文本摘要的区别。

  所谓的抽取式摘要是从原始文档中提取关键文本单元来组成摘要。

  而生成式摘要则是根据对输入原始文本的理解来形成摘要,生成式摘要模型试图去理解文本的内容,可以生成原文中没有的单词,更加接近摘要的本质,具有生成高质量摘要的潜力。

  虽然这两者在具体摘要上略有区别,但此二者本质上都是自动文本摘要。

  既然二者都是自动文本摘要,那么这两者的技术框架就都可以概括为:

  内容表示→权重计算→内容选择→内容组织。

  Ⅰ内容表示是将原始文本划分为文本单元的过程,主要是分字、词、句等预处理工作;

  内容表示的主要目的是通过预处理将原始文本处理成算法容易进行

  请收藏:https://m.ruguo.cc

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章