第一步就很复杂。
该怎么进行语言模型的构建呢?
按照LINHUI提出的技术路线。
语言模型建模过程中,包括词典、语料、模型选择等。
问题出在语料库上,语料库一词在语言学上意指大量的文本。
这类文本通常经过整理,具有既定格式与标记。
涉及到英文语料库的信息还比较容易,毕竟伊芙所在的团队和牛津、哈佛、耶鲁三所大学的语言学方面都是深度合作的关系。
但涉及到中文以及其他文字预料信息该怎么处理这就完全不好说了。
巧妇难为无米之炊。
没有语料库清楚技术路线什么的也没用。
倒是可以姑且先抛弃对中文以及其他新闻生成式摘要的研究。
但是这样几乎等同于放弃了一个庞大的市场。
而且最关键的是LINHUI提出的算法本身就能兼顾中文新闻摘要以及英文新闻摘要。
那么之后LINHUI会不会直接开发个中文新闻处理成英文摘要的功能呢?
能搞定文本摘要处理算法的人没道理一个翻译算法都搞不定吧??
伊芙·卡莉越想越觉得这种可能性很大。
不然为什么一个摘要软件要做成类似于翻译软件那样的交互风格呢?
在她们还在踌躇不前的时候。
对手却早已经大步向前挺进了。
一时之间伊芙不禁有种酣战过后的无力感。
这就是所谓的一步落后步步落后吧。
这种情况还评估啥?
直接建议谷歌方面把LINHUI的算法买回来就好了!
虽然LINHUI是华国人
但这种技术又不是什么涉及到国家命脉的重要技术。
总不至于不卖吧!
不卖的话谋求专利授权也可以啊!
总不至于非跟在别人身后造轮子吧。
伊芙又没受/虐/欲。
……
事实上,不止海外在关注林灰折腾出的算法。
國内也注意到林灰搞出的动静。
只不过國内目前的目光主要集中在南风APP的软件层面而不是算法层面。
國央大学副校长兼计算机学院的副/院/长贺天昌自南风APP上架之初就对该软件保持着高度的关注。
虽然夜已经深了,他仍然在通过第三方数据网关注着南风APP软件的下载情况。
贺天昌在外界并不怎么出名,但此人在软件行业却是大名鼎鼎。
其在业界颇有名声。倒不是因为其在软件开发上鼓捣出什么名堂来。
而是因为其资历老啊!各行各业都看资历,软件行业也不能免俗。
不过贺天昌的资历也经得起看,他和王J民基本是同一时期鼓捣软件(96年)的人了。
就这份资历全国互联网/软件行业能和其比肩的大佬也没几位。
有这种资历就算在软件行业没
啥作为也无所谓。
真想拉投资的话以其资历在互联网圈子随随便便拉个几千万的投资也不过是打几个电话的事情。
就这么一个原本搞软件的人怎么跑到大学来了?
故事要从九几年开始说起,在感受到互联网浪潮之后。
刚从米国加州理工计算机博士毕业的贺天昌放弃了美國优渥的工作。
回国参与创业,在王茳民鼓捣出杀毒软件的时候,贺天昌也搞了几个软件。
不过和前者鼓捣的J民杀毒软件不同。
贺天昌鼓捣的软件,一般都是小众但专业性很