169章 渴望推扇门(6)

目录

尹芙·卡莉陈述完

林灰领略思。

却并回答尹芙·卡莉问题。

反问尹芙·卡莉:“关使向量介入进语义文本相似度计算?”

【推荐,野果阅读追书真载 www.yeguoyuedu.com 试试吧。】

林灰次交流问题。

问题让尹芙·卡莉点措及。

尹芙·卡莉太清楚林灰问题。

莫非依靠向量语义文本相似度计算吗?

呢?

机器识别文本机器识别语言,往往将语言数值化。

数值进属性区分则必须进向量化。

方法已经很长间历史,尹芙·卡莉记1977空)研究员首次提向量空间模型VSM

经提研究方法比较受欢迎。

很快方法漏洞。

VSM方法话,文本量很文本向量非常稀疏导致空间计算资源浪费;

另外VSM简化模型效果忽略词语间关系,词语联系,因此简单词语间相互独立合理

尽管明显漏洞,近四十历史引入向量进语义文本相似度分析。

尹芙·卡莉先团队,虽网络知识计算文本相似度方法。

本质将Wiki百科网页内容映射高维向量,

再通向量空间方法进语义文本相似度计算。

依旧向量空间

四十“空间计算资源浪费”某程度硬堆计算力暴力解决。

仅仅解决难题已。

文本处理信息量复杂程度完全语。

向量化全新困难——维度爆炸!

维度灾难(名维度诅咒)早由理查德·贝尔曼考虑优化问题首次提术语,描述空间维度增加,分析组织高维空间(通常千维),因体积指数增加问题场景。

空间额外增加维度,其体积呈指数级增长。

难题低维空间

物理空间很少问题,毕竟物理通常三维建模。

很神奇,尽管物理很难遇维度爆炸问题。

语言处理、机器习方维度爆炸

领域随便点信息量易举突破三维。

其实领域、组合数、机器数据挖掘提及维度爆炸象。

问题特色维数提高,空间体积提高太快,因数据变很稀疏。

高维空间数据很稀疏,角度相似,因平常使数据组织策略变极其低效。

尹芙·卡莉团队网路知识进文本相似度衡量

果直接网页进分析,往往导致知识含量稀疏计算困难。

维度爆炸导致

尹芙·卡莉很清楚向量引入语义文本相似度方法维度爆炸。

林灰询问将向量引入计算语义文本相似度呢?

莫非林灰真办法够妥善处理维度爆炸问题吗?

机器习、语言处理方向维度爆炸并容易解决

林灰打算干脆绕向量衡量语义文本相似度吗?

尹芙·卡莉虽林灰问。

林灰提点,尹芙·卡莉怎轻易放弃。

尹芙·卡莉先给林灰陈述西方计算语义文本相似度候向量通常客串角色。

尹芙·卡莉才正式始回答林灰先问题:

“引入向量使机器更方便处理语义文本信息。

引入向量处理语义文本相似度选择方案很少。

引入向量计算语义文本相似度选择方案少少点LOW。

,基字符串方法,方法原始文本进比较。

包括编辑距离、长公共序列、N-Gram相似度等衡量。

编辑距离吧,其衡量两文本间相似度根据依据两文本间由转换少编辑操次数。

算法界定编辑操包括增加、删除、替换三

长公共系列根据……

套衡量标准甚至点像Microsoft Word格式衡量般。

字符串方法虽原理简单、实方便。

方法考虑单词含义及单词单词相互关系。

涉及义词、义词等问题法处理。

很少单独使字符串方法计算文本相似度。

方法计算结果表征文本特征融入更加复杂方法

方法外,……”

林灰

尹芙·卡莉口判定研究进展

字符串通编辑操长公共系列方式衡量语义文本相似度确实点低端。

低端因此算法价值。

果文本识别领域取突破话。

界定文本相似度判断方法文本识别算法结合话。

字符串判定文本相似度方法贴切。

毕竟字符串判别方法计算机视觉直观逻辑形式接近

文本识别算法很寻常技术。

甚至随便软件截图工具胜任文本识别任务。

空哪怕专门打文本识别噱头软件。

实际扫描文稿转PDF已。

涉及实际文本识别效率低批。

林灰感觉似乎商机。

商机,适合做。

毕竟涉及文本识别跟计算机视觉领域关系

计算机视觉让机器东西。

工智领域。

领域研究让计算机系统图像、视频视觉输入获取信息。

根据信息机器采取或提供建议。

工智赋予计算机思考力。

计算机视觉赋予、观察理解力。

计算机视觉虽复杂吧。

码门槛比语言处理

适合林灰

林灰,林灰默默

林灰觉目光太短浅。

东西虽很鸡肋。

未必代表长远角度途。

念及此,林灰突很庆幸。

经验让其游刃余。

,重带给受益思维改变。

涉及物林灰考虑长线价值。

甚至考虑二十

长线思维方式。

林灰觉企及高度。

字符串评价文本相似度方法尹芙·卡莉分歧。

林灰并表露交流很存异已。

尹芙·卡莉继续陈述法:

“……将向量引入语义文本相似度衡量确实

介入向量像打魔盒

向量处理语义复杂文本信息

极其容易形高维空间,造维度爆炸。

,应场景经常极其糟糕。

经常维度爆炸问题。

维度爆炸问题已经很制约研究

Dear林,您关问题法呢?”

林灰:“维度爆炸主高维难处理问题。

此,考虑将高维进降维呢?”

林灰语气风轻云澹。

仿佛叙述般。

降维?将高维降维??

翻译信息。

尹芙·卡莉吐血感觉。

林灰表达将高维转化低维。

林灰表述将高维某物转化低维翻译转达候却省略东西。

省略名词太糟糕

底林灰表达将高维数据转化低维数据?

将高维模型转化低维模型?

抑或含义?

尹芙·卡莉很询问

考虑林灰先米娜·卡莉做举。

尹芙·卡莉并让林灰带翻译陷入

仔细思索林灰话

首先尹芙·卡莉觉林灰应该将高维数据降低低维数据。

语言处理高维数据话。

分析高维数据,确实降维

必须降维!

高维数据模型虽收集数据点很

收集数据通常散布极其分散广袤高维空间

统计方法高维数据

“维度灾难”存原因

加入书签
目录
推荐阅读
争魏九尾夜,截胡宇智波泉寻宝神瞳危机处理游戏怕死谈几次恋爱秦:靠读书入圣,局召唤雪龙骑!单机遨游锦绣农田忙绿茵传奇教父
者其
相关阅读
红尘篱落穿越诸局救司理理西游:徒儿舔狗金报销父汉高祖网游王者再战NBA:关疾风亚索汉再万界