如何用Excel快速进行文本相似度vlookup函数模糊匹配的使用方法?

可以使用Excel的条件格式功能来实现自动标记相似度高的内容。具体步骤如下:1.选中需要标记的单元格范围。2.点击“开始”选项卡中的“条件格式”按钮,选择“新建规则”。3.在弹出的“新建格式规则”对话框中,选择“使用公式确定要设置格式的单元格”。4.在“公式”框中输入以下公式:=SIMILARITY(A1,A2)>=0.95其中,A1和A2是需要比较的单元格,0.95是相似度的阈值,可以根据实际情况进行调整。5.点击“格式”按钮,选择需要的标记方式,比如设置背景色或字体颜色等。6.点击“确定”按钮,完成条件格式的设置。这样,相似度高的单元格就会自动被标记出来了。如果需要对整个工作表进行相似度的标记,可以将上述步骤应用到整个工作表中。
小编分享一个简单的办法只需下载Excel网络函数库然后在表格内使用公式即可安装地址:excelapi.com公式=GetMatchingDegree()▼操作动图如下:是不是很简单呢?下面具体说明一下公式=GetMatchingDegree(Text_a, Text_b)算法说明编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。安装Excel网络函数库后还可以判断两个文本是否表示同样内容同样也要使用上面提到的公式除此之外还需要使用其他公式这样得出的结果比上面更准确下面我们来举个例子不知道大家有没有面对过成百上千个陌生又复杂的名字需要一一判断它们的名字是否相同▼如下图所示:遇到这种情况不要着急小编教大家如何简单快速解决这个问题Step1:我们先使用正则表达式提取公式=RegexString(A2,"汉字")提取两个品名中的中文字符,方便下面进行判断。▼操作动图如下:Step2:然后,使用IF公式比较出两个品名的长短,分别获取比较短的和比较长的品名。▼操作动图如下:Step3:使用正则表达式的检查公式= RegexExists()检查长的品名中是否包含短的品名,如果包含,则证明两者是同一产品,返回结果Y;反之则不是,返回结果N。▼操作动图如下:Step4:使用匹配度查询公式= GetMatchingDegree()检查两个品名的相似程度,即重复程度。▼操作动图如下:好啦经过以上步骤就可以实现计算文本相似程度啦是不是很容易实现呀有需要的小伙伴快去试试吧过程中有任何疑问的话欢迎在下方留言或者关注私信小编

我要回帖

更多关于 vlookup函数模糊匹配的使用方法 的文章

 

随机推荐