如何筛选不excel重复项只提取一个得数据并提取出来并单独显示,急急急!!!!

一般来说,网站标题中的关键字越靠前的其权重越高,也越容易提升其排名能力。

搜索引擎会优先将关键字更明确、匹配程度更高的页面标题排在前面。用百度推广中的术语来说,匹配的权重顺序为:精确匹配>短语匹配>广泛匹配。

在网站标题中,最为重要的关键字一定要分割清楚,以便让百度进行到精确匹配,提高关键字的排名能力,而次要关键可以加入到短语匹配的行列中,并借助外链增强其排名能力。

在百度搜索结果页中,标题的最大显示长度为30个汉字,标题一旦超过长度会被截断,超出部分将以省略号省去,所以一方面为了最大程度的突出关键字,另一方面保证良好的用户体验,对此,我们也对百度搜索结果标题长度做了深入研究,在此我就借助马海祥博客的平台跟大家分享一下:

一般来说,网页标题最好是7个汉字以上,不要超过30个汉字,对于搜索引擎来说,标题中越靠前的内容越重要,靠后的内容比较次要,所以要把最重要的关键字,尽量放在前面位置,用一句简短的话来概括网页内容,不要用列举的形式,一个词一个词的隔开(具体可查看马海祥博客《》的相关介绍)。

目前常见的搜索引擎百度和谷歌,PC端显示的标题一般是60个字符,也就是30个汉字,如果你的网页标题超过30个字,那后面的就会截断,用省略号“…”代替。

(1)、百度标题长度30个汉字的猜测

在2014年6月,曾出过4道SEO相关面试题,如何从实际工作中来查看一个人的SEO能力,回答过第3题的2个人都选择了错误的答案B,原题如下:

百度标题长度通常限制在64个字节以内,请问标题长度小等于多少个汉字(一个汉字 = 2 字节)能完整显示标题,末尾不会以省略符号 "…"(占 3 字节)结束?

在登录百度帐号状态下,访问百度数据开放平台添加pc端新资源,可以看到提示:(为)方便您管理资源,请尽量填写有意义的中文标题,不超过30个(汉)字。

不超过30个汉字是迄今为止SEO行业主流的观点,亦是2位回答者不约而同都选答案B的原因。

H1标签嵌套锚文本标签内容及结尾的句号被百度过滤掉,执行标题策略,仅剩下暧昧的“您可能想看我的”:<h1><a href="/">您可能想看我的马海祥博客</a>。</h1>

事后重构H1标签嵌套结构,完整展现H1容器内的文本。

(8)、分析百度标题规则优先级

关于百度标题各个规则优先级的梳理,以PC端为例:

a、百度蜘蛛判断网页编码字符集。

b、抓取网页标题,部分繁简转换。

c、部分全角标点符号转换半角标点符号。

d、阿拉丁结果(sp)、最新相关信息(中间页)等优先级高于过滤重复标点符号。

e、把连续重复超过3次的部分标点符号替换为3次。

a、选择何种编码的百度搜索(UTF-8, GB2312, Big5, ,有前缀当前页排名 + 后缀2点省略号,到了iPhone上,无前缀当前页排名,但后缀可能有4点省略号,长度范围在 (50+2+[2,3]) 个字节,其它规则与PC, iPad端类似。

123_斗破苍穹吧_百度贴吧 83 字节 //网页

搜索结果只显示 3 字节省略符号 ...。

展现下限亦是3个省略号,最少标题是3字节,与PC, Pad版相同,不再赘述,建议移动端标题范围是3-52字节。

二、标题长度的其它发现

在对标题长度做了常规测试以后,除了以上的结果,我们还有以下几点新的发现,在此也在马海祥博客上跟大家分享一下:

首先,我们先来看一下PC端的新发现,具体来说,有以下几点:

(1)、省略符号不止出现于标题末尾

第1种情况是省略符号 "…" 作为前缀。

...batang开头的字库文件,这个文件大小为如下:

位置前缀似乎不被计入标题长度,10 和 1 是一样的。如果去掉位置前缀,但保留空格,标题长度是 53 字节,网页标题末尾的 1 个空格反被 2 点省略号替换。不过智能手机上没有截断。

PC端访问,搜索“SEO马海祥-SEO教程,SEO方法,SEO技术,网站优化,网络推广!”,显示完整标题,而搜索“SEO马海祥-SEO教程,SEO方法,SEO技术,网站优化,网络推广”,最后一个感叹号被2点省略符号替换。目标网页标题最后是全角感叹号(2 字节),而百度展现的是半角感叹号(1 字节),但智能手机端无此现象。

PC端访问标题截断算法不同于真正智能手机访问的算法。若要在PC端访问都不出现省略符号,建议在使用1个感叹号、逗号等全角符号的情况下,字节小等于52字节。

最后分析下网页标题中的全角标点符号具体分为5种情况。

①、转换为半角(可能包含于繁简转换词库),过滤重复。

②、不转换为半角,过滤重复。

③、不转换为半角,不过滤重复,与半角标点符号是同义词。

④、pc端访问,搜索词包含可转换半角标点符号,转换为半角,过滤重复。

⑤、pc端访问,搜索词不包含可转换半角标点符号,不转换为半角,过滤重复

(5)、过滤反复出现的标题符号

②、当百度抓取转码后的 url,在搜索结果中又把 %23 解码成 #,因此大家看到了搜索结果中出现 # 的url。

三、中英文混合字数统计代码比较

“工欲善其事,必先利其器”,分析百度搜索结果标题长度前,先要找到适宜的字数统计工具,只是为了您的阅读体验,放到后面才介绍。

字节(B)是 Byte 的中文,多用作存储容量单位,亦可作为传输容量单位。英文维基百科解释:

我要回帖

更多关于 excel重复项只提取一个 的文章

 

随机推荐