今天一个客户打电话说是从百度中找不到他的网站,我查了一下,百度对他的网站一个页面都没有收录,仔细一问,才知道当时做网站的时候客户要求他的网站按照他们总公司的网站做的,并且基本上都没有改(包括布局)。一下子,我明白了,页面相似度太高了,用工具分析了一下,竟然达到87%。下面给大家讲一下怎么避免页面相似度过高(重复内容过多)!
落水鱼总结了几个小方法。
1、拆分法
把原有连续的文章,平均的截取成为2段3段或是更多。
好处:降低相似度、提高访问者浏览的速度、增加页面访问量
缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对Title标题的优化也有一定的不利,因为会有重复。不过数量较小的情况下不会有什么大碍。
2、跟随法
把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐。
好处:进一步降低相似度,给可以更多讯息,提供更多使用的功能。例如“回到最上面”
缺点:使用不当将降低用户体验,如果使用JAVASCEIPT等作有可能影响页面加载速度,干扰客户浏览主线。
3、隐身法
将一些没有实际用处的词使用图片代替,经过优化的GIF图片只有十几个字节,将文章中出现的部分特定字或词进行隐身,也可以很好的达到降低页面相似度的效果。
优点:不干扰关键词布局、不干扰用户体验、不影响浏览和加载速度、有效防止被采集。
缺点:仅仅增加少许加载时间,但几乎可以省略不计。
4、标签法
在特定的关键字后增加友情注释。例如:我们所倡导的SEO(SEO相关信息)思想是……
好处:增加用户体验,让客户可以了解更多并不熟悉的专业名词,从而更好理解文章含义。 还可以自然的重复关键字,增加关键字密度。
缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原有关键词布局和密度。
其落水鱼还是坚持推荐大家原创,这样的话搜索引擎会给你的网站权重很高的,并且也不会出现页面相似度的问题!
分享到:
相关推荐
这是用java 和nekoHTML分析出页面的相似度,用法如下: String url1 = "http://www.baidu.com"; String url2 = "http://www.baidu.com"; System.out.println(PageDistance.getPageDistance(url1, url2)); 我己把源...
降低网站页面的相似度.pdf
基于维基百科页面词频的词汇相似度计算结果 基于 GloVe 词向量的词汇相似度计算结果 基于特征训练的词汇相似度计算结果 评价标准与参考基线本文采用 Spearman 相关系数来评价相似度计算,在计算排名时,如有打分...
降低网站页面的相似度的方法
降低网站页面的相似度的注意事项
没有进行页面没化 布局已经确定好了。 企业登录 没有写servlet。登录地址为:http://localhost:8080/tuantuan/admin/entersign.jsp 系统: 可以添加。修改,删除商品。以及可见画面的参数设置
网络爬虫 具有相关检查的爬虫,对每个页面(URL)均使用TFIDF和余弦相似度方法
13.2内容页商品描述去除了图片和一些无用标签,加快网页打开速度,减少了页面相似度; 13.3商品描述里加了头尾动态文字描述,可以在后台自定义编写,完全可以做出和别人不一样的商品描述!减少了页面相似度,增加...
本程序代码运行后得到页面很美观的界面,导入任意两个文件后得到较两文件的相似度信息,页面美观,彩色进度条,按钮
Bootstrap:一个用于快速开发响应式网站的前端框架。 jQuery:一个流行的JavaScript库,简化了处理HTML文档、事件处理、动画等操作。 Webpack 和 Babel:前端构建工具,用于打包、转译和优化前端资源。 后端技术: ...
该方法充分利用Web网页布局结构上的特点,采用分级处理的方式,首先利用页面分块算法思想通过相似度计算挖掘出具有相似性的代码块,其次通过结合RoSunday方法解析样式文件快速匹配出节点集合对应的样式表并建立文档...
4.2内容页商品描述去除了图片和一些无用标签,加快网页打开速度,减少了页面相似度; 4.3商品描述里加了头尾动态文字描述,可以在后台自定义编写,完全可以做出和别人不一样的商品描述!减少了页面相似度,增加百度...
SIM: 在线状态下,从网页页面输入任意两个句子,求其相似度,包括:内积,余弦及Jaccard三种度量方式。 SJet:实现基于向量空间模型(VSM)的搜索引擎。 运行环境 Linux python 2.7 jieba flask 0.12 若干flask...
基于HTML5+CSS+JS完成小红书首页项目相似度99%,附源码+素材,可用于毕业设计
这是一个免费、轻量化、简单、易上手的旅游网站项目,系统包括完整的前端Html页面和后台代码,该项目仅适合作为JavaWeb入门或毕业设计使用,不具备实际使用价值,项目中涉及皮尔逊相关系数的相似度算法Java实现和...
基于相似度的社区发现最大流算法,桂挡平,,web社区是具有相似主题的网页集合,最大流算法是发现web社区的方法之一。本文在给出了页面之间的链接相似性与主题相异性定义的基础
针对用户会话相似度计算中,忽视了用户在某会话中对页面感兴趣的程度这一问题,提出了用户会话系数AvgI(p),并结合雅可比相似系数、CM系数给出了一种新的用户会话兴趣度的计算方法。在此基础之上,结合 Web内容、...
提出一种基于页面DOM相似度的Web应用单元测试方法。利用爬虫程序获取页面状态与相应的DOM结构;利用DOM相似度对DOM进行评价,并对DOM状态进行分类,利用分类簇的中心作为相应功能的操作结果,返回应用中寻找相应的...
一个基于倒排索引与余弦相似度的,不借用数据库从底层实现的可交互式新闻检索系统 使用说明 1.Web.py是该系统的入口,运行该文件即可打开此新闻检索系统。 2.在Web.py的最后一行代码中,若是app.run(host=...
项目是基于甲方已有的产品设计,甲方会提供设计风格、规范 项目名称 主要内容 单价 数量 单位 价格(元) 主操作页设计 1选择城市页(往返)2搜索结果页(往返)3机票信息页(往返)4...相似度90%以上的页面; 19 页