西瓜业务是如何从 0-1 建设 SEO 的

发表于 1年以前  | 总阅读数:321 次

前言

对于各位前端开发者,SEO是一个老生常谈的话题,尤其对于运营着自己的博客、网店、个人网站的开发者来说,SEO是获取自然流量始终绕不开的话题。各大搜索引擎每天都会接收用户上亿次的搜索,是不可忽略的大流量入口,如何从这庞大的搜索流量中分一杯羹,是每一个站长都需要思考的问题。

本文将会具体结合西瓜热点详情页从0到1的SEO建设过程,为大家介绍作为FE业务方如何去学习了解、建设SEO;本文不会就SEO的一些基础理论和搜索引擎算法进行深入探讨,而是希望从热点推广的视角介绍一些SEO方法。

基础概念

SEO(Search Engine Optimization) 中文译为「搜索引擎优化」。

简单地说,SEO是指网站从自然搜索结果获得流量的技术和过程,复杂且较为严谨的定义如下:

SEO是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索结果页面上的关键词自然排名,以获得更多流量,从而达成网站销售及品牌建设的目标。

搜索引擎如何工作

搜索引擎的工作过程大体可以分成三个阶段:

1 . 爬行和抓取

搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面HTML代码,存入数据库。

2 . 预处理

索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理,以备排名程序调用。

3 . 排名

用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。

image.png

如何优化建设SEO

搜索引擎的工作流程主要涉及了2个角色——网站和搜索引擎,我们将第3个角色用户也加入其中后,就可以形成包含3个主要角色和6个核心环节的搜索生态模型。

主要围绕着这6个环节,我们将对网站逐步进行SEO的优化和建设:

抓取、收录

这里我不会按照上图的顺序先讲投放,因为投放在优化过程中其实属于后置位;在没有对网站本身结构进行优化,没有进行竞争分析(关键词选择)之前,你肯定不会轻易把网站大量投放出去吧?

网站的优化大致可以分为两部分:一是网站结构调整,二是页面优化。

我们的网站如果要顺利地被蜘蛛抓取和收录,很大程度上依赖于良好的网站结构。

网站结构优化

避免蜘蛛陷阱
  • Flash
  • 各种跳转
  • JS链接
  • 要求登录
设置robots文件

西瓜M站的robots文件

robots文件属于网站禁止抓取、索引机制的一部分,搜索引擎蜘蛛访问网站时,会先查看网站根目录下是否有一个robots.txt文本文件,它用于指定蜘蛛禁止抓取网站某些内容,或者允许抓取某些内容。

一些网站不存在robots文件时会返回200状态码和一些错误信息,而不是404状态码,这可能使搜索引擎蜘蛛错误解读robots文件信息,所以建议就算允许抓取所有内容,也要建一个空的robots文件,放在根目录下。

URL设计

在设计网站页面的URL时尽量遵循下面几个原则:

  • 越短越好
  • 避免太多参数
  • 目录层次尽量少
  • 包含关键词(英文)
  • 字母小写
  • 连词符使用「-」分隔
  • 使用https
西瓜热点H5详情页之前的URL:
https://h5.ixigua.com/xigua_hot_spot/detail/?hotspotId=7095918215196318727

现在的URL:
https://m.ixigua.com/xigua_hot_spot/detail/7095918215196318727
更换域名 & URL静态化

我们针对之前西瓜热点H5详情页的URL进行了域名更换和URL静态化。

域名更换:M站的域名拥有较高的权重(较长的域名年龄、收录页面总数多、特征关键词排名高等),将热点的域名更换至M站域名有利于我们的页面能够被搜索引擎收录,且在搜索排名上具有一定优势。

URL 静态化 :一般来说URL中有两三个参数,对于收录来说不会造成任何影响,但还是建议将URL静态化,既能提高用户体验,又能降低收录难度。

网址规范化

网址规范化指的是搜索引擎挑选最合适的URL作为真正网址的过程。

那什么是不规范的网址呢?

举个例子,一般来说一个网站的首页URL应该是固定的,但在一些网站链接回首页时所使用的URL并不是唯一的,有时连到https://www.xxx.com, 有时连到 http://www.xxx.com/index.html 。这样不规范化的网址会给搜索引擎造成困扰,可能造成权重分散、浪费爬取份额等问题。

解决方案:

  • 百度站长平台中设置首选域名
  • 使用301转向,将不规范化URL全部转向到规范化URL
  • 使用canonical标签
在HTML文件的head中加上这样一段代码:
<link rel="canonical" href="https://m.ixigua.com/xigua_hot_spot/detail/7101281806032313356">
表示这个网页的规范会网址应该是:https://m.ixigua.com/xigua_hot_spot/detail/7101281806032313356

网站页面优化

良好的TDK

TDK标签包括标题标签title(T)、网站的描述标签description(D),关键词标签keywords(K),一般在搜索结果中,页面的title和description是最有可能被展示出来的。

在设置网站的TDK之前,还有一个重要的事情便是竞争分析和关键词研究,我们需要简单了解下为什么需要有这个步骤。

  • 确保目标关键词有人搜索
  • 降低优化难度
  • 寻找有效流量
  • 搜索多样性
  • 发现新机会

TDK 通用标准:

  • Title 标题

标准格式 : 关键词 - 副关键词 | 品牌名

长度建议 : 50 ~ 60 个字符

  • Description 描述

长度建议: 网页描述的长度任意,最佳实践长度在 155 ~ 160 个字符间之间,描述文本尽量使用关键词吸引用户的话术,提升点击率(CTR)。

  • Keyword 关键词

这里的keyword不仅仅指的是meta keywords,而是站点/文章title/视频描述中可以增加关键词

长度建议

  • 主页关键词布局一般是核心词,以5~10个为宜。关键词之间用英文状态下的逗号或者下划线隔开,搜索量大的在前,搜索量小的在后,同个关键词不可以反复出现,以免堆积。
  • 不同栏目设置不同的关键词。栏目页属于内页,所以关键词最好选择长尾关键词,并结合网站当前栏目名称选词,一般布局3~5个长尾关键词。
  • 视频页主要布局的关键词是长尾关键词,1~2个为宜,一定要和视频主题高度吻合。

举个

image.png

西瓜热点详情页是一个静态的CSR站点,这样的页面渲染方式是无法对页面的TDK进行定制化处理的。

image.png

因此我选择采用模板引擎进行TDK定制化处理。

image.png

1 . 注入表达式: 由于在编译运行时代码时会利用到html模板,并将编译得到的js、css文件从html模板中引入,所以我们可以预先在html模板中注入模板语言表达式来占位TDK,{{title}},{{description}},{{keywords}}。

2 . 更改后缀: 在运行时代码编译完成得到最终产物后,其中html文件中便会包含之前注入的模板表达式,此时将html文件后缀更改为模板语言后缀(index.handlebars)。

3 . Node服务: 在router拦截到对应路由请求时(/xigua_hot_spot/detail/:hotspotId),在controller中请求对应热点id的具体内容(标题、介绍),利用ctx.render将对应的变量传递给模板文件(index.handlebars)并返回文件。

正确使用 HTML 标签
  • <a>标签需要有 href 属性,减少使用JS跳转

  • <img>标签需要补全 alt 属性值

  • 全局只能存在一个不要滥用,合理使用此类标签

性能优化

页面速度是重要的排名因素,也影响到爬虫的爬取效率。无论百度还是Google都已经有数次以页面打开速度为目标的算法更新

  • 优化页面耗时

网站在搜索结果中的排名会受到页面打开速度的影响,例如百度在2017年10月推出闪电算法,针对页面的打开速度给予政策支持,页面的首屏加载速度越快往往会获得更高的排名以及更多的流量倾斜。谷歌也在2021年6月发布公告称,网页核心性能指标(CLS、FID、LCP)将被视为排名因素之一。

良好的首屏加载耗时不仅会受到搜索引擎的青睐,同时也能为浏览网站的用户提供更好的体验和服务。

  • 优化页面体积(< 125 kb )

搜索引擎受限于自身的技术能力和计算资源,对于页面源码尺寸有限制(百度限制128kb,Bing限制125kb),超过的部分会进行截断处理。

网页投放

网站地图

通过网站地图,不仅用户可以对网站的结构和所有内容一目了然,搜索引擎也可以跟踪网站地图链接爬行到网站的所有主要部分;网站地图有两种形式,第一种被称为HTML版本网站地图,英文是sitemap,另一种是XML版本网站地图,英文Sitemap。

  • HTML网站地图

image.png

  • XML网站地图

image.png

API推送

概述

通过开放API接口将网页链接直接推送给搜索引擎,目前只有百度GoogleBing三个搜索引擎支持该能力。

image.png

特点:速度快、权重高

相比于网站地图,API推送网页链接可以使得搜索引擎更加快速地爬取和收录网页,并且搜索引擎会认为站长主动推送的链接可能会有更高的质量,适合于更新速率快、时效性高的网页。

定时推送

热点事件的发生时机较为随机,且具有较强的时效性,为了能够让搜索引擎更加快速地爬取和收录西瓜热点页面,利用Timer触发器,定时将热点页面通过API推送给搜索引擎。

image.png

主动推送机器人

西瓜热点具有重运营的属性特点,热点的产生和推广与运营密切相关;从这点出发我思考能不能开发一个西瓜热点SEO相关的运营工具,当热点新鲜产生的时候,运营可以借助我的工具将该热点及时推送给搜索引擎,加快该热点被搜索引擎爬取收录的速度,获取更多的自然流量。

因此我开发了西瓜热点 SEO 机器人,利用飞书提供的企业机器人功能进行定制化开发,通过与机器人对话的形式,能够方便运营同学将新产生的热点快捷地进行推送。

image.png

内链/友链投放

内链,就是在同一个网站中,内容页面之间相互链接,也就是网站内部的链接。好的内链布局合理,结构清晰,能提高搜索引擎对我们网站的收录和权重,是很重要的。内链还可以控制成本,提高索引效率,提升网站的排名,传递权重,最终提升流量。

image.png

外链,就是别的网站导入自己网站的链接,即可以通过其他地方进我们网站,外链的作用有很多,不单单只是提高网站的权重,也可以提高某个关键词的排名,一个高质量的外链可以为我们的网站带来更多流量。

image.png

排名/点击

结构化数据

结构化数据,是一种提供网页相关信息并对网页内容进行分类的标准化格式,换句话说,就是搜索引擎使用的语义词汇代码语言。

这种代码可以帮助谷歌理解页面内容。同时,Google 搜索也会利用这种代码语言(结构化数据)启用特殊的搜索结果功能和增强功能,丰富搜索结果展示。

<script type="application/ld+json" id="scriptTag" nonce="-_vD_w5o44pwi2zXVWL8EA" class="style-scope ytd-player-microformat-renderer">
{ "@context": "https://schema.org",
"@type": "VideoObject",
"description": "《三体》完整合集浓缩版,真.完结撒花!增加了一些内容,修正了一些内容,删除了一些内容。片尾有彩蛋嘿嘿~\n希望你们喜欢。\n\n#三体 #名侦探拳头 #科幻",
"duration": "PT4560S",
"embedUrl": "https://www.youtube.com/embed/QO25QnboJG0",
"interactionCount": "7714441",
"name": "【三体解说】76分钟看完《三体》全集。宇宙很大,生活更大。【名侦探拳头】",
"thumbnailUrl": [ "https://i.ytimg.com/vi/QO25QnboJG0/maxresdefault.jpg"
] ,
"uploadDate": "2019-06-02",
"genre": "People & Blogs",
"author": "名侦探拳头"
}
</script>

除了谷歌的结构化数据外,我们在百度也会看到一些图文展现格式,在说明文字的左侧放上一张图片。

列表左侧的图片来源有两个,大部分情况下是从页面本身选取的,从百度官方介绍和经验来看,被选取的图片需要满足这些条件:

  • 图片与页面内容相关
  • 足够清晰
  • 足够尺寸,像素121 x 75以上
  • 横跨比例适当,大致为121:75左右
  • 正常IMG标签图片,不是背景层

需要注意的是,就算满足了以上这些条件,页面在搜索结果中可能还是展现不出图片(百度辣鸡),这跟百度自身的策略和算法相关,它也会更倾向于把资源分配给自家的产品(好看视频、百家号等)。

图文展现这种形式非常直观,可以提高用户体验,使用户更容易快速判断页面内容,对页面吸引视线、提高点击率有明显作用。

关联百度热搜词

我们在使用百度搜索引擎的时候,经常会在首页或者搜索结果也的左侧看到一个「百度热搜」。

image.png

我们点击其中一个热点后,会进入该热点的搜索结果页,并且在搜索结果的最上方聚合展示有关该热点的相关资讯网页,可以发现网页标题中包含热搜词的页面的搜索结果往往会获得较高的排名,例如下图「韩国主帅赛后怒斥裁判被红牌驱逐」这个热搜词,我们能看到排名较前的几个搜索结果中都包含了该热搜词。

基于这样的推断,我思考能否通过将西瓜热点中与百度热搜词中相关联的内容进行联动,当百度爬虫爬取西瓜热点页面时,判断百度热搜词中是否有与该西瓜热点相近的内容,通过替换西瓜热点的标题来达到在百度搜索中提升排名的目的。

image.png

数据监控

爬虫行为监控

收集爬虫日志,了解爬虫的行为变化可以在流量变化前更加灵敏得反应页面SEO的状态

新上SEO功能后,可以通过爬虫日志来灵敏得判断功能的影响

索引量监控

1 . 通过各个平台自带的站长平台,可以看到索引量的变化(有些平台更新可能不是很及时)

2 . 通过site: m.ixigua.com语句,可以查询索引的数据

分页面的索引,使用inurl:/xigua_hot_spot site:m.ixigua.com语句

3 . SEMrush

一个SEO工具,可以在谷歌插件市场中下载安装,功能是展示当前站点的SEO相关数据,同时包含了索引量、外链量、内链量等相关数据。

排名监控

1 . 搜素引擎自带的监控

  • 百度站长:https://ziyuan.baidu.com/keywords/index
  • 谷歌:https://search.google.com/search-console

2 . 通过脚本收集相关页面在指定搜索关键词下的排名情况

结语

SEO真的是一个非常神奇的东西,它既有迹可循,又异常复杂(玄学),更多情况下需要的是一种经验的积累(AB实验一定程度上可以缓解)。

本文主要涵盖了我这段时间以来的SEO优化经验,但依然只是SEO的冰山一角,再加上SEO不再局限于Web端,在APP端内也在不断兴起,要彻底探明掌握它的奥秘还是任重道远。

要做好SEO最根本的还是需要网站内容是丰富的、有价值的,没有好的内容作为基础,SEO的价值也会被减损。

希望我的经验和积累能够给大家带来一些启发。

本文由哈喽比特于1年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/YPerWDUPqiWO9lnrDxMktw

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:7月以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:7月以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:7月以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:7月以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:7月以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:7月以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:7月以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:7月以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:7月以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:7月以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:7月以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:7月以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:7月以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:7月以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:7月以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:7月以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:7月以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:7月以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:7月以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:7月以前  |  398次阅读  |  详细内容 »
 相关文章
Android插件化方案 5年以前  |  236868次阅读
vscode超好用的代码书签插件Bookmarks 1年以前  |  6869次阅读
 目录