接上篇2022半年度总结

迟到的22年总结,最近有些忙(各种技术方案调研,可行性分析)。

2022工作段

今年主要的工作内容是:智源大会、智源社区SEO、社区智能摘要、社区全文搜索、安全跳转提示页、发布页优化。

智源大会:

半年度总结已经概述了主要工作内容,就不在过多啰嗦了。今年的机器扩容我统计了一下大约是65台。配置为16核32G、32核32G等,线上服务基本都是容器环境。智源大会主要是以直播+聊天服务为主,这么做为了系统的稳定性,保证用户观看不受限。如果你感兴趣可以随时找我聊一聊性能方面的事,或多或少我能提出一些建议。

智源社区SEO:

上半年很长一段时间都在优化SEO。主要解决了Google,微软,百度等浏览器不能收录的问题。在尝试过多种方案(方案优化二方案优化一)后Google、微软等搜索引擎收录明显生效,且收录率达到80%以上。百度的收录一直是个迷(不收录)、由于百度引擎在其他方案均无效的情况下,最终不得已我们重构社区改为了服务端渲染(SSR)。

重构过程就不说了,前端工程师记忆比较深刻…

重构完毕后我们对比了一段时间收录量的变化,Google、微软等搜索引擎不受影响。在经过两个月的观察后百度的收录量任然为零。

关于SEO运营方面的动作有:

1,首页置顶文章(首页内容为实时变化,置顶是为了更快的让爬虫发现这个地址)。

2,在其他站点发社区的文章链接。(流量很小)

百度官网认证相关的功能有:

1,在百度上搜索社区内容有保障logo的展示,这么做是为了保障已收录的内容不被删除。(客服说)

2,搜索社区后展示卡片,这里可以添加四个二级地址。(可以提高访问量)

数据小结:

Google 收录95%、微软(Microsoft Bing)85%、百度200条。

结果小结:

百度搜索收录,暂时告一段落。放弃但没有完全放弃... 继续往下看自动摘要带来的效果。
全文搜索

为了提高用户更精准的查找社区相关的内容,随后开始着手规划全文搜索的事情。(从产品需求->技术实现->产品上线)

设计:缺少设计资源,借鉴各大社区、最终选择某乎。

技术实现:

1,首先采用Elasticsearch(是一个分布式、高扩展、高实时的搜索与数据分析引擎),
    
    PS: ES本地测试使用容器搭建(不多说后续有时间补充细节)。

2,为了安全和稳定性,直接选择阿里云的ES服务。

3,API使用Node.js语言进行开发。

备注:包括数据批量写入、更新,自动同步等等,想了解细节的欢迎讨论。

关于搜索说明:ES实现原理

1,搜索后的内容展示,依赖ES相似度、具体查看ES实现原理。

2,搜索类型包含:文章标题,文章内容、活动标题、活动内容等等。

3,排序类型:最高浏览、最新发布。

4,时间范围:一周、一个月、一年。

结果:自上线后、搜索功能使用率创新高。目前排第三名(谷歌、微软(Microsoft Bing、社区搜索。PS:数据来自百度统计)。 CleanShot 2023-01-11 at 15.40.12

安全跳转提示页

主要考虑是解决爬虫在详情页的跳出率(爬虫会顺着地址去插入的目标链接,从而造成本页面的爬虫流量丢失),解决微信小程序内无法打开其他域名地址。

参考的站点:csdn,知乎,微博,掘金等等。所有的站点几乎都有安全页面提示。

提示页作用:

    1,防流量丢失,造成恶意引流。
    
    2,防止站点追踪referrer.

    3,解决小程序内无法打开其他的域名地址,增加复制功能。

备注:在上线半年后,就强制下线了。原因待复盘。

CleanShot 2023-01-11 at 15.40.54

社区内容智能摘要

做摘要的目的是、解决社区首页信息流内容无看点。现在社区首页展示的简介是文章内容的前200字、基本都是欢迎语句,内容无看点。

在得到授权后我就开始了筹划这个摘要的事,从技术角度开始规划自动摘要(问题分析->技术调研->第三方服务可行性->成果展示->落地发布)…

在技术方案可行的前提下,调整了前端结构用于展示摘要。后端主要是生成摘要&存入摘要,还有就是历史数据清洗数据。

这是优化后的展示效果:

CleanShot 2023-01-11 at 13.30.10

摘要发布后紧接着优化了TDK中的D,将页面源代码中的description改为展示摘要。此刻注意!!!在上线两周后百度的SEO收录竟然持续猛涨。每2-3周大约增加2000条左右,直到10000条收录量再也没有上升(后续持续观察)。

不增加收录的原因有很多,流量低、无原创内容、站点权重低、标题与顶流站点重复、缺少友链等等。

关于SEO优化的事情技术手段基本都用遍了(百度仍然达不到逾期目标),完全靠技术手段可能达不到逾期的效果。

发布页优化

根据上述摘要服务,开始规划2.0版本。目的是减少用户发帖门槛,生成的摘要用户可自行编辑修改。其次就是区分、分享+原创的页面。备注:需求来自业务方,中间陆陆续续沟通了很多次,最终测试无误后上线。

改版细节用文字可能描述不清楚。上截图

详情页前后对比:

CleanShot 2023-01-11 at 15.03.00

编辑页前后对比: CleanShot 2023-01-11 at 14.52.22

结果:上线1天后,强制下线。原因待复盘。

生活段

就在九月中旬,我的小小家庭迎来了一位新成员-小书柠、是个女孩子哟。但由于工作原因我在家休完陪产假后就返回了北京,到今天小朋友4个月啦,正在努力长大。😄

自返回北京疫情反反复复,下半年也是经历了多次居家办公,最终也没逃过感染的命运。(两周左右身体恢复了正常)

疫情时代结束啦…

装修:从年后开始装修,终于在11月前装修完毕。

哦对了,今年打麻将和斗地主输了点钱。哈哈哈当交学费了。

娱乐段

上半年我就简单介绍过我的三个队友,还是吃鸡那个游戏。(小强、大表哥、小芳姐)

点名批评:

小强:永远冲在第一个,永远是第一个倒地,永远是第一个跳车,技术水平是越来越跟不上了。

建议:吃鸡这个游戏靠蛮力是不行的,这是很讲策略的一个游戏。要学会用脑。

大表哥:每天晚上不是做饭就是洗碗,永远是最后一个上线。最重要的是手抖,看不到人。借口比打的子弹还要多。

建议:无。因为他的借口很多,建议没有用。

备注:对不熟悉的人要学会拒绝组队,不然摸不清具体水平。(PS:小芳姐的哥哥,哈哈哈)

胜率依旧不高,但是丝毫不影响我们一起玩,痛并快乐着吧。