迟到的22年总结,最近有些忙(各种技术方案调研,可行性分析)。
2022工作段
今年主要的工作内容是:智源大会、智源社区SEO、社区智能摘要、社区全文搜索、安全跳转提示页、发布页优化。
智源大会:
半年度总结已经概述了主要工作内容,就不在过多啰嗦了。今年的机器扩容我统计了一下大约是65台。配置为16核32G、32核32G等,线上服务基本都是容器环境。智源大会主要是以直播+聊天服务为主,这么做为了系统的稳定性,保证用户观看不受限。如果你感兴趣可以随时找我聊一聊性能方面的事,或多或少我能提出一些建议。
智源社区SEO:
上半年很长一段时间都在优化SEO。主要解决了Google,微软,百度等浏览器不能收录的问题。在尝试过多种方案(方案优化二,方案优化一)后Google、微软等搜索引擎收录明显生效,且收录率达到80%以上。百度的收录一直是个迷(不收录)、由于百度引擎在其他方案均无效的情况下,最终不得已我们重构社区改为了服务端渲染(SSR)。
重构过程就不说了,前端工程师记忆比较深刻…
重构完毕后我们对比了一段时间收录量的变化,Google、微软等搜索引擎不受影响。在经过两个月的观察后百度的收录量任然为零。
关于SEO运营方面的动作有:
1,首页置顶文章(首页内容为实时变化,置顶是为了更快的让爬虫发现这个地址)。
2,在其他站点发社区的文章链接。(流量很小)
百度官网认证相关的功能有:
1,在百度上搜索社区内容有保障logo的展示,这么做是为了保障已收录的内容不被删除。(客服说)
2,搜索社区后展示卡片,这里可以添加四个二级地址。(可以提高访问量)
数据小结:
Google 收录95%、微软(Microsoft Bing)85%、百度200条。
结果小结:
百度搜索收录,暂时告一段落。放弃但没有完全放弃... 继续往下看自动摘要带来的效果。
全文搜索
为了提高用户更精准的查找社区相关的内容,随后开始着手规划全文搜索的事情。(从产品需求->技术实现->产品上线)
设计:缺少设计资源,借鉴各大社区、最终选择某乎。
技术实现:
1,首先采用Elasticsearch(是一个分布式、高扩展、高实时的搜索与数据分析引擎),
PS: ES本地测试使用容器搭建(不多说后续有时间补充细节)。
2,为了安全和稳定性,直接选择阿里云的ES服务。
3,API使用Node.js语言进行开发。
备注:包括数据批量写入、更新,自动同步等等,想了解细节的欢迎讨论。
关于搜索说明:ES实现原理
1,搜索后的内容展示,依赖ES相似度、具体查看ES实现原理。
2,搜索类型包含:文章标题,文章内容、活动标题、活动内容等等。
3,排序类型:最高浏览、最新发布。
4,时间范围:一周、一个月、一年。
结果:自上线后、搜索功能使用率创新高。目前排第三名(谷歌、微软(Microsoft Bing、社区搜索。PS:数据来自百度统计)。
安全跳转提示页
主要考虑是解决爬虫在详情页的跳出率(爬虫会顺着地址去插入的目标链接,从而造成本页面的爬虫流量丢失),解决微信小程序内无法打开其他域名地址。
参考的站点:csdn,知乎,微博,掘金等等。所有的站点几乎都有安全页面提示。
提示页作用:
1,防流量丢失,造成恶意引流。
2,防止站点追踪referrer.
3,解决小程序内无法打开其他的域名地址,增加复制功能。
备注:在上线半年后,就强制下线了。原因待复盘。
社区内容智能摘要
做摘要的目的是、解决社区首页信息流内容无看点。现在社区首页展示的简介是文章内容的前200字、基本都是欢迎语句,内容无看点。
在得到授权后我就开始了筹划这个摘要的事,从技术角度开始规划自动摘要(问题分析->技术调研->第三方服务可行性->成果展示->落地发布)…
在技术方案可行的前提下,调整了前端结构用于展示摘要。后端主要是生成摘要&存入摘要,还有就是历史数据清洗数据。
这是优化后的展示效果:
摘要发布后紧接着优化了TDK中的D,将页面源代码中的description改为展示摘要。此刻注意!!!在上线两周后百度的SEO收录竟然持续猛涨。每2-3周大约增加2000条左右,直到10000条收录量再也没有上升(后续持续观察)。
不增加收录的原因有很多,流量低、无原创内容、站点权重低、标题与顶流站点重复、缺少友链等等。
关于SEO优化的事情技术手段基本都用遍了(百度仍然达不到逾期目标),完全靠技术手段可能达不到逾期的效果。
发布页优化
根据上述摘要服务,开始规划2.0版本。目的是减少用户发帖门槛,生成的摘要用户可自行编辑修改。其次就是区分、分享+原创的页面。备注:需求来自业务方,中间陆陆续续沟通了很多次,最终测试无误后上线。
改版细节用文字可能描述不清楚。上截图
详情页前后对比:
编辑页前后对比:
结果:上线1天后,强制下线。原因待复盘。
生活段
就在九月中旬,我的小小家庭迎来了一位新成员-小书柠、是个女孩子哟。但由于工作原因我在家休完陪产假后就返回了北京,到今天小朋友4个月啦,正在努力长大。😄
自返回北京疫情反反复复,下半年也是经历了多次居家办公,最终也没逃过感染的命运。(两周左右身体恢复了正常)
疫情时代结束啦…
装修:从年后开始装修,终于在11月前装修完毕。
哦对了,今年打麻将和斗地主输了点钱。哈哈哈当交学费了。
娱乐段
上半年我就简单介绍过我的三个队友,还是吃鸡那个游戏。(小强、大表哥、小芳姐)
点名批评:
小强:永远冲在第一个,永远是第一个倒地,永远是第一个跳车,技术水平是越来越跟不上了。
建议:吃鸡这个游戏靠蛮力是不行的,这是很讲策略的一个游戏。要学会用脑。
大表哥:每天晚上不是做饭就是洗碗,永远是最后一个上线。最重要的是手抖,看不到人。借口比打的子弹还要多。
建议:无。因为他的借口很多,建议没有用。
备注:对不熟悉的人要学会拒绝组队,不然摸不清具体水平。(PS:小芳姐的哥哥,哈哈哈)
胜率依旧不高,但是丝毫不影响我们一起玩,痛并快乐着吧。