当前位置: 首页 > 生活问答 > 生活常识 > 怎么实现站内搜索

怎么实现站内搜索

网站编辑:上海建站网 发布时间:2022-04-15  点击数:
导读:操作步骤/方法1模块化2最近越来越喜欢把任务模块化了,这样单个的功能也比较容易管理,而且整合的时候对集成测试也比较方便。或者添加新功能,重构,都很方便。3针对上面的需求,我这里设计了几个小模块,待会逐个进行解释。4登录模块5登录模块是有点必须的,这是因为在获取博客详细内容的时候,需要有一个已经登录的session会话来支撑,否则拿不到数据。6先前也写过一点关于CSDN模拟登陆的例子,当时完成的功能...
怎么实现站内搜索

操作步骤/方法

1 模块化 2 最近越来越喜欢把任务模块化了,这样单个的功能也比较容易管理,而且整合的时候对集成测试也比较方便。或者添加新功能,重构,都很方便。 3 针对上面的需求,我这里设计了几个小模块,待会逐个进行解释。 4 登录模块 5 登录模块是有点必须的,这是因为在获取博客详细内容的时候,需要有一个已经登录的session会话来支撑,否则拿不到数据。 6 先前也写过一点关于CSDN模拟登陆的例子,当时完成的功能有 7 模拟登陆 8 顶踩文章 9 发评论 10 获取博主详情 11 为了不让别有用心的人拿代码做坏事,我这里就不贴代码了。技术方面欢迎私信,或者在文章下面发评论。 12 下面把模拟登陆的代码补上。 13 博客扫描模块 14 博客扫描这个模块不需要登录状态的支持,完成的功能是扫描博主的文章总数,以及每个文章对应的URL链接。因为接下来会用它来获取文章的详情。 15 博客详情模块 16 关于博客详情,我倒是觉得CSDN做的真不赖。而且是json格式的。话不多说,看下登录状态下能获取到的博客的详细内容吧。 17 这下思路很清晰了,就是要获取标题,URL,标签,摘要描述,文章正文内容。代码如下: 18 搜索模块 19 搜索模块是今天的核心,使用到的库就是whoosh,真的是很贴心的一个库,而且文档详细,简单易懂。我这蹩脚的英文水平都可以,你也一定可以的。 20 默认的文本分析器是英文的,所以为了更好的照顾到中文相关,就得处理一下中文分词,于是在网上抄了一个,不过效果不咋地。 21 演示 22 好了,差不多就是这样了。下面来看下运行的效果。 23 案例一 24 首先看下对于DBHelper这个关键字的搜索,因为文章过多的话计算也是比较慢的,所以就爬取前几篇文章好了。 25 不难发现,本人博客只有前两篇是关于DBHelper的文章,所以命中了这两个document。看起来还不错。 END

  以上就是小编为大家介绍的怎么实现站内搜索的全部内容,如果大家还对相关的内容感兴趣,请持续关注上海建站网!

  标签:
内容声明:网站所展示的内容均由第三方用户投稿提供,内容的真实性、准确性和合法性均由发布用户负责。上海建站网对此不承担任何相关连带责任。上海建站网遵循相关法律法规严格审核相关关内容,如您发现页面有任何违法或侵权信息,欢迎向网站举报并提供有效线索,我们将认真核查、及时处理。感谢您的参与和支持!
浏览此文的人还看过
梦幻诛仙手游 化生攻略
梦幻诛仙手游 化生攻略

详情:操作步骤/方法1初级胚子选择2胚子的选择自然是便宜而且技能不......

dnf七彩迷雾袖珍罐怎么获得?
dnf七彩迷雾袖珍罐怎么获得?

详情:操作步骤/方法1活动时间内,16級以上的玩家进入地下城可以从......

LOL英雄联盟S11暗夜猎手薇
LOL英雄联盟S11暗夜猎手薇

详情:操作步骤/方法1LOLs11赛季建议薇恩带精密系强攻符文,配......

虚空之眼技能加点 英雄联盟虚空
虚空之眼技能加点 英雄联盟虚空

详情:操作步骤/方法1中单加点2中单虚空之眼对线能力不强,核心思想......