当前位置: 首页 > 生活问答 > 生活常识 > 怎么实现站内搜索

怎么实现站内搜索

网站编辑:上海建站网 发布时间:2022-04-15  点击数:
导读:操作步骤/方法1模块化2最近越来越喜欢把任务模块化了,这样单个的功能也比较容易管理,而且整合的时候对集成测试也比较方便。或者添加新功能,重构,都很方便。3针对上面的需求,我这里设计了几个小模块,待会逐个进行解释。4登录模块5登录模块是有点必须的,这是因为在获取博客详细内容的时候,需要有一个已经登录的session会话来支撑,否则拿不到数据。6先前也写过一点关于CSDN模拟登陆的例子,当时完成的功能...
怎么实现站内搜索

操作步骤/方法

1 模块化 2 最近越来越喜欢把任务模块化了,这样单个的功能也比较容易管理,而且整合的时候对集成测试也比较方便。或者添加新功能,重构,都很方便。 3 针对上面的需求,我这里设计了几个小模块,待会逐个进行解释。 4 登录模块 5 登录模块是有点必须的,这是因为在获取博客详细内容的时候,需要有一个已经登录的session会话来支撑,否则拿不到数据。 6 先前也写过一点关于CSDN模拟登陆的例子,当时完成的功能有 7 模拟登陆 8 顶踩文章 9 发评论 10 获取博主详情 11 为了不让别有用心的人拿代码做坏事,我这里就不贴代码了。技术方面欢迎私信,或者在文章下面发评论。 12 下面把模拟登陆的代码补上。 13 博客扫描模块 14 博客扫描这个模块不需要登录状态的支持,完成的功能是扫描博主的文章总数,以及每个文章对应的URL链接。因为接下来会用它来获取文章的详情。 15 博客详情模块 16 关于博客详情,我倒是觉得CSDN做的真不赖。而且是json格式的。话不多说,看下登录状态下能获取到的博客的详细内容吧。 17 这下思路很清晰了,就是要获取标题,URL,标签,摘要描述,文章正文内容。代码如下: 18 搜索模块 19 搜索模块是今天的核心,使用到的库就是whoosh,真的是很贴心的一个库,而且文档详细,简单易懂。我这蹩脚的英文水平都可以,你也一定可以的。 20 默认的文本分析器是英文的,所以为了更好的照顾到中文相关,就得处理一下中文分词,于是在网上抄了一个,不过效果不咋地。 21 演示 22 好了,差不多就是这样了。下面来看下运行的效果。 23 案例一 24 首先看下对于DBHelper这个关键字的搜索,因为文章过多的话计算也是比较慢的,所以就爬取前几篇文章好了。 25 不难发现,本人博客只有前两篇是关于DBHelper的文章,所以命中了这两个document。看起来还不错。 END

  以上就是小编为大家介绍的怎么实现站内搜索的全部内容,如果大家还对相关的内容感兴趣,请持续关注上海建站网!

  标签:
内容声明:网站所展示的内容均由第三方用户投稿提供,内容的真实性、准确性和合法性均由发布用户负责。上海建站网对此不承担任何相关连带责任。上海建站网遵循相关法律法规严格审核相关关内容,如您发现页面有任何违法或侵权信息,欢迎向网站举报并提供有效线索,我们将认真核查、及时处理。感谢您的参与和支持!
浏览此文的人还看过
小米商城预约后怎么抢购
小米商城预约后怎么抢购

详情:操作步骤/方法1第一步,打开小米商城,找到【手机】分类,点击......

宠物航空托运怎么办理
宠物航空托运怎么办理

详情:操作步骤/方法1办理托运证明文件2健康免疫证明。在机场指定的......

什么是扩容卡?
什么是扩容卡?

详情:操作步骤/方法1扩容卡是什么:扩容卡也叫扩容盘,也叫“黑片”......

围巾的各种织法 男士
围巾的各种织法 男士

详情:操作步骤/方法1玉米花围巾2第一排:第1针挑下不织,第2针为......