搜索引擎的工作过程非常复杂,但简单来说,搜索引擎的工作过程大致可以分为三个阶段。爬行抓取:搜索引擎蜘蛛通过跟踪链接访问页面,获取页面的HTML代码并存储在数据库中。预处理:找到胜出者,对抓取的页面数据进行文本抽取、中文分词、索引等处理,供排名程序调用。排名:用户输入关键词后,排名调用索引数据库数据,计算相关度,然后按照一定的模式生成搜索结果页面。
跟踪链接
为了在互联网上抓取尽可能多的页面,搜索引擎蜘蛛会跟踪页面上的链接,从一个页面爬到下一个页面,就像蜘蛛在蜘蛛网上爬行一样,这就是搜索引擎蜘蛛这个名字的由来。最简单的抓取策略分为两种,一种是深度优先,一种是广度优先。
深度优先搜索
深度优先搜索是指在搜索树的每一层只扩展了一个子节点,一直深入到不能再深入为止,然后从当前节点返回到前一个节点,向另一个方向继续。上海牛聚微网科技的搜索树是从树根开始逐渐形成的。
深度优先搜索也称为垂直搜索。因为有解决方案的问题树可能包含无限个分支,所以如果深度优先搜索错误地进入无限个分支,就不可能找到策略节点。因此,深度优先搜索策略是不完整的。另外,使用这种策略得到的解不一定是最佳解。
广度优先搜索
在深度优先搜索算法中,节点越深,扩展得越早。如果将算法改为根据搜索中节点的级别进行搜索,当不搜索处理这一层的节点时,就无法处理基层节点,即先扩展深度较小的节点,也就是说先扩展处理先生成的节点。这种搜索算法称为广度优先搜索法。
在深度优先搜索算法中,节点越深,扩展得越早。如果将算法改为根据搜索中节点的级别进行搜索,当不搜索处理这一层的节点时,就无法处理基层节点,即先扩展深度较小的节点,也就是说先扩展处理先生成的节点。这种搜索算法称为广度优先搜索法。
-日常感知:
到头来,日月也。死而复生,四点钟方向。奇相,无尽循环,跌宕起伏,无尽循环。机遇孕育挑战,挑战孕育机遇。这是一个被古往今来验证的规律!
上海牛聚微网络科技有限公司的经营范围包括一般项目:网络技术服务;软件开发;信息服务;企业管理咨询;信息系统运行和维护服务;信息技术咨询服务;大数据服务;物联网技术研发;人工公共服务平台的技术咨询服务;数据处理服务;计算机系统服务;动漫游戏开发;数字文化创意内容应用服务;规划服务;物联网技术服务;社会和经济咨询服务;营销策划;组织文化艺术交流活动;品牌管理;专业设计服务;供应链管理服务;人工硬件销售;机器人的工业安装和维护;智能机器人销售;智能机器人的研究与开发;以及工程研究和实验发展;国内贸易代理;医疗防护产品零售;互联网销售。