搜索引擎基本上是旨在搜索数据库中与用户给定的查询匹配的项目的程序。
搜索引擎应用程序的图表结构
在上面的图表结构中,可以看到搜索引擎应用程序有后端和前端两个侧面。
后端收集数据集并索引数据集,而前端端管理搜索引擎接口并向后端提供查询以进行排名
后端
爬虫通常是指处理大型数据集,您可以在其中开发自己的爬虫(或机器人),这些爬虫可以爬到网页的最深处。
索引被定义为一种数据结构技术,它允许您从数据库文件中快速检索记录
前端
查询是指用户用来从数据集中查找用户所需的数据的关键字。在索引过程中,每个数据集对每个单词查询都有一个分数,这个分数计算的结果将决定每个数据集的排名
我们将在以下环境中开发它:
您可以在官网 python.org 下载最新的python。
通过键入以下命令检查已安装的 Python 3 版本:
python3 -V//Output
Python 3.7.2
要管理 Python 的软件包,请安装 pip,该工具将安装和管理要在项目中使用的库或模块。
sudo apt install -y python3-pip
可以通过键入以下命令来安装 Python 包:
pip install package_name
在这里,可以引用任何 Python 包或库。因此,如果您想安装 Scrapy,可以使用以下命令进行安装。
2. 安装 Laravel 框架
Laravel 利用 Composer 来管理其依赖项。因此,在使用 Laravel 之前,请确保您的计算机上安装了 Composer。
您可以通过在终端中发出 Composer 命令来安装 Laravel:create-project
composer create-project --prefer-dist laravel/laravel SearchEngine
我希望您发现本教程的第一部分对您有所帮助。我们了解了什么是搜索引擎以及它是如何工作的。
在下一部分中,我们将使用 Python Scrapy 从另一个网页收集数据集,并使我们的搜索引擎正常工作!
源代码获取:公众号回复消息【code:38113
】