# search_engine **Repository Path**: Chzq-z/search_engine ## Basic Information - **Project Name**: search_engine - **Description**: search engine - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2023-05-02 - **Last Updated**: 2023-05-12 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 项目文件结构 ``` . ├── add_include_index.sh # 生成头文件索引 ├── CMakeLists.txt ├── data # 存放所需数据以及保存生成的数据文件 │   ├── cn_art/ # 中文文章 │   ├── dict/ # 分词使用字典 │   ├── en_art/ # 英文文章 │   ├── stop_words_eng.txt # 英文停用词 │   ├── stop_words_zh.txt # 中文停用词 │   └── yuliao/ # 语料,xml文件 ├── include/ # 所有头文件 ├── conf/ # 配置文件目录 ├── log/ # 日志目录 ├── Makefile ├── README.md └── src/ # 所有源文件 ``` ### 添加头文件索引 ```shell sh add_include_index.sh ``` ### 编译 该项目可用两种方式编译,生成的文件在bin中 #### 1. 使用Makefile ```shell make ``` 清理`.o`文件 ```shell make clean ``` 清理所有文件 ```shel make clear ``` #### 2. 使用cmake(推荐) 需要cmake,如果没有cmake需要先安装cmake ```shell mkdir build cd build cmake .. make ``` ### 使用方式 先进行编译,编译之后会生成4个可执行文件 ``` bin ├── build_dict # 用于生成中英文字典及其索引 ├── build_web_page # 用于生成网页库、网页索引库、倒排索引库 ├── client # 客户端 └── server # 服务端 ``` 先生成数据文件 ``` cd bin ./build_dict ./build_web_page ``` 生成后的数据文件 ``` data ├── cn_art ├── cn_dict.dat # 中文词典 ├── cn_index.dat # 中文词典索引 ├── dict ├── en_art ├── en_dict.dat # 英文词典 ├── en_index.dat # 英文词典索引 ├── invertIndex.dat # 网页倒排索引库 ├── offsetlib.dat # 网页偏移库 ├── ripepage.dat # 网页库 ├── stop_words_eng.txt ├── stop_words_zh.txt └── yuliao ``` 启动服务端,指定配置文件路径 ```shell cd bin ./server ../conf/search_engine.conf ``` 启动客户端,指定ip和端口号 ```shell cd bin ./client 127.0.0.1 8888 ```