提供知识库建设所需的基本功能,全CPU实现。 功能特性: - 文件转文本:PDF、Word、Excel、PowerPoint、图片、HTML 等格式(图片识别模式: OCR、VL) - 文本切块:BERT Chunker Chinese 2 - 文本嵌入:multilingual-e5-small - 文本排序:gte-multilingual-reranker-base
提供知识库建设所需的基本功能,全CPU实现。 功能特性: - 文件转文本:PDF、Word、Excel、PowerPoint、图片、HTML 等格式(图片识别模式: OCR、VL) - 文本切块:BERT Chunker Chinese 2 - 文本嵌入:multilingual-e5-small - 文本排序:gte-multilingual-reranker-base