# toepub_csharp **Repository Path**: woodplus/toepub_csharp ## Basic Information - **Project Name**: toepub_csharp - **Description**: word和pdf转epub - **Primary Language**: C# - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-05-14 - **Last Updated**: 2026-05-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # ToEpub ToEpub 是一个用 C#/.NET 8 编写的 PDF / Word 转 EPUB 工具,包含: - `ToEpub.Core`:转换核心库 - `ToEpub.Cli`:命令行程序 - `ToEpub.Gui`:Windows WinForms 图形界面 - `ToEpub.Tests`:基础结构测试 ## 支持格式 - 输入:`.pdf`、`.docx`、`.docm` - 输出:EPUB 3 `.epub` 旧版二进制 `.doc` 暂不直接支持,请先用 Word 或 LibreOffice 另存为 `.docx`。扫描版 PDF 需要先 OCR,否则无法提取文本。 ## 构建 ```powershell dotnet restore dotnet build ``` ## GUI ```powershell dotnet run --project src\ToEpub.Gui\ToEpub.Gui.csproj ``` 界面支持选择源文件、输出路径、书名、作者、语言标记和覆盖选项。 ## 命令行 ```powershell dotnet run --project src\ToEpub.Cli\ToEpub.Cli.csproj -- [选项] ``` 常用示例: ```powershell dotnet run --project src\ToEpub.Cli\ToEpub.Cli.csproj -- sample.pdf -o sample.epub --title "示例书籍" --overwrite dotnet run --project src\ToEpub.Cli\ToEpub.Cli.csproj -- sample.docx -o D:\Books --author "作者名" ``` 可用选项: ```text -o, --output 输出 .epub 文件路径或输出目录 --title 覆盖书名 --author <author> 覆盖作者 --lang <language> 语言标记,默认 zh-CN --overwrite 允许覆盖已存在的输出文件 --quiet 不输出进度信息 -h, --help 显示帮助 ``` ## 生成的 EPUB 结构 输出包包含 EPUB 阅读器常用的标准文件: - `mimetype` - `META-INF/container.xml` - `OEBPS/package.opf` - `OEBPS/nav.xhtml` - `OEBPS/styles.css` - `OEBPS/text/*.xhtml` ## 测试 ```powershell dotnet test ```