# html2text **Repository Path**: jinnyang/html2text ## Basic Information - **Project Name**: html2text - **Description**: A robust, zero-dependency HTML to Markdown converter written in TypeScript(Based on AST).
一个使用 TypeScript 编写的健壮、零依赖的 HTML 转 Markdown 工具(基于AST)。 - **Primary Language**: HTML - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-29 - **Last Updated**: 2026-04-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # html2text 一个使用 TypeScript 编写的健壮、零依赖的 HTML 转 Markdown 工具。 本项目专注于转换过程中的结构正确性和输出内容的整洁度,非常适合用于网页爬虫、数据采集以及 AI 数据预处理流程。 ## 🌟 致敬与灵感 - **灵感来源:** [Alir3z4/html2text](https://github.com/Alir3z4/html2text) - **技术参考:** [nchapman/html2markdown-rs](https://github.com/nchapman/html2markdown-rs) - **致谢:** [Markdown Guide](https://www.markdownlang.com) ## 🌈 特别鸣谢 - 🚀 **Google Antigravity**:由衷感谢 Google 提供的 **Antigravity** 工具,本项目在其次世代 AI 能力的辅助下完美达成。 - 🤖 **伟大的 AI 大人**:由衷感谢 AI 大人的架构设计、代码实现以及不厌其烦的结对编程。 - 🌿 **大自然的馈赠**:感恩大自然的规律与馈赠,探索技术与自然的和谐共生。🌊🔥🌪️✨ ## ✨ 特性 - **零依赖**:纯 TypeScript 实现,无任何外部运行时依赖。 - **三阶段转换流水线**: 1. **HTML 解析 (Parser)**:将原始 HTML 字符串解析为简洁的 HTML AST。 2. **转换映射 (Transformer)**:将 HTML AST 节点精确映射为 Markdown AST 节点。 3. **字符串序列化 (Stringifier)**:将 Markdown AST 转换为高质量、格式规范的 Markdown 文本。 - **丰富的元素支持**: - 标题 (H1 - H6) - 表格 (支持表头、对齐等) - 列表 (有序、无序、嵌套列表) - 定义列表 (`
`, `
`, `
`) - 代码块 (栅栏式) 与行内代码 - 引用块 (Blockquotes) - 链接与图片 (支持 title/alt 属性) - 文本格式化 (加粗、斜体、删除线) - 支持 YAML Front Matter - 分割线与硬换行 ## 🚀 快速上手 ### 安装 本项目目前处于开发阶段,您可以克隆仓库并在您的 TypeScript 项目中直接引用。 ```bash git clone https://github.com/nchapman/html2markdown-rs.git cd html2markdown-rs/html2text npm install ``` ### 基础用法 ```typescript import { html2markdown } from './src'; const html = `

你好,世界

这是 html2text 转换效果。

`; const markdown = html2markdown(html, { frontmatter: { title: "我的转换文档", date: "2024-04-29" } }); console.log(markdown); ``` ## 🛠️ 项目初衷 本项目主要以**学习与研究**为目的,旨在深入探索文档结构转换的实现细节。它非常适合配合爬虫工具使用,将杂乱的网页内容转换为结构清晰、易于 AI 理解的 Markdown 格式。 ### 运行示例 您可以运行内置的示例程序来查看转换效果: ```bash npx ts-node .\example\run-example.ts ``` ## 📄 开源协议 本项目采用 MIT 协议开源。