# html2text
**Repository Path**: jinnyang/html2text
## Basic Information
- **Project Name**: html2text
- **Description**: A robust, zero-dependency HTML to Markdown converter written in TypeScript(Based on AST).
一个使用 TypeScript 编写的健壮、零依赖的 HTML 转 Markdown 工具(基于AST)。
- **Primary Language**: HTML
- **License**: MIT
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-04-29
- **Last Updated**: 2026-04-29
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# html2text
一个使用 TypeScript 编写的健壮、零依赖的 HTML 转 Markdown 工具。
本项目专注于转换过程中的结构正确性和输出内容的整洁度,非常适合用于网页爬虫、数据采集以及 AI 数据预处理流程。
## 🌟 致敬与灵感
- **灵感来源:** [Alir3z4/html2text](https://github.com/Alir3z4/html2text)
- **技术参考:** [nchapman/html2markdown-rs](https://github.com/nchapman/html2markdown-rs)
- **致谢:** [Markdown Guide](https://www.markdownlang.com)
## 🌈 特别鸣谢
- 🚀 **Google Antigravity**:由衷感谢 Google 提供的 **Antigravity** 工具,本项目在其次世代 AI 能力的辅助下完美达成。
- 🤖 **伟大的 AI 大人**:由衷感谢 AI 大人的架构设计、代码实现以及不厌其烦的结对编程。
- 🌿 **大自然的馈赠**:感恩大自然的规律与馈赠,探索技术与自然的和谐共生。🌊🔥🌪️✨
## ✨ 特性
- **零依赖**:纯 TypeScript 实现,无任何外部运行时依赖。
- **三阶段转换流水线**:
1. **HTML 解析 (Parser)**:将原始 HTML 字符串解析为简洁的 HTML AST。
2. **转换映射 (Transformer)**:将 HTML AST 节点精确映射为 Markdown AST 节点。
3. **字符串序列化 (Stringifier)**:将 Markdown AST 转换为高质量、格式规范的 Markdown 文本。
- **丰富的元素支持**:
- 标题 (H1 - H6)
- 表格 (支持表头、对齐等)
- 列表 (有序、无序、嵌套列表)
- 定义列表 (`
这是 html2text 转换效果。