# study_llm **Repository Path**: justinruan/study_llm ## Basic Information - **Project Name**: study_llm - **Description**: No description available - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2026-04-30 - **Last Updated**: 2026-05-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # study_llm #### 介绍 (1)基于SGLang本地部署实验(task1_ SGL) - 学习SGLang框架,进行本地部署Qwen 2B模型(或更小的),以及4-Bit量化后版本。 (2)基于PyTorch的LLM的推理实验(task2_HappyLLM) - 在本地跑通Happy-LLM SFT版本的推理过程,验证基于PyTorch环境下的模型使用。使用0.5M的数据集进行测试。训练数据为BelleGroup。 (3)基于PyTorch的QWen(带CoT)的推理实验(task3_GSM8K) - 在本地跑通Qwen 2B模型(或更小的),验证基于PyTorch环境下的模型使用,跑通对GSM8K数据集的测试。 (4)基于PyTorchFI的故障注入实验(task4_FI) - 生成一个简单的神经网络,比如:ResNet18 - 使用Cifar10或MNIST数据集训练它,测试它 - 使用PyTorchFI的故障注入工具,在测试时对它进行有效攻击,得到劣化的指标。 - 收集攻击方式和攻击效果的对应数据。 (5) 基于PyTorchFI的故障注入实验(task5) - Claude Opus 4.7生成的项目,进行故障注入实验。 (6) 微调实验(task6) (7) 蒸馏实验(task7)