# verl-optim **Repository Path**: gp513/verl-optim ## Basic Information - **Project Name**: verl-optim - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-05-20 - **Last Updated**: 2025-05-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 优化verl/utils/torch_functional.py中的entropy_from_logits()。 原始输入shape为(seq, vocab),最大约为(20k, 150k),fp32下约6个G。 原始实现中峰值内存包含一个转fp32的tensor作为softmax输入,以及一个softmax输出。由于softmax无inplace实现,峰值增长10个G多。 这里把logits按第0维分块,由于softmax、logsumexp都是延第1维,分块计算与原始实现数学等价。 性能劣化一点,峰值内存省10G。 ![输入图片说明](picE32E8702-43C4-4A1C-811A-675639BDF53F.png) ![输入图片说明](pic8A9DDCCF-50D9-4F31-AE15-247DA565F760.png)