归档 | 南极Python

文章总览 - 173

2025

test

2025-05-08

LLM指令微调：训练一个人工智能助手-大模型炼丹术(八)

2025-04-10

LLM指令微调：训练一个人工智能助手-大模型炼丹术(八)

LLM微调：训练一个垃圾邮件分类器-大模型炼丹术(七)

2025-03-23

LLM微调：训练一个垃圾邮件分类器-大模型炼丹术(七)

剖析LLM的解码策略-大模型炼丹术(六)

2025-03-12

剖析LLM的解码策略-大模型炼丹术(六)

LLM自回归预训练过程详解-大模型炼丹术(五)

2025-03-11

LLM自回归预训练过程详解-大模型炼丹术(五)

动手搭建GPT2架构-大模型炼丹术(四)

2025-03-07

动手搭建GPT2架构-大模型炼丹术(四)

从单头到多头，深度解析大模型的注意力机制-大模型炼丹术(三)

2025-03-04

从单头到多头，深度解析大模型的注意力机制-大模型炼丹术(三)

从离散的token IDs到具有语义信息的embedding-大模型炼丹术(二)

2025-02-24

从离散的token IDs到具有语义信息的embedding-大模型炼丹术(二)

从tokenizer说起，为LLM自回归预训练准备数据集-大模型炼丹术(一)

2025-02-20

从tokenizer说起，为LLM自回归预训练准备数据集-大模型炼丹术(一)

2024

把数据预处理搬到GPU-英伟达DALI加速数据预处理

2024-12-30

把数据预处理搬到GPU-英伟达DALI加速数据预处理