Recently Updated Pages
ros1
wget http://fishros.com/install -O fishros && bash fishros rosdepc update roscore rosrun turtlesi...
Docker
Docker 完全入门指南:从核心概念到实战演练 在现代软件开发中,你一定听过那句经典的“魔咒”:“在我电脑上明明是好的啊!” Docker 的诞生,就是为了彻底终结这个魔咒。它不仅仅是一个工具...
微信本地数据库破解
简述参考 https://www.52pojie.cn/thread-1084703-1-1.html 详解:https://www.cnblogs.com/RainbowTechnology/...
新页面
好的,这是一个非常经典的高性能计算(HPC)和AI集群的搭建需求。你拥有非常棒的硬件基础(8台8卡服务器 + IB网络),搭建一个高效、易用的系统是完全可行的。 下面我将为你提供一套完整的、分阶...
微调
LLM 微调 (Fine-tuning): 概述 在预训练阶段,大语言模型(LLM)通过在海量通用文本数据上进行训练,学习到了广泛的语言知识、语法结构、世界常识以及一定的推理能力。然而,这些预训...
Pytorch 数学运算
PyTorch 数学运算核心指南:从 sum 到 @ 在深度学习的引擎盖下,一切皆为数学。损失的计算、梯度的传播、权重的更新、性能的评估,每一个环节都离不开大量的数学运算。PyTorch 提供了...
Pytorch Tensor 变换
PyTorch 维度变换权威指南:从 view 到 permute 在 PyTorch 中,数据以张量(Tensor)的形式流动。如果你想自如地构建、调试和优化神经网络,那么精通张量维度的变换操...
Pytorch nn AND nn.Functional
PyTorch API 技术指南:原理与实践 本指南旨在为开发者提供一份关于 PyTorch 核心 API 的技术参考。内容涵盖了从模型架构定义到高级张量操作的常用接口,并对每个 API 的基本...
prompt工程
Prompt 工程(Prompt Engineering)可以被视为一门设计和优化输入提示(Prompt)的艺术和科学,以指导大型语言模型(LLM)高效、准确地完成特定任务。 下面我为你梳理一下...
预训练LLM的宏观流程
好的,预训练一个大语言模型 (LLM) 是一个复杂且资源密集型的过程。下面是从头到尾的宏观流程,不涉及具体代码细节,但会涵盖关键步骤和考量: 阶段一:规划与准备 (The Blueprint) ...
一个简单的预训练代码(了解流程即可)
好的,这里提供一个使用 PyTorch 构建的极简 Decoder-only Transformer(类似 GPT-like 结构)进行预训练(Causal Language Modeling ...
主流预训练模型
好的,我们来梳理一下这些主流预训练模型的特点、适用场景和预训练方式。这是一个庞大且快速发展的领域,我会尽量概括核心信息。 核心概念理解: 预训练 (Pre-training): 在大规模无标签...
Jupyter 安装配置
🚀 Ubuntu 下的 Jupyter 终极配置指南:从安装到多环境管理 Jupyter Notebook/Lab 是数据科学、机器学习乃至日常编程探索的瑞士军刀。然而,一个干净、可扩展、能轻松...
PyTorch 复数相关
解锁 PyTorch 中的复数之力:从基础到 RoPE 实战指南 在机器学习的广阔天地里,我们通常与实数打交道。但当进入信号处理、量子计算,乃至像 LLaMA 这样先进大语言模型的底层实现时,复...
Transformer架构 (LLM的基石)
整体概览: 这张图展示了一个典型的编码器-解码器 (Encoder-Decoder) 架构的 Transformer。 左半部分 (蓝色框,标号2) 是 编码器 (Encoder),负责理解...
Attention注意力机制
自注意力机制 Self-Attention (https://space.bilibili.com/88461692/lists) 不懂去这个链接看视频 想象一下你在阅读一个句子,比如:“银行旁...
基于LSTM的文本分类任务
重点 正确的理解应该是(针对标准 Seq2Seq,不考虑有特殊输出层的编码器): h_1 和 c_1 的传递: 正如我们之前讨论的,在编码器的每个隐含层,h_t 和 c_t 会一直向后传递到...
自然语言处理 (NLP) 基础
文本预处理 原始的文本数据充满了各种“噪音”和“冗余”,直接将其用于机器学习模型通常效果不佳。文本预处理的目标是将原始文本转换为一种更干净、更结构化、更适合模型学习的形式。 1. 分词 (To...
Pandas基础
数据处理与分析的利器,尤其擅长处理表格型数据
循环神经网络RNN
RNN基本原理 想象一下你在读一句话,或者听别人说话。 你的大脑是怎么工作的? 当你读到或听到一个词时,你不仅仅是理解这个词本身的意思,你还会结合前面已经读过或听过的词来理解当前这个词在整...