Advanced Search
Search Results
57 total results found
开发
这个网站具体要干什么事情,以及一些开发知识的分享
机器学习/深度学习
机器学习入门、深度学习入门
论文组会
一些论文的讨论
大模型原理
从预训练到后训练的全过程
大模型应用
从应用角度出发,入门大模型
TEST
test
开发-从入门到入土
009 开发服务器
开发生态
主要介绍开发中常用的一些环境,以下均以 Ubuntu24.04 为例子开展
大模型部署
使用 vllm 、sglang 等高性能生产级部署
LLM学习
工具库
一些可能用到的工具
PyTorch
技术杂谈
一些零散的技术
LLM学习基础
办公工具
初识LLM
Git 以及 GitHub
Git & PR 高效指北:核心工作流与常用命令速查 在现代软件开发中,Git 是协作的语言,而 Pull Request (PR) 则是沟通的桥梁。一个清晰、规范的 PR 流程不仅能保证代码质量,更能提升整个团队的开发效率。 本文为你提供一套精炼的 核心工作流 和一份实用的 常用命令锦囊,无论你是团队新人还是资深开发者,都能从中找到价值。 ⭐ 核心 PR 工作流 (The Core Workflow) 这五个步骤构成了最核心、最安全的 PR 提交流程。养成习惯,告别混乱。 第一步:🔄 同步主干 (Sync) 在...
Python 开发 - 基础
Python 核心精讲:从语法基础到面向对象的深度探索 Python,以其优雅的语法和强大的生态,早已成为从初学者到顶尖工程师的首选语言之一。这篇博客不打算带你从 print("Hello, World!") 开始,而是假设你已迈出第一步,希望为你梳理 Python 的核心脉络,巩固你的知识体系。 我们将从坚实的语法地基出发,深入探讨可变与不可变对象的本质区别,然后巡览现代化的包管理工具,最后在面向对象的世界里构建抽象之美。 坚实的地基:不止于语法糖 语法是语言的骨架。我们不逐一罗列,而是聚焦于那些最核心、最...
Python 开发 - 进阶
Python 进阶:从装饰器到异步编程的深度探索 当你已经熟练掌握 Python 的基础语法和数据结构后,是时候迈向新的高度了。真正的 Pythonic 代码不仅在于功能的实现,更在于其表达力、优雅性和对更复杂编程范式的驾驭能力。 装饰器:优雅的代码注入艺术 装饰器本质上是一个函数,它接收一个函数作为参数,并返回一个新的函数。它允许我们在不改变原函数代码的情况下,为其增加额外的功能。 核心思想: my_function = my_decorator(my_function)。而 @ 语法只是这行代码的“语法糖”...
GitHub 项目地址
.project-table { width: 100%; border-collapse: collapse; font-family: sans-serif; } .project-table th, .project-table td { border: 1px solid #ddd; padding: 12px; text-align: left; } .project-table th { background-color: #f2f2f2; font-weight: bold; } .project-...
关系型数据库-MYSQL
掌握 MySQL: 从 Docker 部署到 Python 高性能集成 (Ubuntu 24.04) MySQL 是世界上最受欢迎的开源关系型数据库,是无数应用程序背后稳定可靠的数据基石。本指南将带您走过在现代 Linux 环境 (Ubuntu 24.04) 下,从部署到应用集成的完整流程。 使用 Docker 快速部署 MySQL 在 Ubuntu 24.04 上,使用 Docker 部署 MySQL 是最推荐的方式。它干净、隔离、可移植,并且不会污染您的主机环境。 部署 MySQL 容器 执行以下命令...
Python 开发 - Web开发
Python Web 开发:FastAPI 实战指南 引言 FastAPI 是一个现代、快速(高性能)的 Web 框架,用于构建 API。它基于标准的 Python 类型提示,并提供了许多开箱即用的功能,如自动交互式文档、数据验证和依赖注入。本文将以一个实际的 AI 招聘项目为例,深入探讨 FastAPI 的核心概念和最佳实践。 项目结构 一个组织良好的项目结构是高效开发的基础。下面是我们示例项目的目录结构: . ├── api │ └── v1 │ ├── auth.py │ ├── ...
VLLM 部署 大模型
vLLM 高性能推理部署指南 vLLM 是一个为大型语言模型(LLM)设计的高性能、高吞吐量的推理和服务引擎。它通过创新的 PagedAttention 算法,显著减少了内存浪费,并实现了比传统方法高出数倍的推理速度,使其成为 LLM 服务化部署的行业最佳选择之一。 核心定位: vLLM 专注于文本生成。它目前是纯粹的大语言模型(LLM)推理框架,因此天然不适用于直接部署文生图、文生音频/视频等多模态生成模型。然而,对于文本类任务,包括多模态模型的文本理解与生成部分,vLLM 提供了无与伦比的性...
Docker
Docker 完全入门指南:从核心概念到实战演练 在现代软件开发中,你一定听过那句经典的“魔咒”:“在我电脑上明明是好的啊!” Docker 的诞生,就是为了彻底终结这个魔咒。它不仅仅是一个工具,更是一种变革软件开发、测试和部署流程的哲学。 🚀 Docker 解决了什么? 想象一下,你把你的应用程序(代码、依赖库、配置文件、运行时环境)全部打包进一个标准化的、轻量级的“集装箱”里。这个集装箱可以在任何安装了 Docker 的机器上(你的电脑、同事的电脑、测试服务器、云服务器)被完美地、一致地运行,无需关心...
新页面
https://www.kaggle.com/account/login?titleType=dataset-downloads&showDatasetDownloadSkip=False&messageId=datasetsWelcome&returnUrl=%2Fdatasets%2Feriskafebrianto%2Fdataset-prb-eut-kab-bekasi%2Fversions%2F1%3Fresource%3Ddownload
数学基础
线性代数 微积分 概率与统计
Python 基础
熟练掌握Python语法 数据结构 面向对象编程
Pandas基础
数据处理与分析的利器,尤其擅长处理表格型数据
Matplotlib基础
数据可视化
NumPy基础
NumPy 基础:大模型中的张量操作 在大模型(LLMs)中,所有数据,包括词嵌入、模型权重、偏置等,都以多维数组(即 张量)的形式存在和处理。NumPy 是 Python 中处理这些数组的基础库。 1. np.array(): 从 Python 列表创建数组 这是将原始数据(如文本转换后的ID序列对应的嵌入向量)加载到模型处理流程的起点。 功能: 从 Python 列表或元组创建 NumPy 数组(张量)。 大模型应用: 加载词嵌入、输入序列等。 import numpy as np # 词嵌入向量 ...
机器学习的四大范式
1. 监督学习 (Supervised Learning) 核心思想:从“有标签”的数据中学习,模型的目标是学习一个从输入特征到已知标签的映射函数。 数据形式: 数据集由成对的 (X, y) 组成。 X: 输入特征 (Features)。 y: 对应的正确答案或目标标签 (Label)。 目标: 学习一个映射函数 f,使得 y = f(X)。当有新的、未见过的数据 X_new 输入时,模型能够准确预测出其对应的标签 y_new。 工作流程 数据收集与准备:收集大量的、带有清晰标签的训练数据。 模型...
机器学习算法
线性回归 (Linear Regression) 核心思想 (Core Idea): 假设输入特征 (X) 和连续的输出目标 (y) 之间存在线性关系。 目标是找到一个(或一组)最佳的权重 (weights/coefficients) 和偏置 (bias/intercept),使得通过这些参数构建的线性方程能够最好地拟合数据点。 “最好地拟合”通常指最小化预测值与真实值之间的均方误差 (Mean Squared Error, MSE)。 数学表示 (Mathematical Representation...
数据预处理
想象一下你要做一道美味的菜肴(比如“宫保鸡丁”),而你手头有一些原始的食材(数据)。直接把原始食材扔进锅里炒,很可能做出来的东西不好吃或者根本不能吃。你需要对食材进行一系列处理,这就是数据预处理。 1. 数据清洗 (Data Cleaning) 通俗例子: 挑拣食材: 你拿到一把青菜,发现里面有些烂叶子、小虫子或者泥土。你需要把这些坏的、脏的、不需要的东西挑出来扔掉。 处理不一致: 你发现有些鸡丁切得特别大,有些特别小,或者有些食谱记录的辣椒单位是“个”,有些是“克”,你需要把它们统一一下。 对应数据...
评估指标
核心概念:混淆矩阵 (Confusion Matrix) 在介绍具体的评估指标之前,我们首先需要理解混淆矩阵,因为很多分类指标都源于它。混淆矩阵是一个表格,用于可视化分类模型的性能。对于一个二分类问题(例如,预测“是”或“否”,“正类”或“负类”),混淆矩阵通常如下所示: 预测为正类 (Predicted Positive) 预测为负类 (Predicted Negative) 实际为正类 (Actual Positive) TP (真正例) FN (假负例) 实际为负类 (Actual Neg...
深度学习基础
感知机 (Perceptron) 通俗例子: 想象一个非常简单的**“决策机器人”**,它要根据一些输入信息来做一个二选一的决定(比如“去”或“不去”,“是”或“否”)。 收集信息 (输入 Inputs): 机器人收集多个信息片段,比如: 天气好不好?(x₁) 朋友去不去?(x₂) 今天心情如何?(x₃) 这些信息可以是数值(比如天气评分1-10)或者0/1的布尔值。 给信息赋予权重 (Weights): 机器人对每个信息的重要性有不同的看法: 天气可能很重要 (w₁ = 0.5) 朋友去不去非常重...
Scikit-learn基础
传统机器学习算法、数据预处理、模型评估