Skip to main content
Advanced Search
Search Terms
Content Type

Exact Matches
Tag Searches
Date Options
Updated after
Updated before
Created after
Created before

Search Results

57 total results found

开发

这个网站具体要干什么事情,以及一些开发知识的分享

机器学习/深度学习

机器学习入门、深度学习入门

论文组会

一些论文的讨论

大模型原理

从预训练到后训练的全过程

大模型应用

从应用角度出发,入门大模型

大模型
应用
开发

TEST

test

开发-从入门到入土

009 开发服务器

开发生态

主要介绍开发中常用的一些环境,以下均以 Ubuntu24.04 为例子开展

大模型部署

使用 vllm 、sglang 等高性能生产级部署

LLM学习

工具库

一些可能用到的工具

PyTorch

技术杂谈

一些零散的技术

LLM学习基础

LLM学习

办公工具

工具库

初识LLM

LLM学习

Git 以及 GitHub

开发-从入门到入土

Git & PR 高效指北:核心工作流与常用命令速查 在现代软件开发中,Git 是协作的语言,而 Pull Request (PR) 则是沟通的桥梁。一个清晰、规范的 PR 流程不仅能保证代码质量,更能提升整个团队的开发效率。 本文为你提供一套精炼的 核心工作流 和一份实用的 常用命令锦囊,无论你是团队新人还是资深开发者,都能从中找到价值。 ⭐ 核心 PR 工作流 (The Core Workflow) 这五个步骤构成了最核心、最安全的 PR 提交流程。养成习惯,告别混乱。 第一步:🔄 同步主干 (Sync) 在...

Python 开发 - 基础

开发-从入门到入土

Python 核心精讲:从语法基础到面向对象的深度探索 Python,以其优雅的语法和强大的生态,早已成为从初学者到顶尖工程师的首选语言之一。这篇博客不打算带你从 print("Hello, World!") 开始,而是假设你已迈出第一步,希望为你梳理 Python 的核心脉络,巩固你的知识体系。 我们将从坚实的语法地基出发,深入探讨可变与不可变对象的本质区别,然后巡览现代化的包管理工具,最后在面向对象的世界里构建抽象之美。 坚实的地基:不止于语法糖 语法是语言的骨架。我们不逐一罗列,而是聚焦于那些最核心、最...

Python 开发 - 进阶

开发-从入门到入土

Python 进阶:从装饰器到异步编程的深度探索 当你已经熟练掌握 Python 的基础语法和数据结构后,是时候迈向新的高度了。真正的 Pythonic 代码不仅在于功能的实现,更在于其表达力、优雅性和对更复杂编程范式的驾驭能力。 装饰器:优雅的代码注入艺术 装饰器本质上是一个函数,它接收一个函数作为参数,并返回一个新的函数。它允许我们在不改变原函数代码的情况下,为其增加额外的功能。 核心思想: my_function = my_decorator(my_function)。而 @ 语法只是这行代码的“语法糖”...

GitHub 项目地址

开发-从入门到入土

.project-table { width: 100%; border-collapse: collapse; font-family: sans-serif; } .project-table th, .project-table td { border: 1px solid #ddd; padding: 12px; text-align: left; } .project-table th { background-color: #f2f2f2; font-weight: bold; } .project-...

关系型数据库-MYSQL

开发生态

掌握 MySQL: 从 Docker 部署到 Python 高性能集成 (Ubuntu 24.04) MySQL 是世界上最受欢迎的开源关系型数据库,是无数应用程序背后稳定可靠的数据基石。本指南将带您走过在现代 Linux 环境 (Ubuntu 24.04) 下,从部署到应用集成的完整流程。 使用 Docker 快速部署 MySQL 在 Ubuntu 24.04 上,使用 Docker 部署 MySQL 是最推荐的方式。它干净、隔离、可移植,并且不会污染您的主机环境。 部署 MySQL 容器 执行以下命令...

Python 开发 - Web开发

开发-从入门到入土

Python Web 开发:FastAPI 实战指南 引言 FastAPI 是一个现代、快速(高性能)的 Web 框架,用于构建 API。它基于标准的 Python 类型提示,并提供了许多开箱即用的功能,如自动交互式文档、数据验证和依赖注入。本文将以一个实际的 AI 招聘项目为例,深入探讨 FastAPI 的核心概念和最佳实践。 项目结构 一个组织良好的项目结构是高效开发的基础。下面是我们示例项目的目录结构: . ├── api │ └── v1 │ ├── auth.py │ ├── ...

VLLM 部署 大模型

大模型部署

vLLM 高性能推理部署指南 vLLM 是一个为大型语言模型(LLM)设计的高性能、高吞吐量的推理和服务引擎。它通过创新的 PagedAttention 算法,显著减少了内存浪费,并实现了比传统方法高出数倍的推理速度,使其成为 LLM 服务化部署的行业最佳选择之一。 核心定位: vLLM 专注于文本生成。它目前是纯粹的大语言模型(LLM)推理框架,因此天然不适用于直接部署文生图、文生音频/视频等多模态生成模型。然而,对于文本类任务,包括多模态模型的文本理解与生成部分,vLLM 提供了无与伦比的性...

Docker

开发生态

Docker 完全入门指南:从核心概念到实战演练 在现代软件开发中,你一定听过那句经典的“魔咒”:“在我电脑上明明是好的啊!” Docker 的诞生,就是为了彻底终结这个魔咒。它不仅仅是一个工具,更是一种变革软件开发、测试和部署流程的哲学。 🚀 Docker 解决了什么? 想象一下,你把你的应用程序(代码、依赖库、配置文件、运行时环境)全部打包进一个标准化的、轻量级的“集装箱”里。这个集装箱可以在任何安装了 Docker 的机器上(你的电脑、同事的电脑、测试服务器、云服务器)被完美地、一致地运行,无需关心...

新页面

TEST

https://www.kaggle.com/account/login?titleType=dataset-downloads&showDatasetDownloadSkip=False&messageId=datasetsWelcome&returnUrl=%2Fdatasets%2Feriskafebrianto%2Fdataset-prb-eut-kab-bekasi%2Fversions%2F1%3Fresource%3Ddownload

数学基础

LLM学习 LLM学习基础

线性代数 微积分 概率与统计

Python 基础

LLM学习 LLM学习基础

熟练掌握Python语法 数据结构 面向对象编程

Pandas基础

LLM学习 LLM学习基础

数据处理与分析的利器,尤其擅长处理表格型数据

Matplotlib基础

LLM学习 LLM学习基础

数据可视化

NumPy基础

LLM学习 LLM学习基础

NumPy 基础:大模型中的张量操作 在大模型(LLMs)中,所有数据,包括词嵌入、模型权重、偏置等,都以多维数组(即 张量)的形式存在和处理。NumPy 是 Python 中处理这些数组的基础库。 1. np.array(): 从 Python 列表创建数组 这是将原始数据(如文本转换后的ID序列对应的嵌入向量)加载到模型处理流程的起点。 功能: 从 Python 列表或元组创建 NumPy 数组(张量)。 大模型应用: 加载词嵌入、输入序列等。 import numpy as np # 词嵌入向量 ...

机器学习的四大范式

LLM学习 LLM学习基础

1. 监督学习 (Supervised Learning) 核心思想:从“有标签”的数据中学习,模型的目标是学习一个从输入特征到已知标签的映射函数。 数据形式: 数据集由成对的 (X, y) 组成。 X: 输入特征 (Features)。 y: 对应的正确答案或目标标签 (Label)。 目标: 学习一个映射函数 f,使得 y = f(X)。当有新的、未见过的数据 X_new 输入时,模型能够准确预测出其对应的标签 y_new。 工作流程 数据收集与准备:收集大量的、带有清晰标签的训练数据。 模型...

机器学习算法

LLM学习 LLM学习基础

线性回归 (Linear Regression) 核心思想 (Core Idea): 假设输入特征 (X) 和连续的输出目标 (y) 之间存在线性关系。 目标是找到一个(或一组)最佳的权重 (weights/coefficients) 和偏置 (bias/intercept),使得通过这些参数构建的线性方程能够最好地拟合数据点。 “最好地拟合”通常指最小化预测值与真实值之间的均方误差 (Mean Squared Error, MSE)。 数学表示 (Mathematical Representation...

数据预处理

LLM学习 LLM学习基础

想象一下你要做一道美味的菜肴(比如“宫保鸡丁”),而你手头有一些原始的食材(数据)。直接把原始食材扔进锅里炒,很可能做出来的东西不好吃或者根本不能吃。你需要对食材进行一系列处理,这就是数据预处理。 1. 数据清洗 (Data Cleaning) 通俗例子: 挑拣食材: 你拿到一把青菜,发现里面有些烂叶子、小虫子或者泥土。你需要把这些坏的、脏的、不需要的东西挑出来扔掉。 处理不一致: 你发现有些鸡丁切得特别大,有些特别小,或者有些食谱记录的辣椒单位是“个”,有些是“克”,你需要把它们统一一下。 对应数据...

评估指标

LLM学习 LLM学习基础

核心概念:混淆矩阵 (Confusion Matrix) 在介绍具体的评估指标之前,我们首先需要理解混淆矩阵,因为很多分类指标都源于它。混淆矩阵是一个表格,用于可视化分类模型的性能。对于一个二分类问题(例如,预测“是”或“否”,“正类”或“负类”),混淆矩阵通常如下所示: 预测为正类 (Predicted Positive) 预测为负类 (Predicted Negative) 实际为正类 (Actual Positive) TP (真正例) FN (假负例) 实际为负类 (Actual Neg...

深度学习基础

LLM学习 LLM学习基础

感知机 (Perceptron) 通俗例子: 想象一个非常简单的**“决策机器人”**,它要根据一些输入信息来做一个二选一的决定(比如“去”或“不去”,“是”或“否”)。 收集信息 (输入 Inputs): 机器人收集多个信息片段,比如: 天气好不好?(x₁) 朋友去不去?(x₂) 今天心情如何?(x₃) 这些信息可以是数值(比如天气评分1-10)或者0/1的布尔值。 给信息赋予权重 (Weights): 机器人对每个信息的重要性有不同的看法: 天气可能很重要 (w₁ = 0.5) 朋友去不去非常重...

Scikit-learn基础

LLM学习 LLM学习基础

传统机器学习算法、数据预处理、模型评估