AI·你所爱

$大模型训练\部署显存占用估算$

大模型训练\部署显存占用估算

1.经验评估推理显存估算：7B-float 是 28 GB，7B-BF16 是 14GB，7B-int8 是 7GB；其他版本以此类推即可。训练的参数类型，只能是 float / BF16 训练所需显存保守估算是同参数同类型llm 推理的 4倍。例子：7B-float 训练显存：28 * 4 = 112 GB 方法 bits 7B 1

2023-11-25

大模型

#大模型 #部署 #模型训练

LLM 合成数据生成完整指南

LLM 合成数据生成完整指南

大型语言模型(LLM) 是强大的工具，不仅可以生成类似人类的文本，还可以创建高质量的合成数据。这种能力正在改变我们进行 AI 开发的方式，特别是在现实世界数据稀缺、昂贵或隐私敏感的情况下。在本综合指南中，我们将探索 LLM 驱动的合成数据生成，深入探讨其方法、应用和最佳实践。 image-20240812092339558 使用 LLM 进行合成数据生成简介综合数据

2023-10-11

数据工程

#笔记整理 #数据工程 #合成数据

提升模型训练效率的十个Pytorch技巧

提升模型训练效率的十个Pytorch技巧

One cycle学习率策略 Batch size num workers & pin memory 自动混合精度训练 torch.backends.cudnn.benchmark torch.nn.parallel.DistributedDataParallel 梯度累加梯度裁剪 BN前卷积层中的bias 陋习改正在使用 PyTorch 进行深度

2023-10-02

pytorch

#深度学习 #pytorch #干货总结

生成式模型与判别式模型比较

生成式模型与判别式模型比较

生成模型和判别模型是机器学习和统计建模中两种主要的模型类型，它们在目标、方法和应用上有显著的区别。以下是生成模型和判别模型的详细比较：生成模型（Generative Model）目标生成模型的主要目标是建模数据的生成过程，即学习数据的联合分布 ( P(X, Y) )，其中 ( X ) 是输入数据，( Y ) 是标签或输出。方法联合概率分布：生成模型试图学习输入数据和输出标

2023-07-28

概念

#笔记整理 #算法 #模型

用wordcoloud生成超炫酷的词云_内含python源码

用wordcoloud生成超炫酷的词云_内含python源码

使用jieba分词，wordcoloud词云可视化

2023-05-10

#可视化 #数据分析

在LLM时代，Bert为什么不香了？

在LLM时代，Bert为什么不香了？

BERT和T5怎么了？关于Transformer编码器、PrefixLM和去噪目标那些在五年前就从事自然语言处理的人们，现在都在困惑：所有的编码器模型（encoder models）去哪了？如果BERT表现得如此出色，为什么不进行扩展？编码器-解码器模型（ encoder-decoders）或仅编码器模型（encoder-only models）到底发生了什么？今天，我试图解开这一切

2023-05-03

模型架构

#BERT #架构

激活函数简明教程

激活函数简明教程

一、什么是激活函数？在接触到深度学习（Deep Learning）后，特别是神经网络中，我们会发现在每一层的神经网络输出后都会使用一个函数（比如sigmoid，tanh，Relu等等）对结果进行运算，这个函数就是激活函数（Activation Function）。那么为什么需要添加激活函数呢？如果不添加又会产生什么问题呢？

2023-05-02

深度学习

#笔记整理 #深度学习 #激活函数

神经网络核心知识点梳理--一图了然

神经网络核心知识点梳理--一图了然

基于上篇文章的简单入门，这里重点梳理了一下神经网络的核心知识点，并以图片的方式呈现（点击放大哦~）：神经网络核心知识点梳理 1.网络结构 1.1 输入层 1x2矩阵的输入数据X1和X2 Bias(偏置)项作为额外输入,增强模型表达能力 1.2 隐藏层 6维度的神经元结构每个神经元包含加权求和(Σ)和激活函数(f) 常用激活函数: Sigmoid:

2023-05-01

深度学习

#笔记整理 #深度学习 #神经网络

深度学习框架中的动态图与静态图

深度学习框架中的动态图与静态图

深度学习框架中，动态图（Dynamic Computation Graph）和静态图（Static Computation Graph）是两种构建和执行计算图的方式。他们一个面向开发,一个面向部署,各有优势。

2023-04-01

深度学习

#笔记整理 #深度学习 #概念

Pytorch VS TensorFlow

Pytorch VS TensorFlow

TensorFlow和PyTorch是两种流行的深度学习框架，它们各自具有独特的优缺点和优势领域。以下是对它们的比较：

2023-02-26

深度学习

#笔记整理 #深度学习 #学习框架