形状|黑砂博客

d2l Transformer

终于到变形金刚了，他的主要特征在于多头自注意力的使用，以及摒弃了rnn的操作。目录 1.原理 2.多头注意力 3.逐位前馈网络FFN 4.层归一化 5.残...

d2 03-22 0 28 文章列表

这一章节与前面写好的function关联太大，建议看书P291. 这章节主要讲述了添加attention的seq2seq,且只在decoder里面添加，所以全文都在讲这个de...

d2 03-22 0 118 文章列表

本章节tensor处理操作也不少，逐个讲解下：目录 1.mask_softmax 1.1探索源码d2l.sequence_mask 2.加性注意力 3.缩放注意力 1.mask_softmax ...

d2 03-22 0 274 文章列表

嘿，朋友们！今天咱们来聊聊Numpy的运算符和批处理，这玩意儿不仅仅是代码里的“加减乘除”，它可是深度学习中“底层打工人”的必备技能！你可能会问，这些运算符...

nu 03-22 0 510 文章列表

1.创建矩阵 1. 全零矩阵：tf.zeros(shape, dtype=None, name=None) - shape参数指定了矩阵的形状，可以是一个整数列表或元组。 - dty...

jr 03-22 0 731 文章列表

seq2seq难死了，卡了好久，好不容易有些头绪了。。。目录 1.编码器与解码器 1.1原理 1.2实现 2.seq2seq 2.1构造编码器 2.2构造解码器 repeat与...

d2 03-22 0 343 文章列表

在一个给定形状的棋盘（形状可能是不规则的）上面摆放棋子，棋子没有区别。要求摆放时任意的两个棋子不能放在棋盘中的同一行或者同一列&#...

rp 03-21 0 437 文章列表

1. 功能说明通过摄像头识别圆形及矩形两种形状。 2. 电子硬件本实验中采用了以下硬件：主控板 Basra主控板（兼容Arduino Uno&#x...

rh 03-21 0 708 文章列表

Random Binning Feature（RBF）介绍代码附录-详细解释介绍 Random Binning Feature（RBF）。RBF 将输入数据映射到固定...

js 03-21 0 506 文章列表

ViT模型何时才能破万亿？ Transformer无疑是促进自然语言处理领域繁荣的最大功臣，也是GPT-4等大规模语言模型的基础架构。不过相比语言模型动...

cv 03-21 0 266 文章列表