深入理解深度学习——Word Embedding（三）：Skip-Gram模型

von Neumann

发布时间 2023.05.13阅读数 1523 评论数 0

· Word Embedding（一）：word2vec
· Word Embedding（二）：连续词袋模型（CBOW, The Continuous Bag-of-Words Model）
· Word Embedding（三）：Skip-Gram模型
· Word Embedding（四）：Skip-Gram模型的数学原理
· Word Embedding（五）：基于哈夫曼树（Huffman Tree）的Hierarchical Softmax优化
· Word Embedding（六）：负采样（Negative Sampling）优化

Skip-Gram模型与连续词袋模型（CBOW）类似，同样包含三层：输入层、映射层和输出层。具体架构如下图所示：

Skip-Gram模型中的w(t)为输入词，在已知词w(t)的前提下预测词w(t)的上下文w(t−n)、⋯、w(t−2)、w(t−1)、w(t+1)、(t+2)、⋯ w(t+n)，条件概率写为p(context(w)∣w)。目标
函数为：

我们通过一个简单的例子来说明Skip-Gram的基本思想。假设有一句话：

The quick brown fox jumped over the lazy dog.

接下来，我们根据Skip-Gram模型的基本思想，按这条语句生成一个由序列（输入，输出）构成的数据集。首先，我们对一些单词以及它们的上下文环境建立一个数据集。可以以任何合理的方式定义“上下文”，这里是把目标单词的左右单词视作一个上下文，使用大小为1的窗口定义，也就是说，仅选输入词前后各1个词和输入词进行组合，就得到一个由（上下文，目标单词）组成的数据集，具体如下图所示：

人工智能建模仿真机器学习深度学习

打赏 0

上一篇：深入理解深度学习——Word Embedding（六）：负采样（Negative Sampling）优化

下一篇：深入理解深度学习——Word Embedding（二）：连续词袋模型（CBOW, The Continuous Bag-of-Words Model）

深入理解深度学习——Word Embedding（三）：Skip-Gram模型

von Neumann

为你推荐

计算机视觉中的transformer模型创新思路总结

(4) 线性分类 Linear Classification (b) : Logistic 回归，判别式与生成式模型，广义线性模型 - PRML && CS229

自然语言处理从入门到应用——自然语言处理的应用任务

YOLO系列梳理（九）初尝新鲜出炉的YOLOv6

widerperson数据集转化为YOLOv5训练格式，并加入到crowdhuman中

【深度学习】经典网络-(InceptionV3)GoogLeNet网络复现(使用Tensorflow实现)

关于作者

von Neumann

47

0

0

2

精选深入理解深度学习——Item Embedding

精选自然语言处理从入门到应用——自然语言处理（Natural Language Processing，NLP）基础知识

自然语言处理从入门到应用——自然语言处理的语言模型（Language Model，LM）

相关推荐

（三十二）通俗易懂理解——YOLOv1原理与实现

差分卷积在计算机视觉中的应用

Python机器学习之k-means聚类算法

TensorFlow学习——Tensorflow Object Detection API（win10，CPU）

深度神经网络（DNN）模型与前向传播算法

强化学习在游戏AI中的应用与挑战

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

深入理解深度学习——Word Embedding（三）：Skip-Gram模型

von Neumann

为你推荐

计算机视觉中的transformer模型创新思路总结

(4) 线性分类 Linear Classification (b) : Logistic 回归，判别式与生成式模型，广义线性模型 - PRML && CS229

自然语言处理从入门到应用——自然语言处理的应用任务

YOLO系列梳理（九）初尝新鲜出炉的YOLOv6

widerperson数据集转化为YOLOv5训练格式，并加入到crowdhuman中

【深度学习】经典网络-(InceptionV3)GoogLeNet网络复现(使用Tensorflow实现)

评论（0）

关于作者

von Neumann

47

0

0

2

精选深入理解深度学习——Item Embedding

精选自然语言处理从入门到应用——自然语言处理（Natural Language Processing，NLP）基础知识

自然语言处理从入门到应用——自然语言处理的语言模型（Language Model，LM）

相关推荐

（三十二）通俗易懂理解——YOLOv1原理与实现

差分卷积在计算机视觉中的应用

Python机器学习之k-means聚类算法

TensorFlow学习——Tensorflow Object Detection API（win10，CPU）

深度神经网络（DNN）模型与前向传播算法

强化学习在游戏AI中的应用与挑战

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板