收藏 分享(赏)

word2vec的数学原理.doc

上传人:精品资料 文档编号:11148533 上传时间:2020-02-09 格式:DOC 页数:42 大小:9.81MB
下载 相关 举报
word2vec的数学原理.doc_第1页
第1页 / 共42页
word2vec的数学原理.doc_第2页
第2页 / 共42页
word2vec的数学原理.doc_第3页
第3页 / 共42页
word2vec的数学原理.doc_第4页
第4页 / 共42页
word2vec的数学原理.doc_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、 word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 3,4 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟。第一次接触 word2vec 是 2013 年的 10 月份,当时读了复旦大学郑骁庆老师发表的论文7,其主要工作是将 SENNA 的那套算法(8)搬到中文场景。觉得挺有意思,于是做了一个实现(可参见20),但苦于其中字向量的训练时间太长,

2、便选择使用 word2vec 来提供字向量,没想到中文分词效果还不错,立马对 word2vec 刮目相看了一把,好奇心也随之增长。后来,陆陆续续看到了 word2vec 的一些具体应用,而 Tomas Mikolov 团队本身也将其推广到了句子和文档(6),因此觉得确实有必要对 word2vec 里的算法原理做个了解,以便对他们的后续研究进行追踪。于是,沉下心来,仔细读了一回代码,算是基本搞明白里面的做法了。第一个感觉就是,“明明是个很简单的浅层结构,为什么会被那么多人沸沸扬扬地说成是 Deep Learning 呢?”解剖 word2vec 源代码的过程中,除了算法层面的收获,其实编程技巧方面的收获也颇多。既然花了功夫来读代码,还是把理解到的东西整理成文,给有需要的朋友提供点参考吧。在整理本文的过程中, 和深度学习群的群友北流浪子(15,16)进行了多次有益的讨论,在此表示感谢。另外,也参考了其他人的一些资料,都列在参考文献了,在此对他们的工作也一并表示感谢。Comment S1:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报