图嵌入和随机游走

发布时间:2021-08-09  栏目:人工智能  评论:0 Comments

图嵌入(Graph Embedding,也叫Network Embedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。

当前比较知名的图嵌入方法有DeepWalk、Line和Node2vec,这些都是基于顶点对相似度的图表示学习,仅仅保留了一部分的图的特性。

Word2vec方法和Skip-Gram模型。它们是图嵌入方法的基础。

word2vec的思想可以简单的归结为一句话:利用海量的文本序列,根据上下文单词预测目标单词共现的概率,让一个构造的网络向概率最大化优化,得到的参数矩阵就是单词的向量。

所以Word2vec 本质上是一种降维操作——把词语从 one-hot encoder 形式的表示降维到 Word2vec 形式的表示。

Word2Vec模型中,主要有Skip-Gram和CBOW两种模型,从直观上理解,Skip-Gram是给定input word来预测上下文。而CBOW是给定上下文,来预测input word。

图嵌入

这部分将介绍四种图嵌入方法,其中三种属于顶点嵌入,而另外一种属于向量嵌入。 这些嵌入方式一定程度上用了Word2vec的嵌入原则。

顶点嵌入方法

顶点嵌入的方法可以分为三大类:因式分解方法、随机游走方法和深度方法。

 

参考链接:

https://zhuanlan.zhihu.com/p/100586855

https://baike.baidu.com/item/%E9%9A%8F%E6%9C%BA%E6%B8%B8%E8%B5%B0/1674146?fr=aladdin

留下评论

You must be logged in to post a comment.

相册集

pix pix pix pix pix pix

关于自己

杨文龙,微软Principal Engineering Manager, 曾在各家公司担任影像技术资深总监、数据科学团队资深经理、ADAS算法总监、资深深度学习工程师等职位,热爱创新发明,专注于人工智能、深度学习、图像处理、机器学习、算法、自然语言处理及软件等领域,目前发明有国际专利19篇,中国专利28篇。

联系我

个人技术笔记

welonshen@gmail.com

2015 in Shanghai