由于最近需要用到一个预处理的数据集,方法在这篇论文《Efficient Estimation of Word Representations in Vector Space》里,于是打算尝试能不能复现一下,论文提供了代码地址,但是当我打开下载的时候,却发现是404

image-20230701163100641

于是经过一番搜索,找到了最新的地址(应该是吧

先创建一下新的虚拟环境

conda create -n word2vec python=3.8
conda activate word2vec

然后安装numpyscipy

pip install numpy
pip install scipy

安装Microsoft Visual C++ 14.0

下载下来是一个安装器,然后进行如下操作

屏幕截图 2023-07-01 165446

然后

屏幕截图 2023-07-01 165358

最后安装有点麻烦的gcc,首先使用清华镜像下载mingw-w64-gcc,然后解压的位置选一个自己能记住的位置,比如我的就是

G:\Program Files\MinGW-w64

然后把bin目录添加到系统变量里

例如我的路径就是

G:\Program Files\MinGW-w64\mingw-w64-gcc-12.2-stable-r38\bin

屏幕截图 2023-07-01 172554

最后测试一下时候配置成功

D盘根目录先新建一个helloword.c的文件

#include <stdio.h>

int main() {
printf("hello world\n");
return 0;
}

然后用cmdD盘根目录

cd/d D:

用gcc编译

gcc helloword.c

如果没报错说明其实已经配置好了,想看文件运行结果的可以继续输入

a.exe

image-20230701173710147

这样,word2vec所需的组件就算全部安装完了,下面正式开始安装word2vec(在conda那个命令窗口哦,希望不要报错!)

pip install word2vec

image-20230701174216784

如果出现这个问题,重启一下试试。本人就是重启完莫名安装成功了,可能是刚刚有的组件需要重启吧

image-20230701225337075