搭建一个完整的机器学习环境

July 7 2016

现如今一个完整的机器学习环境已经不仅仅是装完一个软件就好的,其实相关的工具都 是需要安装的,其实应对这种情况最好的方式就是直接制作一个镜像。
接下来记录的是一个完整的基于python的ML环境搭建过程。
1.安装ubuntu系统(写这篇文章的时候ubuntu 14.04.4相对好用)
1.1 下载
官网这儿下载系统, 不要用那个什么乱七八糟的国产破玩意,内置一堆垃圾。

如果网速不怎么样可以考虑从这里面的镜像源下载。 但是要擦亮眼睛,人心不古了,镜像源里面不一定哪个能用。浙大的镜像源不错。

1.2 安装

windows下ultra ISO写入镜像,制作u盘启动盘,如果本身就是linux, 那就下载那个live-usb-creator。 ultralISO试用就ok了。 安装过程需要注意的是最好拔掉网线了,如果懒得动呢,就注意着安装过程中的下载,要注意跳过,不然 好费时间。

1.3 安装完成

ubuntu挺好安装的,如果出问题了就从1.1重试下。偶尔会有U盘插找不到liveCD的情况, 把U盘插到USB2.0接口上试试。

2. 基本工具安装

基本的工具主要是方便写代码和看数据,临时搞个文本处理用。

2.1 修改镜像源

修改镜像源为zju的镜像源

#备份原始的镜像源配置
sudo mv /etc/apt/sources.list /etc/apt/sources.list.bak

#修改为浙大的源
sudo gedit /etc/apt/sources.list

#粘贴下面的玩意,并保存
deb http://mirrors.zju.edu.cn/ubuntu trusty main universe restricted multiverse
deb http://mirrors.zju.edu.cn/ubuntu trusty-security main universe restricted multiverse
deb http://mirrors.zju.edu.cn/ubuntu trusty-updates main universe restricted multiverse
deb http://mirrors.zju.edu.cn/ubuntu trusty-backports main universe restricted multiverse
deb-src http://mirrors.zju.edu.cn/ubuntu trusty main universe restricted multiverse
deb-src http://mirrors.zju.edu.cn/ubuntu trusty-security main universe restricted multiverse
deb-src http://mirrors.zju.edu.cn/ubuntu trusty-updates main universe restricted multiverse
deb-src http://mirrors.zju.edu.cn/ubuntu trusty-backports main universe restricted multiverse

#更新系统cache
sudo apt-get update

2.2 code efficiency工具

#安装vim
sudo apt-get install vim 

#右键terminal
sudo apt-get install nautilus-open-terminal

2.3 机器学习工具 scipy,scikit

#python 开发包。安装莫名的依赖
sudo apt-get install -y python-dev libhdf5-dev

#scipy相关
sudo apt-get install -y python-numpy python-scipy python-matplotlib 
sudo apt-get install -y ipython ipython-notebook python-pandas python-sympy python-nose

#机器学习库scikit-learn,这里采用了阿里云的pypi源,当然可以试试其他更快的
sudo pip install -i http://mirrors.aliyun.com/pypi/simple scikit-learn

#图像工具skimage,scikit-image
sudo apt-get install -y python-opencv
sudo pip install -i http://mirrors.aliyun.com/pypi/simple scikit-image

2.4 深度学习keras,默认依赖theano会一并安装

#安装keras其实依赖的软件还是挺多的
sudo pip install h5py
sudo pip install -i http://mirrors.aliyun.com/pypi/simple keras

ok,至此开发环境基本上就完全搞定了,剩下的就是开始燥起来啦! chrome,而不是chromium。从下载吧.