TranslateProject/translated/Installing a Desktop Algorithmic Trading Research Environment using Ubuntu Linux and Python.md
2013-10-28 11:04:23 +08:00

15 KiB
Raw Blame History

在Ubuntu下用Python搭建桌面算法交易研究环境

这篇文章将讨论在ubuntu下,使用Python编程语言,来搭建一个强大,高效和易交互的算法交易策略研究环境.几乎所有的后续的算法交易文章都将利用此环境.

搭建此环境需要安装以下软件,它们都是开源的或免费下载的:

这些工具(配合合适的 证券master数据库将使我们能够创建一个快速可交互的策略研究环境。Pandas是专为数据“冲突”设计的它可以高效地导入和清洗时间序列数据。NumPy/SciPy在底层运行使得系统被很好的优化。IPython/matplotlib (和qtconsole详见下文)使结果可视化可交互并快速迭代。scikit-learn可让我们将机器学习技术应用到我们的策略中以进一步提高性能。

请注意我写这篇教程是为了那些无法或不愿意直接安装ubuntu系统的windows或Mac OSX用户通过VirtualBox来搭建此环境。VirtualBox使我们可在host操作系统中创建一个虚拟机可模拟guest操作系统而丝毫不影响host操作系统。由此我们可以在完整安装Ubuntu前练习Ubuntu和Python工具。如果已经安装Ubuntu桌面系统可跳过“在Ubuntu下安装Python研究环境包”这一节。

##安装VirtualBoX和Ubuntu##

Mac OSX操作系统上关于VirtualBox安装的部分已经写过了这里将简单的移到Windows环境中。一旦各种host操作系统下的VirtualBox安装完毕其它过程就都一样了。

开始安装前我们需要先下载Ubuntu和VirtualBox。

下载Ubuntu桌面磁盘镜像

打开收藏夹,导航到Ubuntu 桌面主页然后选择Ubuntu 13.04

下载Ubuntu13.0464位如适用

你会被问及是否愿意捐赠一些money不过这个是可选的。进入下载页面后选择Ubuntu 13.04。你需要选择是否要下载32位或64位版本。很可能你是64位系统但如果你有疑问那么选择32位。在Mac OSX系统上Ubuntu桌面ISO磁盘镜像将保存到下载目录下。安装VirtualBox后我们就要用到它了。

下载和安装VirtualBox

现在我们已经下载了Ubuntu 接下来需要去获取最新版本的Oracle的VirtualBox软件。点击这里访问该网站选择你的特定主机的版本本教程要求Mac OSX版本

Oracle VirtualBox下载页面

一旦文件下载完毕我们点击安装包图标运行Windows上会有些不同但是类似

双击安装包图标安装VirtualBox

打开后按照安装说明操作保持默认除非你觉得有必要修改他们。VirtualBox安装完毕后可从Applications文件夹中打开可通过Finder搜索到。VirtualBox运行过程中它的图标将出现在Dock栏里,如果你以后想经常以虚拟机方式使用Ubuntu,你可以将VirtualBox图标永久保存在Dock栏中:

还没有磁盘镜像的VirtualBox

点击类似齿轮的图标,创建一个新的虚拟盒子(也就是虚拟机),命名为"Ubuntu Desktop 13.04 Algorithmic Trading"(你可以使用别的类似的描述):

命名我们的新虚拟环境

分配虚拟机内存.因为是测试系统,所以我只分配了512Mb.一个实际的回溯引擎因为效率原因需要一个本地安装(这样才能明显分配到更多内存):

选择虚拟磁盘的RAM量

创建虚拟硬盘,大小为推荐的8Gb,动态生成VirtualBox磁盘镜像,名字同上:

选择镜像所使用的硬盘类型

You will now see a complete system with listed details: 完整系统的详细信息如下:

已经创建的虚拟镜像

现在我们需要在VirtualBox中为新的磁盘镜像包含一个虚拟的'CD驱动器',这样就可以假装从这张光盘驱动器引导我们的Ubuntu磁盘镜像。在Settings里点击“Storage”选项卡并添加一个磁盘。选择Downloads目录下的Ubuntu磁盘镜像ISO文件或者其他你下载Ubuntu的目录选择Ubuntu ISO镜像并保存设置。

在第一次启动时选择Ubuntu桌面ISO

一切就绪准备启动Ubuntu镜像并安装。点击“Start”当出现主机捕获鼠标或键盘消息时点击“Ok”。在我的Mac OSX系统中主机捕获键是左边的Cmd键即左Apple键。现在出现在你眼前的就是Ubuntu桌面安装界面点击“Install Ubuntu”

点击 "Install Ubuntu "开始安装

确保勾选两个框安装专有的MP3和Wi-Fi驱动程序

安装MP3和Wi-Fi的专用驱动程序

现在您将看到一个界面询问你想如何保存操作系统创建过程中的的数据。不要惊慌于“Erase Disk and Install Ubuntu”的选项。这并不意味着它会删除你的普通硬盘它实际上指的是运行Ubuntu的虚拟磁盘这是安全擦除反正里面没有什么内容因为是我们刚刚创建的。继续进行安装将出现询问位置的界面随后又将出现选择键盘布局的界面

选择您所在的地理位置

输入您的用户凭据,请务必记住您的密码,以后安装软件包的时候需要它:

输入您的用户名和密码(此密码是管理员密码)

现在, Ubuntu将安装文件。它应该是比较快的因为它是从硬盘复制到硬盘完成后VirtualBox将重启。如果不自行重启你可以去菜单强制关机。接下来将回到Ubuntu的登录界面

Ubuntu桌面登录界面

用您的用户名和密码登录你将看到闪亮的新的Ubuntu桌面

Ubuntu桌面登录后的整体界面

最后需要做的事是点击火狐图标通过访问一个网站我选择QuantStart.com有意思吧来测试互联网/网络功能是正确的:

Ubuntu中的火狐浏览器原文此处为"The Ubuntu Desktop login screen"

现在Ubuntu桌面已经安装完毕接下来我们就可以开始安装的算法交易研究环境软件包。

Installing the Python Research Environment Packages on Ubuntu ## 在Ubuntu上安装Python研究环境软件包

点击左上角的搜索按钮在输入框里输入“Terminal”弹出命令行界面。双击终端图标启动终端

*Ubuntu中的终端界面原文此处为"Ubuntu Desktop login screen"

所有后续的命令都在此终端输入。

任何崭新的Ubuntu Linux系统上做的第一件事就是更新和升级软件包。前者告诉Ubuntu可用的新软件包有哪些后者用新版的软件包替换旧版的。运行下列命令你将被提示输入您的密码

sudo apt-get -y update
sudo apt-get -y upgrade

-y前缀告诉Ubuntu接受所有回答“是/否”的问题为'是'。 “sudo”是一个Ubuntu/Debian Linux的命令允许以管理员权限执行其他命令。由于我们将在站点范围安装软件包我们需要机器的root权限因此必须使用'sudo'

你可能会在这里得到一个错误消息:

E: Could not get lock /var/lib/dpkg/lock - open (11: Resource temporarily unavailable)

为了解决这个问题,你只需再次运行"sudo apt-get -y update"或者万一第一种方式不起作用,你可以在该站点(http://penreturns.rc.my/2012/02/could-not-get-lock-varlibaptlistslock.html)上查看是否有其他的命令。

一旦这些更新命令成功执行接下来我们需要安装PythonNumPy/SciPymatplotlibpandasscikit-learn和IPython。我们将开始安装Python开发包和编译器编译器将在编译所有软件的时候用到

sudo apt-get install python-pip python-dev python2.7-dev build-essential liblapack-dev libblas-dev

一旦安装必要的软件包我们就可以通过pip即Python包管理器安装NumPy的。pip将下载NumPy的zip包然后从源代码编译。请记住编译需要花费一些时间大概10-20分钟

sudo pip install numpy

NumPy安装完了后,我们需要在继续之前检查它是否可用。如果你仔细看终端,你会发现计算机名后面跟了你的用户名。比如我的是mhallsmoore@algobox,随后是提示符。在提示符下键入python然后试着导入NumPy。我们将计算一个列表的平均值,以测试NumPy是否可用:

mhallsmoore@algobox:~$ python
Python 2.7.4 (default, Sep 26 2013, 03:20:26)
[GCC 4.7.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy
>>> from numpy import mean
>>> mean([1,2,3])
2.0
>>> exit()

现在我们已成功安装NumPy接下来要安装Python的科学库,即SciPy。然而它有一些依赖的软件包包括ATLAS库和GNU Fortran编译器

sudo apt-get install libatlas-base-dev gfortran

现在,我们将通过pip安装SciPy.这将需要相当长的时间约20分钟这取决于你的电脑所以也许你可以去喝杯咖啡先

sudo pip install scipy

现在已安装SciPy。让我们通过计算一个整数列表的标准差来测试SciPy是否可以正常使用

mhallsmoore@algobox:~$ python
Python 2.7.4 (default, Sep 26 2013, 03:20:26)
[GCC 4.7.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import scipy
>>> from scipy import std
>>> std([1,2,3])
0.81649658092772603
>>> exit()

接下来我们需要安装matplotlib的依赖包Python的图形库。 由于matplotlib是一个Python包无法使用pip去安装以下PNGJPEG文件和FreeType字体库相关的库所以我们需要Ubuntu为我们安装

sudo apt-get install libpng-dev libjpeg8-dev libfreetype6-dev

现在我们可以安装matplotlib了:

sudo pip install matplotlib

我们将安装数据分析和机器学习库,pandas和scikit-learn.这步不需要安装额外的依赖库, 因为NumPy和SciPy已经将依赖都覆盖了.

sudo pip install -U scikit-learn
sudo pip install pandas

我需要测试scikit-learn:

mhallsmoore@algobox:~$ python
Python 2.7.4 (default, Sep 26 2013, 03:20:26)
[GCC 4.7.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> from sklearn load datasets
>>> iris = datasets.load_iris()
>>> iris
..
..
'petal width (cm)']}
>>>

另外,我们需要测试pandas:

>>> from pandas import DataFrame
>>> pd = DataFrame()
>>> pd
Empty DataFrame
Columns: []
Index: []
>>> exit()

最后, 我们需要安装IPython.这是一个交互式的Python解释器它提供了一个更精简的工作流相比标准的Python控制台。在以后的教程中我将讲述IPython在算法交易开发中的充分的用处

sudo pip install ipython

虽然IPython本身已经相当有用但它通过包含qtconsole可以有更强大的能力,qtconsole提供了内联matplotlib可视化的能力。尽管如此它需要多一点点的工作以使它启动和运行。

首先,我们需要安装Qt库。对于这一点,你可能需要更新你的软件包(我做了!):

sudo apt-get update

现在我们可以安装Qt了:

sudo apt-get install libqt4-core libqt4-gui libqt4-dev

qtconsole有一些附加的包,即ZMQ和Pygments库:

sudo apt-get install libzmq-dev
sudo pip install pyzmq
sudo pip install pygments

最后我们准备启动带有qtconsole的IPython:

ipython qtconsole --pylab=inline

然后我们可以做一个图(非常简单的!), 键入下列命令我已经包含了IPython编号的输入/输出,你不需要再输入):

In [1]: x=np.array([1,2,3])

In [2]: plot(x)
Out[2]: [<matplotlib.lines.Line2D at 0x392a1d0>]

这将产生以下内嵌图表:

带有qtconsole的IPython显示一幅内嵌的图表

这就是它的安装过程。现在我们手头就有一个非常强大的高效和互动的算法交易的科研环境。我会在后续的文章中详细介绍如何结合IPython,matplotlib,pandas和scikit-learn,以一种直观的方式, 成功地研究和回溯测试量化交易策略。


来源于: http://quantstart.com/articles/Installing-a-Desktop-Algorithmic-Trading-Research-Environment-using-Ubuntu-Linux-and-Python

本文由 LCTT 原创翻译,Linux中国 荣誉推出

译者:coolpigs 校对:校对者ID