一个是经管实证研究的必备利器,Stata。
一个是触手可及的胶水语言,Python。
爬虫获取数据,祭出神器Python,整理数据跑出漫天星星,亮出宝剑Stata。双剑合璧,驰骋于数据时代。
当时在R语言与应用计量经济学已经提到Stata有一些不足需要弥补。其实在 Stata Conference Chicago 2016上,不仅有人在提及与Web交互绘图的问题,还提及到Reproducible research。Reproducible research在R语言中得到了较好的体现,感兴趣的读者可以阅读Dynamic Documents with R and Knitr(2nd)和Reproducible Research with R and RStudio(2nd)。Stata用户也想实现Reproducible research,其中一个比较便捷的方式就是借助Jupyter Notebook来实现。
不得不说Stata用户中也是牛人辈出呀,Ties de Kok开发出IPyStata实现了在Python环境下调用Stata。哈哈,放一张这个牛人的PPT。“The whole is greater than the sum of its parts.”
演示的环境:Win10;
Anaconda 4.1.1 (64-bit);
Stata/MP 14.1 (64-bit);
IPystata 0.3.5。
简要安装步骤:
1.在CMD环境下输入“pip install ipystata”;
2.在CMD环境(管理员模式)下切换到Stata的安装路径;
3.注册Stata,输入“StataMP-64.exe /Register”,“StataMP-64.exe”是Stata的exe文件名称;
4.启动Jupyter,如图所示输入代码;
import ipystata
from ipystata.config import config_stata
config_stata('F:\ProgramFiles\Stata\StataMP-64.exe')
5.准备工作安装完毕。
下面来尝鲜一下具体的功能。导入数据。
描述性统计与相关性分析
一图胜千言。
正常导入dta数据,再画图。
注意导入数据的地址写法。
导入在线数据。
终结者。
IPystata使用情况简述:
和Julia以Kernel的形式引入Jupyter不同,Stata是通过IPystata包的途径在Jupyter上显示。
基本可以使用,包括数据导入、描述性分析、绘图和回归。
不仅可以调用Stata原生命令,安装在本地的Stata插件也是可以使用,如图中的esttab。
Stata的有些操作不能很好的显示在Jupyter上面。如list(List values of variables)。
更具体的信息可以关注GitHub上的IPystata。