月度归档:2016年07月

patsy学习笔记——概述 zt

patsy学习笔记——概述

patsy是一个Python包,用于描述统计模型(statistical models)(特别是,线性模型或者有线性成分的模型),同时也用于构建设计矩阵(design matrices)。该包的开发受到了R或S语言中的公式微语言(the formula mini-language)的启发,并与其兼容。

举例来说,如果我们有变量y和变量 x,a,b。我们想求出变量y与变量x,a,b之间的回归关系,其中变量a和b之间存在着交互作用,则公式可写为:

patsy.dmatrices("y ~ x + a + b + a:b", data)