gota教程(一)-golang的数据清洗包

 1 // datacleaning project main.go
 2 package main
 3 
 4 import (
 5     "fmt"
 6     "github.com/kniren/gota/dataframe"
 7     "github.com/kniren/gota/series"
 8 )
 9 
10 func main() {
11     fmt.Println("Hello World!")
12     df := dataframe.New(
13     series.New([]string{"b", "a"}, series.String, "COL.1"),
14     series.New([]int{1, 2}, series.Int, "COL.2"),
15     series.New([]float64{3.0, 4.0}, series.Float, "COL.3"),
16     )
17     fmt.Println(df)
18 }

 

gota是一个golang开发的类似于Python的pandas的包,不过目前还不支持datatime类型,但是作者已经将这个提上日程了。

第一步先把gota跑起来,在配置gota的过程中需要gonum(https://github.com/gonum?utf8=%E2%9C%93&q=&type=&language=go )下的5个包截图如下:

将他们依次放置到github.com/gonum文件夹下即可(幽灵蛛的公用库也是放到github.com下,我觉得这可能是大家的一个书写习惯),当然了github.com文件夹要在gopath下。

项目结构如下:

 

main.go文件的内容如下

// datacleaning project main.go
package main

import (
	"fmt"
	"github.com/kniren/gota/dataframe"
	"github.com/kniren/gota/series"
)

func main() {
	fmt.Println("Hello World!")
	df := dataframe.New(
    series.New([]string{"b", "a"}, series.String, "COL.1"),
    series.New([]int{1, 2}, series.Int, "COL.2"),
    series.New([]float64{3.0, 4.0}, series.Float, "COL.3"),
	)
	fmt.Println(df)
}

  运行结果如下图:

 

posted on 2017-01-23 20:43  徐长卿学数据分析  阅读(6774)  评论(0编辑  收藏  举报