博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

pandas第一课

Posted on 2018-09-18 14:41  沉默改良者  阅读(155)  评论(0编辑  收藏  举报

pandas第一课

首先是数据的准备

movies.dat

 

user.dat

 

ratings.dat

 

注意,这些数据都是通过::来隔开每一列的,每一列有各自的含义

现在通过pandas来读入数据

首先是定义一个列表,列出每一列的名称

然后就用pd.read_table()函数来读入整个数据文件。

程序如下:

# -*- coding: utf-8 -*-
"""
Created on Wed Sep  5 11:09:33 2018

@author: user
"""

import pandas as pd


unames = ['user_id', 'gender', 'age','occupation','zip']
users = pd.read_table('users.dat', sep='::',header=None, names=unames)

rnames = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table('ratings.dat', sep='::', header=None, names=rnames)

mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('movies.dat', sep='::', header=None, names=mnames)

 

 

 

 

 

读入数据后,生成的结果为: