keras序列预处理

TimeserisGenerator

pad_sequences

keras.preprocessing.sequence.keras.preprocessing.sequence.pad_sequences(sequences, maxlen=None, dtype='int32', padding='pre', truncating='pre', value=0.0)

将序列填充到相同的长度。

将长为nb_samples的序列(标量序列)转化为形如(nb_samples,nb_timesteps)2D numpy array。如果提供了参数maxlennb_timesteps=maxlen,否则其值为最长序列的长度。其他短于该长度的序列都会在后部填充0以达到该长度。长于nb_timesteps的序列将会被截断,以使其匹配目标长度。padding和截断发生的位置分别取决于参数paddingtruncating。默认为'pre-padding'。

 

  参数

 

    • sequences:浮点数或整数构成的两层嵌套列表

    • maxlen:None或整数,为序列的最大长度。大于此长度的序列将被截短,小于此长度的序列将在后部填0.

    • dtype:返回的numpy array的数据类型

    • padding:‘pre’或‘post’,确定当需要补0时,在序列的起始还是结尾补

    • truncating:‘pre’或‘post’,确定当需要截断序列时,从起始还是结尾截断

    • value:浮点数,此值将在填充时代替默认的填充值0

 

  返回值

 

    返回形如(nb_samples,nb_timesteps)的2D张量

  Raises

 

    • ValueError:防止无效的truncating/padding值,或无效的输入序列形状。

skipgrams

make_sampling_table

posted @ 2018-07-24 02:04  LifeExp  阅读(270)  评论(0)    收藏  举报