scala Ordering

scala.math.Ordering

自定义排序方法。

例:(col : Int, row : Int, Value : Double )是一个Tuple3。排序默认按第一项作为Key。

Ordering.by[(Int,Int,Double),Int](_._2)表示从Tuple3转到Int型。后面为转换函数。此句表示按此Tuple3中第二个元素进行排序。

Ordering.by[T,U]( f(T) => U ).为此方法声明原型。

文档中声明为:def by[T, S](f: (T) ⇒ S)(implicit ord: Ordering[S]): Ordering[T]

提供自定义类型转换函数入口,可自定义Tuple排序、对象排序、以及转换不同类型间排序。但一般情况下,排序规则要符合常识。最好不要出现类似1>2的排序规则,以免引起误解和产生不必要的错误。

 

spark RDD 中,有max方法。默认按第一元素为key。

声明为:def max()(implicit ord: Ordering[T]): T。

max方法本身没有参数!写成rdd.max(ord),编译无法通过。正确写法rdd.max()(ord)。

返回类型为rdd中元素的类型。如需其中部分数据,不要忘记再进行相应处理。

eg.

  val rows = data.max()(Ordering.by[(Int,Int,Double),Int](_._2))._2.toInt

获取data(RDD)中元素的第二项中最大值。

简记之。

posted @ 2015-11-27 10:12  苏轶然  阅读(969)  评论(0编辑  收藏  举报