[C#] 进阶 - LINQ 标准查询操作概述

LINQ 标准查询操作概述     

 

序 

  “标准查询运算符”是组成语言集成查询 (LINQ) 模式的方法。大多数这些方法都在序列上运行,其中的序列是一个对象,其类型实现了IEnumerable<T> 接口或 IQueryable<T> 接口。标准查询运算符提供了包括筛选、投影、聚合、排序等功能在内的查询功能。  
     各个标准查询运算符在执行时间上有所不同,具体情况取决于它们是返回单一值还是值序列。返回单一值的方法(例如 Average 和 Sum)会立即执行。返回序列的方法会延迟查询执行,并返回一个可枚举的对象。  
     对于在内存中集合上运行的方法(即扩展 IEnumerable<T> 的方法),返回的可枚举对象将捕获传递到方法的参数。在枚举该对象时,将使用查询运算符的逻辑,并返回查询结果。  
     与之相反,扩展 IQueryable<T> 的方法不会实现任何查询行为,但会生成一个表示要执行的查询的表达式树。查询处理由源 IQueryable<T> 对象处理。
 

一、按标准执行方式分类

     标准查询运算符方法的 LINQ to Objects 实现采用两种主要方式之一来执行:立即执行延迟执行。采用延迟执行的查询运算符可以进一步分为两类:流式非流式
     
     1.执行方式
          (1)立即: 立即执行意味着在代码中声明查询的位置读取数据源并执行运算。  返回单个不可枚举的结果的所有标准查询运算符都立即执行
          (2)延迟: 延迟执行意味着不在代码中声明查询的位置执行运算。  仅当对查询变量进行枚举操作时才执行运算,例如通过使用 foreach 语句。这意味着查询的执行结果取决于执行查询而非定义查询时的数据源内容。如果多次枚举查询变量,则每次结果可能都不同。几乎所有返回类型为 IEnumerable<T> 或 IOrderedEnumerable<TElement> 的标准查询运算符都以延迟方式执行。 
           采用延迟执行方式的查询运算符可以另外分类为流式非流式
          ①流式运算符不需要在生成元素前读取所有源数据。在执行时,流式运算符一边读取每个源元素,一边对该源元素执行运算,并在可行时生成元素。流式运算符将持续读取源元素直到可以生成结果元素。这意味着可能要读取多个源元素才能生成一个结果元素。
          ②非流式运算符必须读取所有源数据才能生成结果元素。诸如排序分组等运算属于此类别。在执行时,非流式查询运算符读取所有源数据,将其放入数据结构中,执行运算,然后生成结果元素。
 

二、排列数据

     排序操作按一个或多个特性对序列的元素进行排序。第一个排序条件对元素执行主要排序。通过指定第二个排序条件,可以对各个主要排序组中的元素进行排序。 
     下图演示对一个字符序列执行按字母排序操作的结果。
  

 

标准查询运算符操作方法 - 排序
方法名 说明 C# 查询表达式语法
OrderBy 按升序对值进行排序。 orderby
OrderByDescending 按降序对值进行排序。 orderby … descending
ThenBy 按升序执行次要排序。 orderby …, …
ThenByDescending 按降序执行次要排序。 orderby …, … descending
Reverse 颠倒集合中的元素的顺序。 X

  

  示例:

1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
2 var query = from word in words
3                    orderby word.Length
4                    select word;
5 
6 foreach (var word in query)
7 {
8     Console.WriteLine(word);
9 }
下面通过演示使用 orderby 进行升序排序:按字符串长度

 

 

1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
2 var query = from word in words
3                    orderby word.Substring(0,1) descending 
4                    select word;
5 
6 foreach (var word in query)
7 {
8     Console.WriteLine(word);
9 }
下面通过演示使用 orderby descending 进行降序排序:按字符串的第一个字母

 

1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
2 var query = from word in words
3                    orderby word.Length, word.Substring(0, 1)
4                    select word;
5 
6 foreach (var word in query)
7 {
8     Console.WriteLine(word);
9 }
下面通过演示使用 orderby 进行主要和次要排序:先升序按字符串长度(主)、再升序按字符串的第一个字母(次)

 

1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
2 var query = from word in words
3                    orderby word.Length, word.Substring(0, 1) descending 
4                    select word;
5 
6 foreach (var word in query)
7 {
8     Console.WriteLine(word);
9 }
下面通过演示使用 orderby descending 进行主要和次要排序:先升序按字符串长度(主)、再降序按字符串的第一个字母(次)

 

 

三、Set 操作

  LINQ 中的 Set 操作是指根据相同或不同集合中是否存在等效元素来生成结果集的查询操作

 

标准查询运算符操作方法 - Set
方法名 说明

C# 查询表达式语法

Distinct

从集合移除重复值。

X

Except

返回差集,差集是指位于一个集合但不位于另一个集合的元素。

X

Intersect

返回交集,交集是指同时出现在两个集合中的元素。

X

Union

返回并集,并集是指位于两个集合中任一集合的唯一的元素。

X

 

  图解 Set 操作

  (1)Distinct: 返回的序列包含输入序列的唯一元素。

  (2)Except: 返回的序列只包含位于第一个输入序列但不位于第二个输入序列的元素。  

  (3)Intersect: 返回的序列包含两个输入序列共有的元素。  

  (4)Union: 返回的序列包含两个输入序列的唯一的元素。 
显示两个序列的联合的图。

 

 四、过滤数据

     筛选指将结果集限制为只包含某些满足指定条件的元素的操作。它又称为选择
     下图演示了对字符序列进行筛选的结果。筛选操作的谓词指定字符必须为“A”。

 

标准查询运算符操作方法 - 筛选
方法名 说明 C# 查询表达式语法
OfType 根据值强制转换为指定类型的能力选择值。 X
Where 选择基于谓词函数的值。 where
  
  示例:
 1 string[] words = { "the", "quick", "brown", "fox", "jumps" };
 2 
 3 var query = from word in words
 4                    where word.Length == 3
 5                    select word;
 6 
 7 foreach (var word in query)
 8 {
 9      Console.WriteLine(word);
10 }
使用 where 子句来从数组中筛选那些具有特定长度的字符串

 

五、量词操作 

  限定符运算返回一个 Boolean 值,该值指示序列中是否有一些元素满足条件或是否所有元素都满足条件。

     下图描述了两个不同源序列上的两个不同限定符运算。第一个运算询问是否有一个或多个元素为字符“A”,结果为 true。第二个运算询问是否所有元素都为字符“A”,结果为 true。  
 

标准查询运算符操作方法 - 量词

方法名

说明

C# 查询表达式语法

All

确定是否序列中的所有元素都满足条件。

X
Any

确定序列中是否有元素满足条件。

X

Contains

确定序列是否包含指定的元素。

X

 

六、投影操作

      投影是指将对象转换为一种新形式的操作,该形式通常只包含那些将随后使用的属性。通过使用投影,您可以构建依据每个对象生成的新类型。您可以映射属性,并对该属性执行数学函数。还可以在不更改原始对象的情况下映射该对象。
 
标准查询运算符操作方法 - 投影
方法名 说明 C# 查询表达式语法
Select 映射基于转换函数的值。 select
SelectMany 映射基于转换函数的值序列,然后将它们展平为一个序列。 使用多个 from 子句
  
  示例
1 var words = new[] { "the", "quick", "brown", "fox", "jumps" };
2 var query = from word in words
3                    select word.Substring(0,1);
4 
5 foreach (var word in query)
6 {
7     Console.WriteLine(word);
8 }
Select:下面的示例使用 select 子句来映射字符串列表中每个字符串的第一个字母

 

 1 var phrases = new List<string>() { "an apple a day", "the quick brown fox" };
 2 
 3 var query = from phrase in phrases
 4                    from word in phrase.Split(' ')
 5                    select word;
 6 
 7 foreach (var word in query)
 8 {
 9    Console.WriteLine(word);
10 }
SelectMany:下面的示例使用多个 from 子句来映射字符串列表中每个字符串中的每个单词

  

  Select() 和 SelectMany() 的工作都是依据源值生成一个或多个结果值。Select() 为每个源值生成一个结果值。因此,总体结果是一个与源集合具有相同元素数目的集合。与之相反,SelectMany() 将生成单一总体结果,其中包含来自每个源值的串联子集合。作为参数传递到 SelectMany() 的转换函数必须为每个源值返回一个可枚举值序列。然后,SelectMany() 将串联这些可枚举序列以创建一个大的序列。

  下面两个插图演示了这两个方法的操作之间的概念性区别。在每种情况下,假定选择器(转换)函数从每个源值中选择一个由花卉数据组成的数组。

  下图描述 Select() 如何返回一个与源集合具有相同元素数目的集合。

 

  下图描述 SelectMany() 如何将中间数组序列串联为一个最终结果值,其中包含每个中间数组中的每个值。

 

  示例

  下面的示例比较 Select() 和 SelectMany() 的行为。代码将通过从源集合的每个花卉名称列表中提取前两项来创建一个“花束”。在此示例中,转换函数 Select 使用的“单一值”本身就是一个值集合。这需要额外的 foreach 循环,以便枚举每个子序列中的每个字符串。

 1         static void Main(string[] args)
 2         {
 3             var bouquets = new List<Bouquet>()
 4             {
 5                 new Bouquet {Flowers = new List<string> {"sunflower", "daisy", "daffodil", "larkspur"}},
 6                 new Bouquet {Flowers = new List<string> {"tulip", "rose", "orchid"}},
 7                 new Bouquet {Flowers = new List<string> {"gladiolis", "lily", "snapdragon", "aster", "protea"}},
 8                 new Bouquet {Flowers = new List<string> {"larkspur", "lilac", "iris", "dahlia"}}
 9             };
10 
11             IEnumerable<List<string>> query1 = bouquets.Select(bq => bq.Flowers);
12             IEnumerable<string> query2 = bouquets.SelectMany(bq => bq.Flowers);
13 
14             Console.WriteLine("query1 - Select():");
15             foreach (IEnumerable<string> collection in query1)
16             {
17                 foreach (var item in collection)
18                 {
19                     Console.WriteLine(item);
20                 }
21             }
22 
23             Console.WriteLine("\nquery2 - SelectMany():");
24             foreach (var item in query2)
25             {
26                 Console.WriteLine(item);
27             }
28 
29             Console.Read();
30         }
31 
32         class Bouquet
33         {
34             public List<string> Flowers { get; set; }
35         }        
View Code

 

七、划分数据

  LINQ 中的分区指的是在不重新排列元素的情况下,将输入序列划分为两部分,然后返回其中一个部分的操作。

  下图显示对一个字符序列执行三个不同的分区操作的结果。第一个操作返回序列中的前三个元素。第二个操作跳过前三个元素,返回剩余的元素。第三个操作跳过序列中的前两个元素,返回接下来的三个元素。  

 

分区序列的标准查询运算符方法

运算符名称

说明

C# 查询表达式语法

Skip

跳过序列中的指定位置之前的元素。

X

SkipWhile

基于谓词函数跳过元素,直到某元素不再满足条件。

X

Take

提取序列中的指定位置之前的元素。

X

TakeWhile

基于谓词函数提取元素,直到某元素不再满足条件。 X

 

八、联接操作

  将两个数据源“联接”就是将一个数据源中的对象与另一个数据源中共享某个通用特性的对象关联起来。

  当查询所面向的数据源相互之间具有无法直接领会的关系时,联接就成为一项重要的运算。在面向对象的编程中,这可能意味着在未建模对象之间进行关联,例如对单向关系进行反向推理。下面是单向关系的一个示例:Customer 类有一个类型为 City 的属性,但 City 类没有作为 Customer 对象集合的属性。如果你具有一个 City 对象列表,并且要查找每个城市中的所有客户,则可以使用联接运算完成此项查找。  

  LINQ 框架中提供的联接方法包括 Join 和 GroupJoin。这些方法执行同等联接,即根据两个数据源的键是否相等来匹配这两个数据源的联接。(与此相较,Transact-SQL 支持除“等于”之外的联接运算符,例如“小于”运算符。)用关系数据库术语表达,就是说 Join 实现了内部联接,这种联接只返回那些在另一个数据集中具有匹配项的对象。GroupJoin 方法在关系数据库术语中没有直接的等效项,但它实现了内部联接和左外部联接的超集。左外部联接是这样一种联接:它返回第一个(左)数据源的每个元素,即使该元素在另一个数据源中没有关联元素。  

  下图显示了一个概念性视图,其中包含两个集合以及这两个集合中的包含在内部联接或左外部联接中的元素。

 

标准查询运算符操作方法 - 联接

方法名

描述

C# 查询表达式语法

Join

根据键选择器函数联接两个序列并提取值对。

join … in … on … equals …

GroupJoin

根据键选择器函数联接两个序列,并对每个元素的结果匹配项进行分组。

join … in … on … equals … into …

 

九、分组数据

  分组指将数据放入组中以便每个组中的元素共享公共特性的操作。
  下图显示了对字符序列进行分组的结果。每个组的是字符。  

 

标准查询运算符方法 - 分组

方法名

说明

C# 查询表达式语法

GroupBy

对共享公共特性的元素进行分组。  每个组都由一个 IGrouping<TKey, TElement> 对象表示。  

group … by 

- 或 -

group … by … into …

ToLookup

根据键选择器函数将元素插入到 Lookup<TKey, TElement>(一个一对多字典)中。

X

 

 1 var numbers = new List<int>() { 35, 44, 200, 84, 3987, 4, 199, 329, 446, 208 };
 2 
 3 IEnumerable<IGrouping<bool, int>> query = from number in numbers
 4                                                       group number by number % 2 == 0;
 5 
 6 foreach (var group in query)
 7 {
 8     Console.WriteLine($"{(group.Key ? "偶数" : "基数")}:");
 9     foreach (var i in group)
10     {
11         Console.WriteLine(i);
12     }
13 }    
使用 group by 子句根据列表中的整数是奇数还是偶数进行分组

 

十、生成操作

  生成是指创建新的值序列
 
标准查询运算符方法 - 生成

方法名

说明

C# 查询表达式语法

DefaultIfEmpty

将空集合替换为具有默认值的单一实例集合。

X
Empty

返回空集合。

X
Range

生成包含数字序列的集合。

X

Repeat

生成包含一个重复值的集合。

X

 

十一、等值操作

  如果两个序列的对应元素相等且这两个序列具有相同数量的元素,则视这两个序列相等。
 
 
标准查询运算符方法 - 等值
方法名 说明 C# 查询表达式语法
SequenceEqual 通过成对地比较元素确定两个序列是否相等。 X

 

 十二、元素操作

  元素操作从一个序列返回单个特定元素

 

标准查询运算符操作方法 - 元素 

方法名

说明

C# 查询表达式语法

ElementAt

返回集合中指定索引处的元素。

X

ElementAtOrDefault

返回集合中指定索引处的元素;如果索引超出范围,则返回默认值。

X

First

返回集合中的第一个元素或满足条件的第一个元素。

X

FirstOrDefault

返回集合中的第一个元素或满足条件的第一个元素。  如果没有这样的元素,则返回默认值。  

X
Last

返回集合中的最后一个元素或满足条件的最后一个元素。

X

LastOrDefault

返回集合中的最后一个元素或满足条件的最后一个元素。  如果没有这样的元素,则返回默认值。  

X

Single

返回集合中的唯一元素或满足条件的唯一元素。

X

SingleOrDefault

返回集合中的唯一元素或满足条件的唯一元素。  如果没有这样的元素或集合不是正好包含一个元素,则返回默认值。  

X

 

十三、转换数据类型

  转换方法更改输入对象的类型

  LINQ 查询中的转换运算可用于各种应用程序。下面是一些示例:

  (1)Enumerable.AsEnumerable<TSource> 方法可用于隐藏类型的标准查询运算符的自定义实现。

  (2)Enumerable.OfType<TResult> 方法可用于启用非参数化集合以进行 LINQ 查询。

  (3)Enumerable.ToArray<TSource>Enumerable.ToDictionary<TSource, TKey>Enumerable.ToList<TSource>Enumerable.ToLookup<TSource, TKey> 方法可用于强制立即执行查询,而非推迟到枚举查询时。

 

标准查询运算符方法 - 转换数据类型
方法名 说明 C# 查询表达式语法
AsEnumerable 返回类型为 IEnumerable<T> 的输入。 X
AsQueryable 将(泛型)IEnumerable 转换为(泛型)IQueryable X
Cast 将集合的元素强制转换为指定类型。

使用显式类型化的范围变量。 例如:

from string str in words

OfType 根据值强制转换为指定类型的能力筛选值。 X
ToArray 将集合转换为数组。 此方法强制执行查询。 X
ToDictionary 根据键选择器函数将元素放入 Dictionary<TKey, TValue> 中。 此方法强制执行查询。 X
ToList 将集合转换为 List<T>此方法强制执行查询。 X
ToLookup 根据键选择器函数将元素放入 Lookup<TKey, TElement>(一对多字典)中。 此方法强制执行查询。 X

   

  示例:

 1         static void Main(string[] args)
 2         {
 3             var plants = new Plant[]
 4             {
 5                 new CarnivorousPlant {Name = "Venus Fly Trap", TrapType = "Snap Trap"},
 6                 new CarnivorousPlant {Name = "Pitcher Plant", TrapType = "Pitfall Trap"},
 7                 new CarnivorousPlant {Name = "Sundew", TrapType = "Flypaper Trap"},
 8                 new CarnivorousPlant {Name = "Waterwheel Plant", TrapType = "Snap Trap"}
 9             };
10 
11             var query = from CarnivorousPlant plant in plants
12                         where plant.TrapType == "Snap Trap"
13                         select plant;
14 
15             foreach (var carnivorousPlant in query)
16             {
17                 Console.WriteLine(carnivorousPlant.Name);
18             }
19 
20             Console.Read();
21         }
22 
23         class Plant
24         {
25             public string Name { get; set; }
26         }
27 
28         class CarnivorousPlant : Plant
29         {
30             public string TrapType { get; set; }
31         }    
使用显式类型化的范围变量将类型强制转换为子类型,然后才访问仅在此子类型中提供的成员。

 

十四、串联操作

  串联是指将一个序列追加到另一个序列的运算。

  下图演示对两个字符序列执行的串联运算。

 

标准查询运算符操作方法 - 串联

方法名

说明

C# 查询表达式语法

Concat

串联两个序列以组成一个序列。

X

 

十五、聚合操作

  聚合运算从值集合计算单个值。从一个月的日温度值计算日平均温度就是聚合运算的一个示例。  

  下图显示了对一个数字序列执行两个不同聚合运算的结果。第一个运算对这些数字执行求和。第二个运算返回该序列中的最大值。  

 

 

标准查询运算符操作方法 - 聚合

方法名

说明

C# 查询表达式语法

Aggregate

对集合值执行自定义聚合运算。

X

Average

计算值集合的平均值。

X
Count

对集合中的元素进行计数,还可以仅对满足某一谓词函数的元素进行计数。

X

LongCount

对大型集合中的元素进行计数,还可以仅对满足某一谓词函数的元素进行计数。

X
Max

确定集合中的最大值。

X
Min

确定集合中的最小值。

X

Sum

计算集合中值的总和。

X

 

 传送门

  入门:《走进 LINQ 的世界

  进阶:《LINQ 标准查询操作概述(强烈推荐)

  技巧:《Linq To Objects - 如何操作字符串》 和 《Linq To Objects - 如何操作文件目录

  

 


【参考】https://msdn.microsoft.com/zh-cn/library/bb397896(v=vs.100).aspx

【来源】部分图片摘自微软官方文档

 

posted @ 2016-08-25 10:39  反骨仔  阅读(20551)  评论(48编辑  收藏  举报