linq to sql中慎用Where<T>(Func<TSource, bool> predicate),小心被Linq给"骗"了!
近日在一个大型Web项目中,采用Linq to Sql替换原来的sqlcommand/sqldatareader方式来获取数据,上线后刚开始一切正常,但是随着访问量的增加,网站明显慢了很多,监测服务器CPU占用率/内存使用情况等性能指标却发现均在正常范围内,无意中在SqlServer Profier中跟踪数据库执行的sql语句时,发现有大量语句直接将整个表的数据全部提取出来了,而非仅返回分页中的当前页数据!
而这些SQL都是Linq自动翻译并最终提交到数据库的,查看了相关的代码,明明写着Skip(n).Take(m)类似的语句,为何还会生成这么“傻”的sql呢?
于是写了以下测试代码[测试环境:vs.net2008 + sqlsever2005 + win2003],最终发现是Where<TSource>(this IEnumerable<TSource> source, Func<TSource, bool> predicate);使用后,导致这个问题的产生
1.测试表T_Test:
CREATE TABLE [dbo].[T_Test](
[F_ID] [int] IDENTITY(1,1) NOT NULL,
[F_Name] [nvarchar](50) COLLATE Chinese_PRC_CI_AS NULL,
[F_Age] [int] NULL,
CONSTRAINT [PK_T_Test] PRIMARY KEY CLUSTERED
(
[F_ID] ASC
)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY]
) ON [PRIMARY]
录入了几条测试数据:
F_ID F_Name F_Age
15 Jimmy 20
16 Mary 14
17 Jack 30
18 张三 35
19 李四 24
2.新建一个"控制台应用程序",把T_Test拖到dbml中,Program.cs文件中输入如下代码:
using System;2
using System.Collections.Generic;3
using System.Linq;4
using System.Linq.Expressions;5
using CNTVS.LINQ;6

7
namespace TestLinq8
{9
class Program10
{11
static void Main(string[] args)12
{ 13

14
//Expression<Func<T_Test, bool>> _Expression = PredicateBuilder.True<T_Test>();15
//_Expression = _Expression.And(t => t.F_Age >= 20).And(t => t.F_Name.Contains("J"));16
//var Data = GetData(_Expression, 1, 1);17

18
var Data = GetData(1, 1);19

20
ShowData(Data);21
22
23
}24

25
/// <summary>26
/// 用Where<T>(Expression)方式获取数据27
/// </summary>28
/// <param name="ExpWhere"></param>29
/// <param name="PageSize"></param>30
/// <param name="CurrentPageIndex"></param>31
/// <returns></returns>32
static List<T_Test> GetData(Expression<Func<T_Test,bool>> ExpWhere,int PageSize,int CurrentPageIndex) 33
{34
List<T_Test> _Result = null;35
using (DBDataContext db = new DBDataContext())36
{37
try38
{39
var query = db.T_Test.Where<T_Test>(ExpWhere.Compile()).Skip((CurrentPageIndex - 1) * PageSize).Take(PageSize);40
_Result = query.ToList();41
}42
finally { db.Connection.Close(); }43
}44
return _Result;45
}46

47

48
/// <summary>49
/// 用Where(Lambda)方式获取数据50
/// </summary>51
/// <param name="PageSize"></param>52
/// <param name="CurrentPageIndex"></param>53
/// <returns></returns>54
static List<T_Test> GetData(int PageSize, int CurrentPageIndex)55
{56
List<T_Test> _Result = null;57
using (DBDataContext db = new DBDataContext())58
{59
try60
{61
var query = db.T_Test.Where(t => t.F_Age >= 20 && t.F_Name.Contains("J")).Skip((CurrentPageIndex - 1) * PageSize).Take(PageSize);62
_Result = query.ToList();63
}64
finally { db.Connection.Close(); }65
}66
return _Result;67
}68
69

70
/// <summary>71
/// 显示数据72
/// </summary>73
/// <param name="Data"></param>74
static void ShowData(List<T_Test> Data) 75
{76
foreach (var item in Data)77
{78
Console.WriteLine("Name:{0}\t,Age:{1}", item.F_Name, item.F_Age.ToString());79
}80
Console.ReadKey();81
}82
}83
}代码很简单,找出F_Name中包含字母"J",F_Age大于20的记录,并且跳过第一个后,仅获取一条记录
注:PredicateBuilder是一个老外写的用于动态构造Expression表达式的工具类,在查询条件不确定,需要动态创建时,非常有用,完整代码如下:
以下是输出结果:
Name:Jimmy ,Age:20
用Sql Server Profiler跟踪提交到数据库的语句为:
exec sp_executesql N'SELECT [t1].[F_ID], [t1].[F_Name], [t1].[F_Age]
FROM (
SELECT ROW_NUMBER() OVER (ORDER BY [t0].[F_ID], [t0].[F_Name], [t0].[F_Age]) AS [ROW_NUMBER], [t0].[F_ID], [t0].[F_Name], [t0].[F_Age]
FROM [dbo].[T_Test] AS [t0]
WHERE ([t0].[F_Age] >= @p0) AND ([t0].[F_Name] LIKE @p1)
) AS [t1]
WHERE [t1].[ROW_NUMBER] BETWEEN @p2 + 1 AND @p2 + @p3
ORDER BY [t1].[ROW_NUMBER]',N'@p0 int,@p1 nvarchar(3),@p2 int,@p3 int',@p0=20,@p1=N'%J%',@p2=1,@p3=1一切都很完美,跟我们想象的一样仅取了一条记录
3.但是,我们稍微把代码改一下:
把Main方法中的前三行注释去掉,同时把var Data = GetData(1, 1);注释掉,即
static void Main(string[] args)2
{3
Expression<Func<T_Test, bool>> _Expression = PredicateBuilder.True<T_Test>();4
_Expression = _Expression.And(t => t.F_Age >= 20).And(t => t.F_Name.Contains("J"));5
var Data = GetData(_Expression, 1, 1);6

7
//var Data = GetData(1, 2);8

9
ShowData(Data); 10
}修改的用意在换一种方法(即Where<T>(Expression))取数据,运行后输出结果跟上一种方式完全相同,而且这种方式可以在调用方法前动态创建需要的查询条件表达式,用法更灵活,但是我跟踪到的sql语句却是:
FROM [dbo].[T_Test] AS [t0]
即采用Where<T>(Expression)方式取数据时,居然先把所有数据取回来,再利用Expression来进行结果筛选以及Skip/Take操作,真是令人大跌眼镜!(或许仅仅是我水平有限,理解不了而已),这样的方式,在单表数据量很大时,性能当然极低。
恳请园子里的哪位linq达人,能解释一二?
知道了最终结果,处理方法自然也就明朗了,当时为了快速解决问题,只能把这类操作回归到最原始的SqlCommand/SqlDataReader方式读取,也许有更好的办法,欢迎大家指点。
出处:http://yjmyzz.cnblogs.com
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。


浙公网安备 33010602011771号