《Microsoft Sql server 2008 Internal》读书笔记--第七章Special Storage(3)

《Microsoft Sql server 2008 Interna》读书笔记订阅地址：

http://www.cnblogs.com/downmoon/category/230397.html/rss

《Microsoft Sql server 2008 Interna》索引目录：

《Microsoft Sql server 2008 Internal》读书笔记--目录索引

上文简单介绍了不限长度的Large Object Data存储形式，以及存储在数据行的LOＢ数据。本文简要介绍MAX-Length数据及添加数据到LOB列的存储，另外主要介绍filestream 数据的基础。

■MAX-Length数据的存储

SQL2005/2008给我们MAX定义符选项来定义可变长度字段。通过MAX定义，你可以让SQL Server来决定存储值作为常规的varchar,nvarchar或varbinary或LOB数据（通常在大于8000字节时会使用text,ntext,image)。

■附加数据到LOB列

在存储引擎中，每一个LOB列被分解成不大于8040字节的碎片。当附加数据到LOB列时，SQL Server查找附加点，并试图寻找新数据将被增加的位置，新老数据如果合起来大于8040字节，那么分配一个大对象页(Large Object Page)直到余下的碎片小于8040字节，再寻找一个页存放其余的字节。当SQL Server为LOB数据分配页时，它有两个分配策略：（1）如果数据小于64Kb,随机分配一个页。这个页来自一个大对象IAM的部分的一个范围(extent)，但页不一定是连续的。（2）如果大于64KB,它使用一个附加页分配器，一次性的分配一个范围，在这个范围中连续地写数据。因而，推荐的做法是：如果需要插入64KB数据，那么一次插入8*8040时，数据将是继续存放的，而且是在一个范围(extent)内。
如果你发现一个Large Object 数据变得越来越碎片，可以使用ALter Index reorganize选项来整理它。前提是默认打开为ON的WithLOB_compaction选项你没有关闭它。

■文件流数据（FileStream Data）

尽管SQL Server提供了很大的便利，使得你可以在数据库中灵活存储Large object Data。好处：

1、大对象数据的事务一致性可以保证。

2、包含大对象数据的备份与恢复，允许你完整地在某个时刻点恢复大对象数据。

3、所有的数据使用一个单一的存储和查询环境。

但是也有一些不利因素：

1、大对象数据在缓存中占用大量的缓冲器。

2、更新一个大对象会引起大范围的数据整理。

3、数据库文件会变得非常大。

SQL Server 2008 和 SQL Server Native Client 10.0 支持增强的 FILESTREAM 功能。FILESTREAM 功能允许通过 SQL Server 或通过直接访问 Windows 文件系统来存储和访问大型二进制值。大型二进制值是大于 2 GB 的值。有关增强的 FILESTREAM 支持的详细信息，请参阅FILESTREAM 概述。文件流来作为一种大数据存储方案，其优势：

１、大对象数据存储在文件系统中却在数据库中有一个48字节的文件指针值存储在包含文件流的列中。

２、大对象数据可以通过T-SQL和NTFS 流APIs来访问。

３、大对象数据的大小仅受限于NTFS值大小，而不是老的2GB大小限制(LOB数据）

劣势：

１、数据库镜像不能被用于包含文件流数据的数据库。

２、数据库快照不能包含文件流文件组，因而，文件流数据不可用。在快照中使用slect请求一个文件流列会出错。

３、文件流数据不能被SQL Server本地加密。

■为SQL Server启用文件流数据（FileStream Data）

如图即可启用文件流数据：

邀月工作室

启用后必须使用sp_configure设置SQL Server实例到你需要的文件访问级别。三个值：０代表文件流访问许可；１代表你可以使用　Ｔ—ＳＱＬ访问文件流数据；２代表你可以使用T-SQL和特定的Win32 流API作为文件流访问。

EXEC sp_configure 'filestream access level', 1;
RECONFIGURE;

■创建一个启用文件流的数据库

FILESTREAM 数据必须存储在 FILESTREAM 文件组中。在创建数据库时，必须至少为一个文件组指定 CONTAINS FILESTREAM 子句。FILESTREAM 文件组是包含文件系统目录而非文件本身的专用文件组。这些文件系统目录称为“数据容器” 。数据容器是数据库引擎存储与文件系统存储之间的接口。更多，请看MSDN:

http://msdn.microsoft.com/zh-cn/library/bb933993.aspx

下面例子创建一个包含FileStream的数据库。

CREATE DATABASE MyFilestreamDB
ON
PRIMARY ( NAME = Rowdata1,
    FILENAME = 'D:\Data2\Rowdata1.mdf'),
FILEGROUP FileStreamGroup1 CONTAINS FILESTREAM DEFAULT( NAME = FSData1,
    FILENAME = 'D:\Data2\filestream1'),
FILEGROUP FileStreamGroup2 CONTAINS FILESTREAM ( NAME = FSData2,
    FILENAME = 'D:\Data2\filestream2')
LOG ON  ( NAME = FSDBLOG,
    FILENAME = 'D:\Data2\FSDB_log.ldf');

邀月工作室

以上语句执行时，SQL Server在D:\Data2下创建了两个文件夹，filestream1和filestream2,初始时，每个窗口包含了一个空目录$FSLOG和一个名为filestream.hdr的头文件。当一个容器中的表被创建，并使用文件流空间时，每一个包含Filestream的分区或表的文件夹被在容器内创建。对于现有数据库，可以使用 ALTER DATABASE 语句来添加 FILESTREAM 文件组,随后通过alter database在Filestream文件组中增加一个文件。记住：不能在master,model,tempdb中增加filestream文件组

■创建一个存放FileStream的表

CREATE TABLE MyFilestreamDB.dbo.Records
(
    [Id] [uniqueidentifier] ROWGUIDCOL NOT NULL UNIQUE,
    [SerialNumber] INTEGER UNIQUE,
    [Chart_Primary] VARBINARY(MAX) FILESTREAM NULL,
    [Chart_Secondary] VARBINARY(MAX) FILESTREAM NULL)
FILESTREAM_ON FileStreamGroup1;

邀月工作室
警告：当你drop这个表时，文件夹及子文件夹、包含文件并不会被文件系统立刻移走。而是等待垃圾回收器线程(Garbage Collection Thread)处理。此时你可以手工删除这些文件，但要小心。

■操作(Manipulating)FileStream数据

FileStream数据能被T-SQL或win32 API操作。当你使用T-SQL时，数据被当作varbinary(Max)准确地处理,而使用win32 API需要你首先获取文件路径和当前事务上下文。本章中例子主要使用T-SQL,win32API的例子，请参看MSDN.

■insert FileStream data

USE MyFileStreamDB
INSERT INTO dbo.Records
    SELECT newid (), 24,
      CAST (REPLICATE (CONVERT(varchar(MAX), 'Base Data'), 10000)
            AS varbinary(max)),
      0x;

注意0x是空的二进制字符串，不同于null，在filestream列中有一个not-null值的行对应一个文件，即使是0值。

邀月工作室

下文将继续介绍Filestream和稀疏列。

posted @ 2010-05-06 08:01 邀月阅读(2415) 评论(5) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

《Microsoft Sql server 2008 Internal》读书笔记--第七章Special Storage(3)

公告