MSSQL 字符串处理
一、字符转换函数
1、ASCII() 返回字符表达式最左端字符的ASCII 码值。在ASCII()函数中,纯数字的字符串可不用‘’括起来,但含其它字符的字符串必须用‘’括起来使用,否则会出错。
2、CHAR() 将ASCII 码转换为字符。如果没有输入0 ~ 255 之间的ASCII 码值,CHAR() 返回NULL 。
3、LOWER()和UPPER() LOWER()将字符串全部转为小写;UPPER()将字符串全部转为大写
4、STR() 把数值型数据转换为字符型数据。 STR (<float_expression>[,length[, <decimal>]]) length 指定返回的字符串的长度,decimal 指定返回的小数位数。如果没有指定长度,缺省的length 值为10, decimal 缺省值为0。当length 或者decimal 为负值时,返回NULL; 当length 小于小数点左边(包括符号位)的位数时,返回length 个*; 先服从length ,再取decimal ; 当返回的字符串位数小于length ,左边补足空格。
ASCII()、CHAR()、UNICODE()和NCHAR()函数是相似的,它们都可以在字符和字符的标准数字表示之间转换。如果在计算机上使用英语,则键盘上的每个字符都是用ASCII码表示的。为了支持所有可印刷的语言,人们制订了Unicode标准,它支持多种语言特定的字符集。每个Unicode字符需要2个字节的存储空间,是ASCII与ANSI字符的两倍。但是使用2个字就可以表示超过65 000个不同的字符,完全能够支持东欧和亚洲字符。SQL Server同时支持ASCII与Unicode两种标准。
ASCII()和CHAR()是两个基于ASCII的函数,这两个函数可将计算机上应用的每个字符表示为数字。要确定代表一个字符的数字是什么,就应给ASCII()函数传送只包含一个字符的字符串,如下:SELECT ASCII('A') 结果是65。

如要将一个已知数字转换为字符,则使用CHAR()函数即可:SELECT CHAR(65)结果是A。

UNICODE()函数和CHAR()函数的功能相同,只不过NCHAR()是用于Unicode字符的。SQL Server的nchar与nvarchar类型能存储任何Unicode字符,可以和这两个函数一起使用。对于特别大的值,ntext类型和nvarchar(max)类型也支持Unicode字符。要返回扩展字符编码集中的字符,可以将字符编码传递给NCHAR()函数:SELECT NCHAR(65) 返回字母A。

SELECT NCHAR(194) 返回带重音符号的小写a。带声调的。

LOWER()和UPPER()函数这两个函数很容易理解,它们用于将字符串中所有字符分别都转换为小写和大写,这在比较用户输入或者存储用于比较的字符串时是非常有用的。字符串比较通常是区分大小写的,这取决于SQL Server安装时的设置。如果和其他的字符串操纵函数一起使用,就可以将字符串转换为合适的大小写,以便存储或显示。

二、去空格函数
1、LTRIM() 把字符串头部的空格去掉。
2、RTRIM() 把字符串尾部的空格去掉。
LTRIM()和RTRIM()这两个函数分别返回将字符串的左边和右边的空白修剪掉之后的字符串:其实就是去掉左边最后面或者右边最后面的空格。

三、字符串比较函数
1、CHARINDEX() 返回字符串中某个指定的子串出现的开始位置。 CHARINDEX (<’substring_expression’>, <expression>) 其中substring _expression 是所要查找的字符表达式,expression 可为字符串也可为列名表达式。如果没有发现子串,则返回0 值。此函数不能用于TEXT 和IMAGE 数据类型。
2、PATINDEX() 返回字符串中某个指定的子串出现的开始位置。 PATINDEX (<’%substring _expression%’>, <column_ name>)其中子串表达式前后必须有百分号“%”否则返回值为0。与CHARINDEX 函数不同的是,PATINDEX函数的子串中可以使用通配符,且此函数可用于CHAR、 VARCHAR 和TEXT 数据类型。
CHARINDEX()和PATINDEX()函数是原始的SQL函数,用于寻找在一个字符串中某子字符串第一次出现的位置。返回值是一个整型值也就是位置信息,表示某子字符串的第一个字符在整个字符串中的位置索引。
PATINDEX()函数和CHARINDEXO函数类似,方法稍许不同,该函数增加了对通配符(即Like运算符)的支持。它将返回一个字符模式的索引。注意,如果和这些大字符类型一起使用,PATINDEX()函数将返回bigint类型的值,而不是int类型的值。

四、取子串函数
1、left() LEFT (<character_expression>, <integer_expression>) 返回character_expression 左起 integer_expression 个字符。
2、RIGHT() RIGHT (<character_expression>, <integer_expression>) 返回character_expression 右起 integer_expression 个字符。
3、SUBSTRING() SUBSTRING (<expression>, <starting_ position>, length) 返回从字符串左边第starting_ position 个字符起length个字符的部分。
LEFT()与RIGHT()函数是相似的,它们都返回一定长度的子字符串。这两个函数的区别是,它们返回的分别是字符串的不同部分。LEFT()函数返回字符串最左边的字符,顺序从左数到右。RIGHT()函数正好相反,它从最右边的字符开始,以从右到左的顺序返回特定数量的字符。

SUBSTRING()函数能够从字符串的一个位置开始,往右数若干字符,返回一个特定长度的字符串。和LEFT()函数不同之处是,该函数可以指定从哪个位置开始计数,这样就可以在字符串的任何位置摘取子字符串了。这个函数需要三个参数:要解析的字符串、起始位置索引、要返回的子字符串长度。如果要返回到所输入字符串尾部的所有字符,可以使用比所需长度更大的长度值。如图所示函数在字符串第二个位置开始截取,共截取五个字符返回。

五、字符串操作函数
1、QUOTENAME() 返回被特定字符括起来的字符串。 QUOTENAME (<’character_expression’>[, quote_ character]) 其中quote_ character 标明括字符串所用的字符,缺省值为“[]”。
2、REPLICATE() 返回一个重复character_expression 指定次数的字符串。 REPLICATE (character_expression integer_expression) 如果integer_expression 值为负值,则返回NULL 。
3、REVERSE() 将指定的字符串的字符排列顺序颠倒。 REVERSE (<character_expression>) 其中character_expression 可以是字符串、常数或一个列的值。
4、REPLACE() 返回被替换了指定子串的字符串。 REPLACE (<string_expression1>, <string_expression2>, <string_expression3>) 用string_expression3 替换在string_expression1 中的子串string_expression2。
5、SPACE() 返回一个有指定长度的空白字符串。 SPACE (<integer_expression>) 如果integer_expression 值为负值,则返回NULL 。
6、STUFF() 用另一子串替换字符串指定位置、长度的子串。 STUFF (<character_expression1>, <start_ position>, <length>,<character_expression2>) 如果起始位置为负或长度值为负,或者起始位置大于character_expression1 的长度,则返回NULL 值。如果length 长度大于character_expression1 中 start_ position 以右的长度,则character_expression1 只保留首字符。
7,CONCAT(s1,s2)将两个字符串拼接成一个字符串返回。
REPLACE()函数可以把字符串中的某个字符或某个子字符串替换为另一个字符或者子字符串,该函数可以用于全局查找和替换工具中。例如在字符串中出现一些明感的词汇这时就要替换掉或者删除掉。或者现在一些网站为了实现伪原创而进行近义词替换让搜索引擎当原创收录。

REPLICATE()和SPACE()函数在需要将一些字符重复填充进一个字符串时,这两个函数是非常有用的。这里也使用SUBSTRING()例子中的临时表为每个名字填满20个字符,然后将20减去各个字符串的长度,以便将正确的值传递给REPLICATE()函数。例如:有一些数据不能给用户看到只能隐藏部分信息,用户的用户名,手机号码,提交数据的ip地址等明感信息。

REVERSE()函数用于将字符串中的字符颠倒过来。这在处理连接列表中的单个字符值时将会被用到。

STUFF()函数可将字符串中的一部分替换为另一个字符串。它本质上是将一个字符串以特定的长度插入另一个字符串中的特定位置上。这对于源值与目的值的长度不一样的字符串替换是很有用的。下图是将第10个字符串开始替换2个字符替换成11.

QUOTENAME()函数和SQL Server对象名组合使用,以将结果传递给表达式。它只用于给输入的字符串加一对方括号,并返回新形成的字符串。如果参数包含保留的分隔符或者封装字符(比如引号或括号),这个函数将修改字符串,以便SQL Server能将结果字符串中的这类字符当成文本字符。

MSSQL字符处理函数很多,一般很少有单一使用的,几乎都是几个一起使用得到想要的结果。在实际应用中很少在mssql中使用字符处理函数一般都是在客户端处理也就是在程序端处理因为在mssql中处理相对来说比较浪费系统资源,而在客户端处理完以后把结果集直接插入到数据库中的话比较节省系统资源。
六、数据类型转换函数
1、CAST() CAST (<expression> AS <data_ type>[ length ])
2、CONVERT() CONVERT (<data_ type>[ length ], <expression> [, style])
1)data_type为SQL Server系统定义的数据类型,用户自定义的数据类型不能在此使用。
2)length用于指定数据的长度,缺省值为30。
3) 把CHAR或VARCHAR类型转换为诸如INT或SAMLLINT这样的INTEGER类型、结果必须是带正号或负号的数值。
4)TEXT 类型到CHAR或VARCHAR类型转换最多为8000个字符,即CHAR或VARCHAR数据类型是最大长度。
5)IMAGE类型存储 的数据转换到BINARY或VARBINARY类型,最多为8000个字符。
6)把整数值转换为MONEY或SMALLMONEY类型, 按定义的国家的货币单位来处理,如人民币、美元、英镑等。
7)BIT类型的转换把非零值转换为1,并仍以BIT类型存储。
8)试图转换到不同长度的数据类型,会截短转换值并在转换值后显示“+”,以标识发生了这种截断。
9)用CONVERT()函数的style 选项能以不同的格式显示日期和时间。style 是将DATATIME 和SMALLDATETIME 数据转换为字符串时所选用的由SQL Server 系统提供的转换样式编号,不同的样式编号有不同的输出格式。
LEN()函数用于返回一个代表字符串长度的整型值。这个函数使我们使用最多的函数,经常与其他函数一起使用,一般循环或者在一些规则中使用。例如在输入一些数据时判断一下是否超出最大值范围,在输入日期时判断一下输入的日期是否需要用0补位等。

七、日期函数
1、 day(date_expression) 返回date_expression中的日期值
2、 month(date_expression) 返回date_expression中的月份值
3、 year(date_expression) 返回date_expression中的年份值
4、DATEADD() DATEADD (<datepart>, <number>, <date>) 返回指定日期date 加上指定的额外日期间隔number 产生的新日期。
5、DATEDIFF() DATEDIFF (<datepart>, <date1>, <date2>) 返回两个指定日期在datepart 方面的不同之处,即date2 超过date1的差距值,其结果值是一个带有正负号的整数值。
6、DATENAME() DATENAME (<datepart>, <date>) 以字符串的形式返回日期的指定部分此部分。由datepart 来指定。
7、DATEPART() DATEPART (<datepart>, <date>) 以整数值的形式返回日期的指定部分。此部分由datepart 来指定。 DATEPART (dd, date) 等同于DAY (date) DATEPART (mm, date) 等同于MONTH (date) DATEPART (yy, date) 等同于YEAR (date) 8、GETDATE() 以DATETIME 的缺省格式返回系统当前的日期和时间。
--聚合函数
use pubs go select avg(distinct price)
--算平均数 from titles where type='business' go use pubs go select max(ytd_sales)
--最大数 from titles go use pubs go select min(ytd_sales)
--最小数 from titles go use pubs go select type,sum(price),sum(advance)
--求和 from titles group by type order by type go use pubs go select count(distinct city)
--求个数 from authors go use pubs go select stdev(royalty)
--返回给定表达 式中所有值的统计标准偏差 from titles go use pubs go select stdevp(royalty)
-- 返回表达式中所有制的填充统计标准偏差 from titles go use pubs go select var(royalty)
-- 返回所有值的统计方差 from titles go use pubs go select varp(royalty)
--返回所有 值的填充的统计方差 from titles go
--数学函数 select sin(23.45),atan(1.234),rand(),PI(),sign(-2.34) --其中rand是获得一个随机数
--配置函数
--获取当前数据库版本 SELECT @@VERSION
--当前语言 SELECT @@LANGUAGE
--时间函数
select getdate() as 'wawa_getdate'
--当前时间 select getutcdate() as 'wawa_getutcdate'
--获取utc时间 select day(getdate()) as 'wawa_day'
--取出天 select month(getdate()) as 'wawa_month'
--取出月 select year(getdate()) as 'wawa_
--取出年 select dateadd(d,3,getdate()) as wawa_dateadd
--加三天,注意'd'表示天,'m'表示月,'yy'表示年,下面一样 select datediff(d,'2004-07-01','2004-07-15') as wawa_datediff
--计算两个时间的差 select datename(d,'2004-07-15') as wawa_datename
--取出时间的某一部分 select datepart(d,getdate()) as wawa_datepart
--取出时间的某一部分,和上面的那个差不多 --字符串函数 select ascii(123) as '123',ascii('123') as '"123"',ascii('abc') as '"abc"'
--转换成ascii码 select char(123),char(321),char(-123)
--根据ascii转换成字符 select lower('ABC'),lower('Abc'),upper('Abc'),upper('abc') --转换大小写 select str(123.45,6,1), str(123.45,2,2)
--把数值转换成字符串 select ltrim(' "左边没有空格"')
--去空格 select rtrim('"右边没有空格" ')
--去空格 select ltrim(rtrim(' "左右都没有空格" '))
--去空格 select left('sql server',3),right('sql server',6)
--取左或者取右 use pubs select au_lname,substring(au_fname,1,1)
--取子串 from authors order by au_lname select charindex('123','abc123def',2) --返回字符串中指定表达式的起始位置 select patindex('123','abc123def'),patindex('%123%','abc123def')
--返回表达式中某模式第一次出现的起始位置 select quotename('abc','{'),quotename('abc')
--返回由指定字符扩住的字符串 select reverse('abc'),reverse('上海')
--颠倒字符串顺序 select replace('abcdefghicde','cde','xxxx')
--返回呗替换了指定子串的字符串 select space(5),space(-2)
--系统函数 select host_name() as 'host_name',host_id() as 'host_id',user_name() as 'user_name',user_id() as 'user_id',db_name() as 'db_name'
--变量的定义使用
--声明局部变量 declare @mycounter int declare @last_name varchar(30),@fname varchar(20),@state varchar(2) --一下声明多个变量
--给变量赋值 use northwind go declare @firstnamevariable varchar(20), @regionvariable varchar(30) set @firstnamevariable='anne' --可以用set,也可以用select给变量赋值,微软推荐用set,但select在选择一个值直接赋值时很有用 set @regionvariable ='wa' select lastname,firstname,title
--用声明并赋值过的变量构建一个Select语句并查询 from employees where firstname= @firstnamevariable or region=@regionvariable go
--全局变量 select @@version
--返回数据库版本 select @@error
--返回最后的一次脚本错误 select @@identity
--返回最后的一个自动增长列的id

浙公网安备 33010602011771号