T-SQL中的正则表达式
发表于:2007-07-02来源:作者:点击数:
标签:
T-SQL中的正则表达式 原作者:Cory Koski 发表时间:2003/06/24 本文来自Cory Koski。Cory写道:“我最近遇到一个问题,就是试图在 数据库 域中搜索一个正则表达式。还没有一个版本的 SQLServer 内部支持正则表达式,但我发现了一个将正则表达式的所有优点添
T-SQL中的正则表达式
原作者:Cory Koski
发表时间:2003/06/24
本文来自Cory Koski。Cory写道:“我最近遇到一个问题,就是试图在
数据库域中搜索一个正则表达式。还没有一个版本的
SQLServer内部支持正则表达式,但我发现了一个将正则表达式的所有优点添加到你的T_SQL应用的方法。为了更容易的使用正则表达式,我们可以使用自定义函数(User Defined Function, UDF)来帮助我们并使工作简洁。”
在这个
解决方案中,我们需要
SQL Server 2000或更高。我们还需要确定机器中有
VBScript.RegExp类库,这随大多数
Windows 2000 servers中的Windows Scripting包配有。若你正在使用一个更早版本的Windows,你必须为你的操作系统
下载最新版的Windows Scripting。
自定义函数
下面是我的自定义函数,可用来在源字符串中搜索一个正则模式表达式。
CREATE FUNCTION dbo.find_regular_expression
(
@source varchar(5000),
@regexp varchar(1000),
@ignorecase bit = 0
)
RETURNS bit
AS
BEGIN
DECLARE @hr integer
DECLARE @objRegExp integer
DECLARE @objMatches integer
DECLARE @objMatch integer
DECLARE @count integer
DECLARE @results bit
EXEC @hr = sp_OACreate @#VBScript.RegExp@#, @objRegExp OUTPUT
IF @hr <> 0 BEGIN
SET @results = 0
RETURN @results
END
EXEC @hr = sp_OASetProperty @objRegExp, @#Pattern@#, @regexp
IF @hr <> 0 BEGIN
SET @results = 0
RETURN @results
END
EXEC @hr = sp_OASetProperty @objRegExp, @#Global@#, false
IF @hr <> 0 BEGIN
SET @results = 0
RETURN @results
END
EXEC @hr = sp_OASetProperty @objRegExp, @#IgnoreCase@#, @ignorecase
IF @hr <> 0 BEGIN
SET @results = 0
RETURN @results
END
EXEC @hr = sp_OAMethod @objRegExp, @#Test@#, @results OUTPUT, @source
IF @hr <> 0 BEGIN
SET @results = 0
RETURN @results
END
EXEC @hr = sp_OADestroy @objRegExp
IF @hr <> 0 BEGIN
SET @results = 0
RETURN @results
END
RETURN @results
END
将这个UDF保存到你的数据库中,并确定有授权来运行它。当然,你也得确保运行它的人有运行sp_OAxxxxx类扩展存储过程的权限。
这个函数已确保正常运行,并且即便是和COM对象一起使用,也还是挺快的。
举例
使用正则表达式的一个地方就是
测试特殊字符。我们不搜索所有的特殊字符,而是查找正常字符的匹配项,例如字母和空格。我们看看它的运行。
DECLARE @intLength AS INTEGER
DECLARE @vchRegularExpression AS VARCHAR(50)
DECLARE @vchSourceString as VARCHAR(50)
DECLARE @vchSourceString2 as VARCHAR(50)
DECLARE @bitHasNoSpecialCharacters as BIT
-- 初始化变量
SET @vchSourceString = @#Test one This is a test!!@#
SET @vchSourceString2 = @#Test two This is a test@#
-- 我们的正则表达式应该类似于
-- [a-zA-Z ]{}
-- 如: [a-zA-Z ]{10} ... 一个十字符的字符串
-- 获得字符串长度
SET @intLength = LEN(@vchSourceString)
-- 设置完整的正则表达式
SET @vchRegularExpression = @#[a-zA-Z ]{@# +
CAST(@intLength as varchar) + @#}@#
-- 是否有任何特殊字符
SET @bitHasNoSpecialCharacters = dbo.find_regular_expression(
@vchSourceString, @vchRegularExpression,0)
PRINT @vchSourceString
IF @bitHasNoSpecialCharacters = 1 BEGIN
PRINT @#No special characters.@#
END ELSE BEGIN
PRINT @#Special characters found.@#
END
PRINT @#---@#
-- 获得字符串长度
SET @intLength = LEN(@vchSourceString2)
-- 设置完整的正则表达式
SET @vchRegularExpression = @#[a-zA-Z ]{@# +
CAST(@intLength as varchar) + @#}@#
-- 是否有任何特殊字符
SET @bitHasNoSpecialCharacters = dbo.find_regular_expression(
@vchSourceString2, @vchRegularExpression,0)
PRINT @vchSourceString2
IF @bitHasNoSpecialCharacters = 1 BEGIN
PRINT @#No special characters.@#
END ELSE BEGIN
PRINT @#Special characters found.@#
END
GO
The results for this example would be:
本例的结果应该是:
Test one This is a test!!
Special characters found.
---
Test two This is a test
No special characters.
结论:
正如你所见,这是一个简单技巧,在特定的场合得到了非常有用的结果。你作为一个T_SQL
开发人员,可以在正则表达式库VBScript.RegExp中使用和扩展这个技巧。
原文转自:http://www.ltesting.net