韧毅's profile澹水湖边PhotosBlogListsMore Tools Help

Blog


    May 30

    SQL Server bcp 实用工具

    bcp 实用工具在 Microsoft® SQL Server™ 2000 实例和数据文件之间以用户指定的格式复制数据。
    语法
    bcp {[[database_name.][owner].]{table_name | view_name} | "query"}
        {in | out | queryout | format} data_file
        [-m max_errors] [-f format_file] [-e err_file]
        [-F first_row] [-L last_row] [-b batch_size]
        [-n] [-c] [-w] [-N] [-V (60 | 65 | 70)] [-6]
        [-q] [-C code_page] [-t field_term] [-r row_term]
        [-i input_file] [-o output_file] [-a packet_size]
        [-S server_name[\instance_name]] [-U login_id] [-P password]
        [-T] [-v] [-R] [-k] [-E] [-h "hint [,...n]"]
    参数
    database_name

    指定的表或视图所在数据库的名称。如果未指定,则为用户默认数据库。

    owner

    表或视图所有者的名称。如果执行大容量复制操作的用户拥有指定的表或视图,则 owner 是可选的。如果没有指定 owner 并且执行大容量复制操作的用户不拥有指定的表或视图,则 Microsoft® SQL Server™ 2000 将返回错误信息并取消大容量复制操作。

    table_name

    是将数据复制到 SQL Server 时 (in) 的目的表名,以及从 SQL Server 复制数据时 (out) 的源表名。

    view_name

    是将数据复制到 SQL Server 时 (in) 的目的视图名,以及从 SQL Server 复制数据时 (out) 的源视图名。只有其中所有列都引用同一个表的视图才能用作目的视图。有关将数据复制到视图的限制的更多信息,请参见 INSERT。

    Query

    是返回一个结果集的 Transact-SQL 查询。如果查询返回多个结果集,例如指定 COMPUTE 子句的 SELECT 语句,只有第一个结果集将复制到数据文件,随后的结果集被忽略。使用双引号引起查询语句,使用单引号引起查询语句中嵌入的任何内容。在从查询中大容量复制数据时,还必须指定 queryout。

    in | out | queryout | format

    指定大容量复制的方向。in 是从文件复制到数据库表或视图,out 是指从数据库表或视图复制到文件。只有从查询中大容量复制数据时,才必须指定 queryout。根据指定的选项(-n、-c、-w、-6 或 -N)以及表或视图分隔符,format 将创建一个格式文件。如果使用 format,则还必须指定 -f 选项。



    说明  Microsoft SQL Server 6.5 中的 bcp 实用工具不支持大容量复制到包含 sql_variant 或 bigint 数据类型的表。



    data_file

    大容量复制表或视图到磁盘(或者从磁盘复制)时所用数据文件的完整路径。当将数据大容量复制到 SQL Server 时,此数据文件包含将复制到指定表或视图的数据。当从 SQL Server 大容量复制数据时,该数据文件包含从表或视图复制的数据。路径可以有 1 到 255 个字符。

    -m max_errors

    指定在大容量复制操作取消之前可能产生的错误的最大数目。bcp 无法复制的每一行都将被忽略并计为一个错误。如果没有包括该选项,则默认为 10。

    -f format_file

    指定格式文件的完整路径,该格式文件包含以前在同一个表或视图上使用 bcp 时的存储响应。当使用由 format 选项所创建的格式文件大容量复制入或复制出数据时,使用此选项。格式文件的创建是可选的。在提示几个格式问题之后,bcp 将提示是否在格式文件中保存回答。默认文件名为 Bcp.fmt。大容量复制数据时,bcp 可引用一个格式文件,因此不必重新交互输入以前的回答。如果未使用此选项,也没有指定 –n、-c、-w、-6 或 -N,则 bcp 将提示输入格式信息。

    -e err_file

    指定错误文件的完整路径,此错误文件用于存储 bcp 无法从文件传输到数据库的所有行。来自 bcp 的错误信息将发送到用户工作站。如果未使用此选项,则不创建错误文件。

    -F first_row

    指定要大容量复制的第一行的序数。默认值是 1,表示在指定数据文件的第一行。

    -L last_row

    指定要大容量复制的最后一行的序数。默认值是 0,表示指定数据文件中的最后一行。

    -b batch_size

    指定所复制的每批数据中的行数。每个批处理作为一个事务复制至服务器。SQL Server 提交或回滚(在失败时)每个批处理的事务。默认情况下,指定的数据文件中的所有数据都作为一批复制。请不要与 -h "ROWS_PER_BATCH = bb" 选项一起使用。

    -n

    使用数据的本机(数据库)数据类型执行大容量复制操作。此选项不提示输入每一字段,它将使用本机值。

    -c

    使用字符数据类型执行大容量复制操作。此选项不提示输入每一字段;它使用 char 作为存储类型,不带前缀,\t(制表符)作为字段分隔符,\n(换行符)作为行终止符。

    -w

    使用 Unicode 字符执行大容量复制操作。此选项不提示输入每一字段;它使用 nchar 作为存储类型,不带前缀,\t(制表符)作为字段分隔符,\n(换行符)作为行终止符。不能在 SQL Server 6.5 版或更早版本中使用。

    -N

    对非字符数据使用数据的本机(数据库)数据类型和对字符数据使用 Unicode 字符类型执行大容量复制操作。这是可替代 -w 选项的性能更高的选项,其目的是使用数据文件将数据从一个 SQL Server 传输到另一个 SQL Server 中。它不提示输入每一字段。在需要传输包含 ANSI 扩展字符的数据以及想利用本机模式的性能时,可以使用这一选项。不能在 SQL Server 6.5 版或更早版本中使用 -N 选项。

    -V (60 | 65 | 70)

    使用 SQL Server 早期版本中的数据类型执行大容量复制操作。此选项与字符 (-c) 或本机 (-n) 格式一起使用。此选项并不提示输入每一字段,它使用默认值。例如,若要将 SQL Server 6.5 中的 bcp 实用工具所支持(但 ODBC 不再支持)的日期格式大容量复制到 SQL Server 2000,可使用 -V 65 参数。



    重要  将数据从 SQL Server 大容量复制到数据文件时,即使指定了 –V,bcp 实用工具也不会为任何 datetime 或 smalldatetime 数据生成 SQL Server 6.0 或 SQL Server 6.5 的日期格式。日期将始终以 ODBC 格式写入。另外,由于 SQL Server 6.5 版或更早版本不支持可为空的 bit 数据,因此 bit 列中的空值写为值 0。



    -6

    使用 SQL Server 6.0 或 SQL Server 6.5 数据类型执行大容量复制操作。仅为保持向后兼容性。改为使用 –V 选项。

    -q

    在 bcp 实用工具和 SQL Server 实例的连接中执行 SET QUOTED_IDENTIFIERS ON 语句。使用该选项指定包含空格或引号的数据库、所有者、表或视图的名称。将由三部分组成的整个表名或视图名引在双引号 (" ") 中。

    -C code_page

    仅为保持向后兼容性。作为代替,请在格式文件或交互式 bcp 中为每一列指定一个排序规则名。

    指定数据文件中的数据代码页。只有当数据中包含字符值大于 127 或小于 32 的 char、varchar 或 text 列时,code_page 才有用。
    代码页值描述ACPANSI/Microsoft Windows® (ISO 1252)。OEM客户程序使用的默认代码页。如果未指定 -C,则这是 bcp 使用的默认代码页。RAW不发生从一个代码页到另一个代码页的转换。因为不发生转换,所以这是最快的选项。<值>特定的代码页号码,例如 850。

    -t field_term

    指定字段终止符。默认的字段终止符是 \t(制表符)。使用此参数替代默认字段终止符。

    -r row_term

    指定行终止符。默认的行终止符是 \n(换行符)。使用此参数替代默认行终止符。

    -i input_file

    指定响应文件的名称,使用交互模式(未指定 –n、-c、-w、-6 或 -N)执行大容量复制时,响应文件包含对每一字段命令提示问题的响应。

    -o output_file

    指定接收 bcp 输出(从命令提示重定向)的文件的名称。

    -a packet_size

    指定发送到和发送自服务器的每个网络数据包的字节数。可以使用 SQL Server 企业管理器(或 sp_configure 系统存储过程)设置服务器配置选项。但是,使用此选项可以单个地替代服务器配置选项。packet_size 可以设置为 4096 到 65535 字节,默认值为 4096。

    数据包大小的增加能够提高大容量复制操作的性能。如果要求一个较大的数据包而得不到,则使用默认设置。bcp 生成的性能统计显示出所使用数据包的大小。

    -S server_name[\instance_name]

    指定要连接到的 SQL Server 实例。指定 server_name 以连接该服务器上的 SQL Server 默认实例。指定 server_name\instance_name 以连接到该服务器上的 SQL Server 2000 命名实例。如果未指定服务器,则 bcp 连接到本地计算机上的 SQL Server 默认实例。从网络上的远程计算机执行 bcp 时,要求此选项。

    -U login_id

    指定用于连接到 SQL Server 的登录 ID。

    -P password

    指定登录 ID 的密码。如果未使用此选项,则 bcp 将提示输入密码。如果不带密码将此选项用于命令提示行末尾,则 bcp 将使用默认密码 (NULL)。

    -T

    指定 bcp 使用网络用户的安全凭据,通过信任连接连接到 SQL Server。不需要 login_id 和 password。

    -v

    报告 bcp 实用工具的版本号和版权。

    -R

    指定使用为客户端计算机的区域设置定义的区域格式,将货币、日期和时间数据大容量复制到 SQL Server 中。默认情况下,将会忽略区域设置。

    -k

    指定在大容量复制操作中空列应保留一个空值,而不是对插入的列赋予默认值。

    -E

    指定标识列的值出现在要导入的文件中。如果没有给出 -E,则正导入的数据文件中此列的标识值将被忽略,而且 SQL Server 2000 会根据创建表期间指定的种子值和增量值自动指派唯一的值。如果数据文件的表或视图中不包含标识列的值,则使用格式文件指定导入数据时应跳过表或视图中的标识列;SQL Server 2000 将自动为该列指派唯一值。有关详细信息,请参见 DBCC CHECKIDENT。

    -h "hint [,...n]"

    指定在大容量复制数据到表或视图时所使用的提示。在大容量复制数据到 SQL Server 6.x 或更早版本时,不能使用此选项。
    提示描述ORDER (column [ASC | DESC] [,...n])数据文件中数据的排序次序。如果要装载的数据已根据表中的聚集索引排序,则会提高大容量复制的性能。如果数据文件按不同次序排序,或者该表没有聚集索引,则将忽略 ORDER 提示。所提供的列名必须是目的表中的有效列。默认情况下,bcp 假设数据文件没有排序。ROWS_PER_BATCH = bb每批中数据的行数(即 bb)。在未指定 -b 时使用,这将使整个数据文件作为单个事务发送到服务器。服务器根据值 bb 优化大容量装载。默认情况下,ROWS_PER_BATCH 未知。KILOBYTES_PER_BATCH = cc每批中数据的千字节 (KB) 近似数量(即 cc)。默认情况下,KILOBYTES_PER_BATCH 未知。TABLOCK大容量复制操作期间将获取表级锁。由于只在大容量复制操作期间才控制锁减少了表中锁的争夺,因此此提示可以显著提高性能。如果表没有索引并且指定了 TABLOCK,则该表可以同时由多个客户端装载。默认情况下,锁定行为是由表选项 table lock on bulk load 决定的。CHECK_CONSTRAINTS大容量复制操作期间,将检查目的表上的所有约束。默认情况下,将会忽略约束。FIRE_TRIGGERS与 in 参数一起指定,在目的表上定义的任何插入触发器将在大容量复制操作期间执行。如果没有指定 FIRE_TRIGGERS,则不执行插入触发器。对于 out、queryout 和 format 参数,将忽略 FIRE_TRIGGERS。
    注释
    将忽略要导入的数据文件中计算列或 timestamp 列的值,SQL Server 2000 自动赋值。如果数据文件不包含表中的计算列或 timestamp 列的值,可用格式文件指定应在导入数据时跳过表中的计算列和 timestamp 列;SQL Server 将自动为该列赋值。

    计算列和 timestamp 列照常会从 SQL Server 大容量复制到一个数据文件。

    SQL Server 标识符(包括数据库名称、表名或视图名、登录和密码)可以包含诸如嵌入空格和引号等字符。当在命令提示符处指定包含空格或引号的标识符或文件名时,需要将该标识符引在双引号 (" ") 内。另外,对于包含嵌入空格或引号的所有者、表或视图的名称,可以指定 -q 选项,或者将所有者、表或视图的名称在双引号内用方括号 ([ ]) 括起来。

    例如,Northwind 数据库内有表 Jane's Orders,该表由用户 Jane Doe 所拥有。若要使用登录 Jane Doe 和密码 go dba 将该表从 Northwind 数据库大容量复制到 Orders.txt 文件,请执行下列命令之一:

    bcp "Northwind.Jane Doe.Jane's Orders" out "Jane's Orders.txt" -c -q -U"Jane Doe" -P"go dba"bcp "Northwind.[Jane Doe].[Jane's Orders]" out "Jane's Orders.txt" -c -U"Jane Doe" -P"go dba"

    若要指定包含空格或引号的数据库名称,必须使用 -q 选项。

    dos命令 - "FOR" - 高级应用范例

    以前常觉得DOS的命令行功能太弱,无法象UNIX一样可以用命令行完成非常复杂的操作。实际上,当MS从WIN2K开始将命令行增强后,已经借鉴了相当多UNIX的优点,虽然还无法做到象UNIX那么灵活,但已可完成绝大多数的任务,比如用&amp;&amp;和||连接两个(或更多)命令,由前一个的返回值来决定下一个是否执行,等等。而在这些增强中,最明显的,就是FOR命令。

    举个例子,用适当的参数,可用FOR命令将 date /t 的输出 从 "Sat 07/13/2002" 变成你想要的格式,比如, "2002-07-13":

    c:\&gt;for /f "tokens=2,3,4 delims=/ " %a in ('date /t') do @echo %c-%a-%b
    2002-07-13

    该例将在(3)中详细说明。

    0. 基本应用

    简单说,FOR是个循环,可以用你指定的循环范围生成一系列命令。最简单的例子,就是人工指定循环范围,然后对每个值执行指定的命令。例如,想快速报告每个硬盘分区的剩余空间:

    for %a in (c: d: e: f do @dir %a\ | find "bytes free"

    将输出:

    8 Dir(s) 1,361,334,272 bytes free
    15 Dir(s) 8,505,581,568 bytes free
    12 Dir(s) 12,975,149,056 bytes free
    7 Dir(s) 11,658,854,400 bytes free

    用它可以使一些不支持通配符的命令对一系列文件进行操作。在WIN9X中,TYPE命令(显示文件内容)是不支持*.txt这种格式的(WIN2K开始TYPE已支持通配)。遇到类似情况就可以用FOR:

    for %a in (*.txt) do type %a

    这些还不是FOR最强大的功能。我认为它最强大的功能,表现在以下这些高级应用:

    1. 可以用 /r 参数遍历整个目录树

    2. 可以用 /f 参数将文本文件内容作为循环范围

    3. 可以用 /f 参数将某一命令执行结果作为循环范围

    4. 可以用 %~ 操作符将文件名分离成文件名、扩展名、盘符等独立部分

    现分别举例说明如下:

    1. 用 /r 遍历目录树

    当用 *.* 或 *.txt 等文件名通配符作为 for /r 的循环范围时,可以对当前目录下所有文件(包括子目录里面的文件)进行操作。举个例子,你想在当前目录的所有txt文件(包括子目录)内容中查找"bluebear"字样,但由于find本身不能遍历子目录,所以我们用for:

    for /r . %a in (*.txt) do @find "bluebear" %a

    find 前面的 @ 只是让输出结果不包括 find 命令本身。这是DOS很早就有的功能。和FOR无关。

    当用 . 作为循环范围时,for 只将子目录的结构(目录名)作为循环范围,而不包括里面的文件。有点象 TREE 命令,不过侧重点不同。TREE 的重点是用很漂亮易读的格式输出,而FOR的输出适合一些自动任务,例如,我们都知道用CVS管理的项目中,每个子目录下都会有一个CVS目录,有时在软件发行时我们想把这些CVS目录全部去掉:

    for /r . %a in (.) do @if exist %a\CVS rd /s /q %a\CVS

    先用 if exist 判断一下,是因为 for 只是机械的对每个目录进行列举,如果有些目录下面没有CVS也会被执行到。用 if exist 判断一下比较安全。

    这种删除命令威力太大,请小心使用。最好是在真正执行以上的删除命令前,将 rd /s /q 换成 @echo 先列出要删出的目录,确认无误后再换回rd /s /q:

    for /r . %a in (.) do @if exist %a\CVS @echo %a\CVS

    可能目录中会多出一层 ".",比如 c:\proj\release\.\CVS ,但不会影响命令的执行效果。

    2. 将某一文件内容或命令执行结果作为循环范围:

    假如你有一个文件 todel.txt,里面是所有要删除的文件列表,现在你想将里面列出的每个文件都删掉。假设这个文件是每个文件名占一行,象这样:

    c:\temp\a1.txt
    c:\temp\a2.txt
    c:\temp\subdir\b3.txt
    c:\temp\subdir\b4.txt

    那么可以用FOR来完成:

    for /f %a in (todel.txt) do del %a

    这个命令还可以更强大。比如你的 todel.txt 并不是象上面例子那么干净,而是由DIR直接生成,有一些没用的信息,比如这样:

    Volume in drive D is DATA
    Volume Serial Number is C47C-9908

    Directory of D:\tmp

    09/26/2001 12:50 PM 18,426 alg0925.txt
    12/02/2001 04:29 AM 795 bsample.txt
    04/11/2002 04:18 AM 2,043 invitation.txt
    4 File(s) 25,651 bytes
    0 Dir(s) 4,060,700,672 bytes free

    for 仍然可以解出其中的文件名并进行操作:

    for /f "skip=5 tokens=5" %a in (todel.txt) do @if exist %a DEL %a

    当然,上面这个命令是在进行删除,如果你只是想看看哪些文件将被操作,把DEL换成ech

    for /f "skip=5 tokens=5" %a in (todel.txt) do @if exist %a echo %a

    你将看到:

    alg0925.txt
    bsample.txt
    invitation.txt

    skip=5表示跳过前5行(就是DIR输出的头部信息),tokens=5表示将每行的第5列作为循环值放入%a,正好是文件名。在这里我加了一个文件存在判断,是因为最后一行的"free"刚好也是第5列,目前还想不出好的办法来滤掉最后两行,所以检查一下可保万无一失。

    3. 可以用 /f 参数将某一命令执行结果作为循环范围

    非常有用的功能。比如,我们想知道目前的环境变量有哪些名字(我们只要名字,不要值)。可是SET命令的输出是“名字=值”的格式,现在可以用FOR来只取得名字部分:

    FOR /F "delims==" %i IN ('set') DO @echo %i

    将看到:

    ALLUSERSPROFILE
    APPDATA
    CLASSPATH
    CommonProgramFiles
    COMPUTERNAME
    ComSpec
    dircmd
    HOMEDRIVE
    ......

    这里是将set命令执行的结果拿来作为循环范围。delims==表示用=作为分隔符,由于FOR /F默认是用每行第一个TOKEN,所以可以分离出变量名。如果是想仅列出值:

    FOR /F "delims== tokens=2" %i IN ('set') DO @echo %i

    tokens=2和前例相同,表示将第二列(由=作为分隔符)作为循环值。

    再来个更有用的例子:

    我们知道 date /t (/t表示不要询问用户输入)的输出是象这样的:

    Sat 07/13/2002

    现在我想分离出日期部分,也就是13:

    for /f "tokens=3 delims=/ " %a in ('date /t') do @echo %a

    实际上把 tokens后面换成1,2,3或4,你将分别得到Sat, 07, 13和2002。注意delims=/后面还有个空格,表示/和空格都是分隔符。由于这个空格delims必须是/f选项的最后一项。

    再灵活一点,象本文开头提到的,将日期用2002-07-13的格式输出:

    for /f "tokens=2,3,4 delims=/ " %a in ('date /t') do @echo %c-%a-%b

    当tokens后跟多个值时,将分别映射到%a, %b, %c等。实际上跟你指定的变量有关,如果你指定的是 %i, 它们就会用%i, %j, %k等。

    灵活应用这一点,几乎没有做不了的事。

    4. 可以用 %~ 操作符将文件名分离成文件名、扩展名、盘符等独立部分

    这个比较简单,就是说将循环变量的值自动分离成只要文件名,只要扩展名,或只要盘符等等。

    例:要将 c:\mp3下所有mp3的歌名列出,如果用一般的 dir /b/s 或 for /r ,将会是这样:

    g:\mp3\Archived\05-18-01-A\游鸿明-下沙\游鸿明-01 下沙.mp3
    g:\mp3\Archived\05-18-01-A\游鸿明-下沙\游鸿明-02 21个人.mp3
    ......
    g:\mp3\Archived\05-18-01-A\王菲-寓言\王菲-阿修罗.mp3
    g:\mp3\Archived\05-18-01-A\王菲-寓言\王菲-彼岸花.mp3
    g:\mp3\Archived\05-18-01-A\王菲-寓言\王菲-不爱我的我不爱.mp3
    ......

    如果我只要歌名(不要路径和".mp3"):

    游鸿明-01 下沙
    游鸿明-02 21个人
    ......
    王菲-阿修罗
    王菲-彼岸花
    王菲-不爱我的我不爱
    ......

    那么可以用FOR命令:

    for /r g:\mp3 %a in (*.mp3) do @echo %~na

    凡是 %~ 开头的操作符,都是文件名的分离操作。具体请看 for /? 帮助。

    本文举的例子有些可能没有实际用处,或可用其它办法完成。仅用于体现FOR可以不借助其它工具,仅用DOS命令组合,就可完成相当灵活的任务。
    May 08

    过了五一来上班

           五一长假过去了,日子又恢复了平静和规律。五一没有怎么想回家的,虽然说苏州和南京的距离不是那么的远,但是中国特色的黄金周让路上挤满了人,这是我很难忍受的。
           不过还是要回去,外公身体不好,时间也不多了,多看看他。到现在还在读书,没有赚钱,也不能用物质上的东西去孝敬祖辈,只好过年过节的回家去看看他们,让他们看到我也能高兴点,毕竟老人的心情都是这样的,小辈有这个意思他们就很满足了的。
           我,现在有的,也就这个意思了,真想早点毕业,工作,结婚,也能让父母不用这样为我太操心。祖辈们也能看着我结婚,不用再为我牵挂什么了!
           努力,加油吧,为了这一根稻草上的蚂蚱,我和我的家人!