以前に書いたこの記事に関してコメントをもらいちょうど記事にしようかと思っていたところでしたので、ADPのキャッシュ機能を使い、この記事の実験をADPでやったらどうなるかみてみます。
　
SQLでjoin（結合）と言えばSQLに慣れた方にとっては馴染み深いものですが、初心者にとっては一種の登竜門のようで、joinを避けたコードを見かけたりすることがあります（まぁ私も十数年前にはこのような理由でjoinを避けたコードを書いた記憶があります）。また、O/Rマッパーではテーブル毎にクラスを対応させる関係で、joinの取扱がややこしかったりします。
それ以外でも、私の場合になりますが、過去にパフォーマンス上の理由からjoinを行わなかったことがあります。
今回は、前回の実験と同様に
・SQLでjoinさせる。
・ADPでjoinさせる。
でパフォーマンスの違いについていくつかの実験を行い計測します。

実験環境

JOINのパフォーマンス実験環境はこちらに記述しています。　

実験１素直にSQL側でjoinをさせたものを実行

例により、SQLで素直にjoinさせてみます。以下のようなコードになります。

,$db = "DSN=Trade"
,$str = "SELECT Price.CODE, RDATE, OPEN, CLOSE, NAME FROM Price "
        "INNER JOIN Company ON (Price.CODE = Company.CODE)"
,sql@($db,$str,[]).csv.prtn,next;

　
少しコードの説明を、
1行目の、$db=～の部分は、ODBCの接続文字列を指定します。上記のコードは、ODBCのデータソース名Tradeを指定している接続文字列になっています。
2,3行目の、$strの部分はSQL文を変数$strに代入しています。本来は1行で書けますが、wordpressで見やすいように2行で書いています。
4行目の
,sql@($db,$str,[]).csv.prtn,next;
sqlは組み込みの述語で、「ODBC-APIを使いsqlを実行し、結果を配列(@)で受け取り、csvに変換し、prtnで画面に出力し、nextで全ての結果を出力する」というコードになります。
自画自賛になりますが、必要最低限の情報だけで簡単にSQLが発行できているので、ADPの開発目標の一つである「SQLとの親和性が高い言語を目指す」を具現している例だと思います。
　
実行時間ですが、

D:\>adp -t sql_test_1.p > sql_test1.txt
time is 119192ms.

　
で、約119秒となりました。
　

実験２-Ａ ADP側でjoin(ネステッドループ）

続いて、ADP側でネステッドループjoinさせてみましょう。
　

,$db = "DSN=Trade"
,$price = "SELECT CODE,RDATE,OPEN,CLOSE FROM Price"
,$company = "SELECT NAME FROM Company WHERE CODE = ?"
,sql( $db, $price, [], @rec)
 ,sql( $db,$company, [$rec[0]], $name)
  ,csv($rec,$name).prtn,next;

　
ADPのDBライブラリは、前に紹介しましたODBCライブラリがベースになっていますので、ODBCのパラメータクエリが使えます。
5行目のコードがパラメータクエリを使っています。

実行時間ですが、

D:\>adp -t sql_test_2.p > sql_test2.txt
time is 1717284ms.

　
で、約1717秒となりました。実験１と比べて約14倍の実行時間です。
　

実験２-Ｂ ADP側でjoin(ネステッドループ＆キャッシュ）

さらに続いて、ネステッドループjoinをADPのキャッシュ機能を使って高速化をはかります。
　

,$db = "DSN=Trade"
,$price = "SELECT CODE,RDATE,OPEN,CLOSE FROM Price"
,$company = "SELECT NAME FROM Company WHERE CODE = ?"
,sql( $db, $price, [], @rec)
 ,sql$( $db,$company, [$rec[0]], $name)
  ,csv($rec,$name).prtn,next;

　
呼び出し述語名の後ろに$をつければキャッシュ機能がONになります。上記のコードでは5行目の sql$ がキャッシュ機能を使用しています。
では、実行時間をみてみましょう。
　

D:\>adp -t sql_test_2.p > sql_test2.txt
time is 116770ms.

　
で、約117秒となりました。
実験２－Aと比べるとかなり高速化がはかられたかと思います。キャッシュのこのような使い方は、かなり有効だとうことが解るかと思います。繰り返しになりますが、ADPならお手軽にキャッシュ機能を使うことができます。

実験３ ADP側でjoin(事前にマップ作成）

ちなみに、ADPでも事前にマップを作成し、joinを行うことができます。
以下、コード例です。

,$db = "DSN=Trade"
,@tbl = {}
,sql($db, "SELECT CODE,NAME FROM Company",[], @r)
 ,@tbl = @tbl + [ $r["CODE"] | $r["NAME"] ]
 ,next
,sql($db, "SELECT CODE,RDATE,OPEN,CLOSE FROM Price",[],@rec)
 ,$key == $rec["CODE"].str
 ,csv($rec,$tbl[$key]).printn,next;

　
前回の記事ではC++でハッシュjoinを行うと書いたので『ハッシュJOINを言語で再開発するのは非効率』とコメントをもらいました。
コードを良く読んで頂ければ解るかと思いますが、実はC++の例でもjoin自体はプログラミング言語（ライブラリ）の機能を使っており、取り立てて複雑なことはしていません。　
やっていることを説明しますと、マスターテーブル用のマップを事前に作成し、それを使ってjoinを行っています。慣れていない人にとっては難しいかもしれませんが、古くはperlの連想記憶、最近（これも古いが）の例ではVBScriptのディクショナリに相当します。DBMSを使わないで日常的にファイル処理を行っている方にとっては日常的なコードかと思います。
　
ちなみに、ADPのコード例ですが非常にすっきりとしているかと思います。C++の例と比べると本来やろうとしていることが明確になっているかと思います。
実行時間は、
　

D:\>adp -t sql_test_3.p > test3.txt
time is 110988ms.

　
で、約111秒とやはり実験１より速くなっていることが解ります。
こうしてみると、実験２-Ｂが思いのほか速くなっていないと思わるでしょう。
これはSQLの実行回数に関係しています。
　
各実験のSQLの実行回数を見てみましょう。

SQLの実行回数
実験１	1回
実験２－Ａ	約470万回（Priceテーブルの行数+1）
実験２－Ｂ	約2000回（Companyテーブルの行数+1）
実験３	2回

　
になります。実験２のコードではテーブルの行数に比例した数だけSQLを実行することになります。実験２－Ｂが実験２－Ａより速いのは、Priceテーブルの行数よりComapnyテーブルの行数が圧倒的に少ないから、つまり1対nの結合を行っているからで、仮に1対1の結合では速くならないということになります。
　
実験３がなぜ実験１より速いかですが、DBMS側から転送されるデータ量が違います。
以下、CSVファイルの先頭5行を表示します。
　

1717,2005-05-10 00:00:00.000,21251,3522,明豊ファシリティワークス(株)
1717,2005-05-11 00:00:00.000,21251,3522,明豊ファシリティワークス(株)
1717,2005-05-12 00:00:00.000,21251,3522,明豊ファシリティワークス(株)
1717,2005-05-13 00:00:00.000,21251,3522,明豊ファシリティワークス(株)
1717,2005-05-16 00:00:00.000,21251,3522,明豊ファシリティワークス(株)

　
企業名の『明豊ファシリティワークス(株)』が重複して余分なデータとなっています。実験１のコードではDBMSから言語側にこのように重複したデータが来ます。各実験で転送されるデータ量を見てみましょう。
　

結果データの転送量(CSVファイルベース)
実験１	約256MB
実験２－Ａ	約256MB
実験２－Ｂ	約184MB
実験３	約184MB

　
実は、DBMSから言語側へ転送されるデータ量自体は、実験１より実験２－Ｂの方が少なくなります。そのような関係で、実験１より実験２の方が早くなっています。SQLの実行回数（実験１の方がよい）とデータ転送量（実験２の方がよい）になりますが、このあたりはハードウェアの環境やDBMSによって結果が変わってくるでしょう。
この２つのデータから実験３は、なるべく少ないSQLの実行回数で少ないデータ量を転送しているということが解るかと思います。

追記：コメント欄での指摘およびテスト再現性を考慮してテスト環境を整備して再度計測しています。

SQLのパフォーマンスについて（まとめページ）2011

2011-02-01 | コメント:0件

Windows2008R2 DNSサーバーで逆引きができない（イベントＩＤ：5504）

しつこくWindows2008R2ネタですが、覚書ということで、
Windows2008R2に付属のDNSサーバーで、IPアドレスの一部が逆引きができずにイベントビューアーにID:5504が記録されました。また一部で逆引きが通ったりするので厄介でした。　

いろいろ探しましたが、結局以下のページ
Forum FAQ: How to troubleshoot DNS Event 5504 error の4番目の解決策の
　
dnscmd /Config /EnableEDnsProbes 0
　
でOKでした。
ネットを探すと他にも、
DNS event 5504 - server encountered an invalid domain name in a packet というのがあったのですが、このページにあるShilpesh Desai MSFTさんの『Accordig to KB 198410, it should have non-zero value.　－ KB198410によるとこのレジストリの値を0以外にする。』に対して、Jharris1993さんが
『Huh? Did you read the KB article? (head in hands, shaking head in wonder)　－はぁ、ちゃんとKB読んだ？』
『The correct statement is: According to KB-198410, it should have a zero value if the key exists.　－正しくは：KB198410によるとキーが存在するときはこのレジストリの値を0にする。』
とShilpesh Desai MSFTさんをバカにしていますが、私もKBを読みましたが、Shilpesh Desai MSFTさんの説明は、間違いではないでしょう。なぜなら通常はこのレジストリキーは存在せず、その場合、値zeroと解釈されるので、トラブルシュートを行うならzero以外の値にすべきでしょう。もっともそれでトラブルが解決するとも思えなかったのでこの方法は試しませんでしたが・・・

2011-01-28 | コメント:0件

IIS7.5でクラシックASPの拡張子をASP以外にする

さらにWindowsネタが続きますが、まぁ覚書ということで。
IIS6（Windows2003）では、マッピングを追加すれば、クラッシクASP（VBScriptで記述するASP）のファイル拡張子をasp以外（例えばcgiとか）にすることができましたが、Windows2008R2に付属のIIS7.5でかつアプリケーションプールを32ビットで動作させた場合、単純なハンドラの追加以外にちょっとしたひと手間が必要になります。

（１）ハンドラの追加
ハンドラーマッピング『管理ツールから、役割→Webサーバー（IIS)→インターネットインフォメーションサービス（IIS)マネージャ』から、『サーバー名→サイト→WEBサイト名』で、右ペイン『（機能ビュー→）ハンドラーマッピング』でASPClassicと同様にハンドラを追加します。
ここまでは普通の手順になります。
　

　
（２）preCondition設定
続いて、同機能ビューから『構成エディタ』を起動します。構成エディタ画面の『セクション→system.webServer/hander』で『コレクション』の行にあるボタンをクリックします。
上のペインで、追加したハンドラを選択し、下のペインにあるpreCondition設定の値を空欄にします（bitness64を削除します）。
　

2011-01-27 | コメント:0件

Windows2008R2ではNTBACKUPでバックアップできないらしい

ここしばらく、Windowsネタが続きますが、サーバー移行の覚書ということで。
Windows2008(R2) では、NTBACKUPからWindows Server Backupというソフトに置き代わり、バックアップの使い方もかなり変わったのですが、昔のNTBACKUPを使いたいとう欲求に駆られるでしょう。私もその一人だったのですが、残念ながらNTBACKUPを使うことができませんでした。
ちなみに、リストアのみでしたらリストア用のNTBACKUPがダウンロードできるので使えます。ただ、R2の方はインストールにはまるかと思います。以下のサイトをご参考に、
NTBackupバックアップファイルをWS2008 & R2で復元　
上記サイトのリンク先Running NT Backup under Windows 7にありましたが、Windows2003からNTBACKUP.EXEを持ってきてNTBACKUPをバックアップとして使う方法を試してみましたが、Windows 2008 R2ではNTBACKUPでバックアップはできないようです。以下試したことを列挙します。

Windows 7 64ビット版では動作した（Windows 2003SP2 32ビット版のNTBACKUP使用）。
Windows 2008 R2では、「シャドーコピーを使ってバックアップを準備中」で止まる。イベントビューアにVSSのエラーが出力される。
Windows 2003SP2 32ビット版のNTBACKUPの場合、イベントID：20(ボリュームシャドウコピーサービスエラー: ボリュームシャドウコピーインフラストラクチャをセーフモードで使用することはできません。)、8193(ボリュームシャドウコピーサービスエラー: ルーチン CoCreateInstance の呼び出し中に予期しないエラーが発生しました。hr = 0x80040154)が出力される。
Windows 2003SP2 64ビット版のNTBACKUPの場合、イベントID：8205(ボリュームシャドウコピーサービスエラー: IVssCoordinator から IVssShim に QueryInterface を呼び出している最中にエラーが発生しました。hr = 0x80004002。)が出力される。Running NT Backup under Windows 7でも同様のエラーが出た人がいるようで、質問している人がいましたが返答はありませんでした。
ダメ元で、http://support.microsoft.com/kb/940032/jaを試してみたが、やはりダメだった。
Windows 7 x64でNTBACKUPが動作していたので、Windos 7にインストールしていたアプリ（Visual Stduio 2010、SQL Server 2005、を入れてみたがダメ

　
日本では嵌ったという方がいらっしゃらないようなので報告まで。　
私の場合は、結局NTBACKUPを使うのをあきらめてWindows Server Backupを使うようにしました。

2011-01-26 | コメント:2件

Windows 7 SP1 がOEMへプレリリースされたらしい

Windows7続きの記事です。
Windows7がらみのトラブル（kernel-power41病）を調べようとWindows 7 Forumsをみましたら、Windows 7 Service Pack 1 (SP1) Download Availableとありましたので、リンクを読みましたところ、OEM向けに最終バージョンがリリースされたとのことです。Windows Server 2008 R2のSP1も含まれているそうです。
　
上のURLからはSP1がダウンロードできるようですが、記事によるとリリースが差し迫っているそうなので、マイクロソフト社から正式にリリースが出てからインストールした方がよいでしょう。

2011-01-25 | コメント:2件

Previous Page | Next Page

システムアーキテクト通訳案内士のブログ

[ADP開発日誌]SQL（JOIN）の実行パフォーマンスについて２０１１

実験環境

実験１素直にSQL側でjoinをさせたものを実行

実験２-Ａ ADP側でjoin(ネステッドループ）

実験２-Ｂ ADP側でjoin(ネステッドループ＆キャッシュ）

実験３ ADP側でjoin(事前にマップ作成）

Windows2008R2 DNSサーバーで逆引きができない（イベントＩＤ：5504）

IIS7.5でクラシックASPの拡張子をASP以外にする

Windows2008R2ではNTBACKUPでバックアップできないらしい

Windows 7 SP1 がOEMへプレリリースされたらしい

リンク

ページ

コメント

アーカイブ

カテゴリー

システムアーキテクト通訳案内士のブログ

[ADP開発日誌]SQL（JOIN）の実行パフォーマンスについて２０１１

実験環境

実験１ 素直にSQL側でjoinをさせたものを実行

実験２-Ａ ADP側でjoin(ネステッドループ）

実験２-Ｂ ADP側でjoin(ネステッドループ＆キャッシュ）

実験３ ADP側でjoin(事前にマップ作成）

Windows2008R2 DNSサーバーで逆引きができない（イベントＩＤ：5504）

IIS7.5でクラシックASPの拡張子をASP以外にする

Windows2008R2ではNTBACKUPでバックアップできないらしい

Windows 7 SP1 がOEMへプレリリースされたらしい

リンク

ページ

コメント

アーカイブ

カテゴリー

実験１素直にSQL側でjoinをさせたものを実行