- PR -

時間帯により接続できなくなる

投稿者投稿内容
イマイ
会議室デビュー日: 2007/12/10
投稿数: 6
投稿日時: 2007-12-10 17:54
お初お目にかかります。
私は社外向けシステムのサーバ保守運用に携わっています。

現在、多数のエンドユーザがシステムへ接続できるときと
接続できないときがあるという申告があるのですが、組織の都合により
調べられる範囲が限られ、原因の切り分けが困難な状況にあります。

過去に同様の事象を経験した方がいれば教えていただきたく、
又、どこに原因である可能性が高いか皆様のご意見をいただきたく
書かせていただきました。


【ネットワーク構成】
 @    A    B     C    D    E    F    G    H
ユーザ -INT-NET - SW-HUB - RT - FW - SW-HUB - IPS - SW-HUB - SV 
                                 

@   エンドユーザの端末(端末情報は不明)
BEG スイッチングハブ
C   インターネットルータ
D   ファイアウォール
F   IPS(パケットを監視する機器らしいが規制はしていない)
H   WEBサーバ(Apache1.3)


【現在までの調査でわかったこと】

1.接続できない事象は特定のユーザではなく、日によって異なる
2.接続できない時間帯は不特定
3.接続できない時間は長くて1日、短くて数時間
4.接続できない際は他の端末でも不可
5.@ユーザはインターネットには接続可能
-----WEBサーバ調査状況------
6.HWEBサーバはバーチャルホストを設定し、接続先を分けている
  接続できない申告の際、片方の接続先のシステムはつながり(Aシステム)、
  もう片方のシステム(Bシステム)はつながらない
7.6で書いた2つのシステムについて
  (1)BシステムはFWでIP規制をしている
  (2)AシステムはHTTP BシステムはHTTPS
  (3)A,Bはディスティネーション以外同一のルート
8.接続できない申告の際、ApacheのアクセスログにはユーザのIPは無く
  アクセスされた形跡は無い(接続できるようになってからは正常に残る)
9.Apacheのエラーログには接続できない申告あった時間帯、特に変わったエラーは無い
  (全部調べたのですが、今回の事象と関連性がありそうなものは存在しませんでした。)
10.サーバのCPU、メモリは10%以下
------------------------------

11.FWではIP規制をしているが、接続できない申告のあったIPの規制はしていない


以上が私の権限で調査できる範囲で調べた結果です。
これ以上の調査は手続きが必要であり、はっきりとした
根拠がないと動いてくれないため、他の機器の情報はありません。

私の担当であるWEBサーバはアクセスログが残っていない時点で
原因ではないと考えています。

又、「一定時間接続できなくなる」といった事象を過去に経験された方がいれば
ご教授をお願いしたく存じます。

以上 長々と書かせていただきましたが、知恵をお貸しいただきたく
お願い申し上げます。


[ メッセージ編集済み 編集者: イマイ 編集日時 2007-12-12 14:35 ]

[ メッセージ編集済み 編集者: イマイ 編集日時 2007-12-12 14:37 ]
ant
ベテラン
会議室デビュー日: 2002/07/11
投稿数: 51
投稿日時: 2007-12-10 19:03
原因についてはわかりません。
エンドユーザがアクセスできない時間帯に、ローカル、または、
FWやIPSを通さない端末からアクセスできるかどうかを試してみたら
サーバの問題なのかそれ以外の問題なのか切り分けが出来るのではないでしょうか。
kata
ベテラン
会議室デビュー日: 2006/10/04
投稿数: 69
投稿日時: 2007-12-11 13:43
kataと申します。

明確なことは申し上げられませんが、
@〜Hまでの間で、
「ときどき接続できない」という現象が発生する機器がないような気もします。
ボトルネックになるとすれば、
ルータの処理や回線の帯域がおっつかないといったところもあるのではないかと思いますが。
Bフレッツなんか利用されているのであれば、
サービスを上位のものにするなどの手もあるかと。

以上、ご参考までに。
BackDoor
ぬし
会議室デビュー日: 2006/02/20
投稿数: 831
投稿日時: 2007-12-12 13:24
状況が良く判らないので、コメントしませんでしたが気が変わりました。

引用:
イマイさんの書き込み (2007-12-10 17:54) より:

現在、多数のエンドユーザがシステムへ接続できるときと
接続できないときがあるという申告がある
のですが、組織の都合により
調べられる範囲が限られ、原因の切り分けが困難な状況にあります。

過去に同様の事象を経験した方がいれば教えていただきたく、
又、どこに原因である可能性が高いか皆様のご意見をいただきたく
書かせていただきました。

7.6で書いた2つのシステムについて
  (1)BシステムはFWでIP規制をしている
  (2)AシステムはHTTP BシステムはHTTPS
  (3)A,Bはディスティネーション以外同一のルート
8.接続できない申告の際、ApacheのアクセスログにはユーザのIPは無く
  アクセスされた形跡は無い(接続できるようになってからは正常に残る)

以上が私の権限で調査できる範囲で調べた結果です。
これ以上の調査は手続きが必要であり、はっきりとした
根拠がないと動いてくれないため、他の機器の情報はありません。


私の担当であるWEBサーバはアクセスログが残っていない時点で
原因ではないと考えています。

又、「一定時間接続できなくなる」といった事象を過去に経験された方がいれば
ご教授をお願いしたく存じます。


普通に判断するとエンドユーザの申告とは「クレーム」に該当するのでは
ありませんか?
たとえ調査に手続きが必要だとしても「クレーム調査対応」で宜しいのでは
無いかと思います。

現象から判断すると規制はしていないはずのIPSしかこうした現象を
起こせる装置は思い当たりません。
→ 少なくともFWおよびIPSのログは確認する必要があることは明白だと
  思われます。

# 運用組織内に妙な軋轢があるようなら上職者に相談して対応すれば宜しいかと。
イマイ
会議室デビュー日: 2007/12/10
投稿数: 6
投稿日時: 2007-12-12 14:18
kataさん>>
ご回答ありがとうございます。
ルータはの処理速度については、同じルートを使用している
他のシステムが正常に接続できるのでその線は無いと考えております。
しかし、回線の帯域については7で書いたAシステムとBシステムの通信方式に
httpとsshの差があり、これについては調査していなかったので調査をしてみようと思います。
私はネットワークについてはあまり詳しくないので、ご意見をいただけると
非常にありがたいです。。

antさん>>
ご回答ありがとうございます。
記述に漏れがあったのですが「ユーザがアクセスできない時間帯」
と申し上げたのですが性格には「一部のユーザのみがアクセスできない時間帯」です。
他のユーザは使用できています。

アクセスログにも残っていなく、
サーバに問題があればシステム全体に影響が及ぶと思うので
サーバが原因ではない思っております。
Apacheで一部の通信が一定時間接続できなくなるといったことはあるのでしょうか・・・
なるとのの
会議室デビュー日: 2007/01/12
投稿数: 2
投稿日時: 2007-12-13 12:02
私の経験上の話なので参考になれば。

特定のPCが不定期に訳のわからないパケットを吐き出していて、一部ネットワークがダウン、と言う経験があります。
調査したところ、SWのLinkランプが激しく点滅している箇所があり、そこに原因があったと分かりました。
その時の原因はLANボードでした。
ウィルスやスパイウェア(場合にはよってはP2Pソフト)が、帯域を占有している可能性もあるのではないかと思います。
リンクランプであれば、簡単に調べられると思いますので見てみてはいかがでしょうか。
イマイ
会議室デビュー日: 2007/12/10
投稿数: 6
投稿日時: 2007-12-13 18:33
>>BackDoorさん
ご意見ありがとうございます。
IPSの方も規制はしていないと言っていますが、ログの確認をお願いするようにします。

手続きについてはBackDoorさんのおっしゃるとおりです。
しかし上職者も同じ意見であり、現時点ではそれはできないのです。。。

とりあえず現時点では事象が発生している際、通信がFWまで来ているかどうかの切り分けを行い
@〜Cに問題があるのかE〜Hに問題があるのかの切り分けの実施を予定しています。
大体システムが使用されるのが20日あたりなので、また進展がありましたら
ご報告します。
BackDoor
ぬし
会議室デビュー日: 2006/02/20
投稿数: 831
投稿日時: 2007-12-14 09:25
状況説明ありがとうございます。

引用:
イマイさんの書き込み (2007-12-13 18:33) より:

IPSの方も規制はしていないと言っていますが、ログの確認をお願いするようにします。

手続きについてはBackDoorさんのおっしゃるとおりです。
しかし上職者も同じ意見であり、現時点ではそれはできないのです。。。

とりあえず現時点では事象が発生している際、通信がFWまで来ているかどうかの切り分けを行い
@〜Cに問題があるのかE〜Hに問題があるのかの切り分けの実施を予定しています。


なんか色々と込み入った事情がありそうで大変ですね。

IPSですが結構色々と想定外のお仕事をやらかしてくれますので要注意ですよ。
# 例えばICMP(ping)に関してもIPアドレスを変更しながら応答確認するケース
# など発信元をワームと判断して数回目以降は存在しないIPアドレスからのecho
# を返し、当該通信元のアクセスを一定時間隔離する等。
# ヤマ勘ですがこの装置のログを確認すれば原因が判るような気がしています。

本当に使用していないのでしたらIPSを普通のSW-HUBに変更して状況変化を確認
する等の措置も考えられますね。

# 実際にこうしたケースでは地道に1つ1つ可能性を潰していくしか無いので
# 本来ならば運用管理者が協力し合って対応すべき問題だと思います。

スキルアップ/キャリアアップ(JOB@IT)