- - PR -
awstatsの過去データの取り込みが遅い
1
投稿者 | 投稿内容 |
---|---|
|
投稿日時: 2007-02-26 11:28
awstatsでアクセスログ解析をしようと思い、
まずは過去データを全てインポートしようとしています。 これが恐ろしく遅くて困っています。 過去データは、2004年6月1日〜昨日(日々増える)まで 1日1ファイルであります。 だいたい、1日10万レコードぐらいあります。 # awstats.pl -config=xxxx -update -logfile=/path to/access_log といった感じで取り込んでいます。 2004年6月1日〜7日分は、だいたい1、2時間/1日分で取り込めました。 8〜15日分は、だいたい3〜6時間/1日分かかりました。 16日分は10時間、17日分は16時間、18日分はとうとう1日では 終わらなくなりました。 これでは、運用を開始するまでに何年もかかるどころか、 1日分を1日で処理完了できません。 私の使い方が間違っているため、処理が遅延しているのかもしれません ので、何かお気づきの点がございましたら、ご指摘ください。 よろしくお願いいたします。 # ls -al /etc/awstats/ ---- total 204 drwxr-xr-x 2 root root 4096 Feb 16 16:55 . drwxr-xr-x 75 root root 4096 Feb 23 04:02 .. lrwxrwxrwx 1 root root 28 Feb 15 17:39 awstats.conf -> awstats.xxxx.conf -rw-r--r-- 1 root root 59599 Jan 15 17:29 awstats.localhost.localdomain.conf.bak -rw-r--r-- 1 root root 59599 Jan 15 17:29 awstats.model.conf -rw-r--r-- 1 root root 59781 Feb 16 15:21 awstats.xxxx.conf ---- # ls /var/lib/awstats/ ---- awstats022007.bak awstats022007.tmp.28789 awstats022007.tmp.4876 awstats022007.tmp.22652 awstats022007.tmp.28810 awstats022007.tmp.4897 awstats022007.tmp.22669 awstats022007.tmp.28836 awstats022007.tmp.5438 awstats022007.tmp.22687 awstats022007.tmp.2936 awstats022007.tmp.5453 awstats022007.tmp.25316 awstats022007.tmp.29409 awstats022007.tmp.5468 awstats022007.tmp.25344 awstats022007.tmp.29429 awstats022007.tmp.8072 awstats022007.tmp.25364 awstats022007.tmp.29445 awstats022007.tmp.8094 awstats022007.tmp.25379 awstats022007.tmp.2964 awstats022007.tmp.8109 awstats022007.tmp.25382 awstats022007.tmp.2983 awstats022007.tmp.8135 awstats022007.tmp.25402 awstats022007.tmp.3004 awstats022007.tmp.8156 awstats022007.tmp.25405 awstats022007.tmp.3033 awstats022007.tmp.8698 awstats022007.tmp.25420 awstats022007.tmp.32072 awstats022007.tmp.8723 awstats022007.tmp.25446 awstats022007.tmp.32100 awstats022007.tmp.8738 awstats022007.tmp.25472 awstats022007.tmp.32119 awstats022007.txt awstats022007.tmp.25928 awstats022007.tmp.32139 awstats052004.xxxx.txt awstats022007.tmp.25945 awstats022007.tmp.32168 awstats062004.xxxx.bak awstats022007.tmp.25964 awstats022007.tmp.32696 awstats062004.xxxx.tmp.25064 awstats022007.tmp.26010 awstats022007.tmp.32713 awstats062004.xxxx.tmp.25064.bis awstats022007.tmp.26026 awstats022007.tmp.32736 awstats062004.xxxx.txt awstats022007.tmp.26046 awstats022007.tmp.4813 dnscachelastupdate.txt awstats022007.tmp.28712 awstats022007.tmp.4835 dnscachelastupdate.xxxx.txt awstats022007.tmp.28768 awstats022007.tmp.4850 ---- # cat /etc/awstats/awstats.xxxx.conf ---- LogFile="gzip -d < /var/log/httpd/xxxx/access_log.%YYYY-0%MM-0%DD-0.gz |" LogType=W LogFormat = "%host %other %logname %time1 %methodurl %code %bytesd %refererquot %uaquot" LogSeparator=" " SiteDomain="xxxx" HostAliases="localhost 127.0.0.1" DNSLookup=1 DirData="/var/lib/awstats" DirCgi="/awstats" DirIcons="/awstats/icon" AllowToUpdateStatsFromBrowser=0 AllowFullYearView=2 EnableLockForUpdate=1 DNSStaticCacheFile="dnscache.txt" DNSLastUpdateCacheFile="dnscachelastupdate.txt" SkipDNSLookupFor="" AllowAccessFromWebToAuthenticatedUsersOnly=0 AllowAccessFromWebToFollowingAuthenticatedUsers="" AllowAccessFromWebToFollowingIPAddresses="" CreateDirDataIfNotExists=0 BuildHistoryFormat=text BuildReportFormat=html SaveDatabaseFilesWithPermissionsForEveryone=0 PurgeLogFile=0 ArchiveLogRecords=0 KeepBackupOfHistoricFiles=1 DefaultFile="index.html" SkipHosts="127.0.0.1 SkipUserAgents="" SkipFiles="" SkipReferrersBlackList="" OnlyHosts="" OnlyUserAgents="" OnlyFiles="" NotPageList="css js class gif jpg jpeg png bmp ico swf" ValidHTTPCodes="200 304" ValidSMTPCodes="1 250" AuthenticatedUsersNotCaseSensitive=0 URLNotCaseSensitive=0 URLWithAnchor=0 URLQuerySeparators="?;" URLWithQuery=0 URLWithQueryWithOnlyFollowingParameters="" URLWithQueryWithoutFollowingParameters="" URLReferrerWithQuery=0 WarningMessages=1 ErrorMessages="" DebugMessages=1 NbOfLinesForCorruptedLog=50 WrapperScript="" DecodeUA=0 MiscTrackerUrl="/js/awstats_misc_tracker.js" LevelForBrowsersDetection=2 LevelForOSDetection=2 LevelForRefererAnalyze=2 LevelForRobotsDetection=2 LevelForSearchEnginesDetection=2 LevelForKeywordsDetection=2 LevelForFileTypesDetection=2 LevelForWormsDetection=0 UseFramesWhenCGI=1 DetailedReportsOnNewWindows=1 Expires=3600 MaxRowsInHTMLOutput=1000 Lang="auto" DirLang="./lang" ShowMenu=1 ShowSummary=UVPHB ShowMonthStats=UVPHB ShowDaysOfMonthStats=VPHB ShowDaysOfWeekStats=PHB ShowHoursStats=PHB ShowDomainsStats=PHB ShowHostsStats=PHBL ShowAuthenticatedUsers=0 ShowRobotsStats=HBL ShowWormsStats=0 ShowEMailSenders=0 ShowEMailReceivers=0 ShowSessionsStats=1 ShowPagesStats=PBEX ShowFileTypesStats=HB ShowFileSizesStats=0 ShowOSStats=1 ShowBrowsersStats=1 ShowScreenSizeStats=0 ShowOriginStats=PH ShowKeyphrasesStats=1 ShowKeywordsStats=1 ShowMiscStats=a ShowHTTPErrorsStats=1 ShowSMTPErrorsStats=0 ShowClusterStats=0 AddDataArrayMonthStats=1 AddDataArrayShowDaysOfMonthStats=1 AddDataArrayShowDaysOfWeekStats=1 AddDataArrayShowHoursStats=1 IncludeInternalLinksInOriginSection=0 MaxNbOfDomain = 10 MinHitDomain = 1 MaxNbOfHostsShown = 10 MinHitHost = 1 MaxNbOfLoginShown = 10 MinHitLogin = 1 MaxNbOfRobotShown = 10 MinHitRobot = 1 MaxNbOfPageShown = 10 MinHitFile = 1 MaxNbOfOsShown = 10 MinHitOs = 1 MaxNbOfBrowsersShown = 10 MinHitBrowser = 1 MaxNbOfScreenSizesShown = 5 MinHitScreenSize = 1 MaxNbOfWindowSizesShown = 5 MinHitWindowSize = 1 MaxNbOfRefererShown = 10 MinHitRefer = 1 MaxNbOfKeyphrasesShown = 10 MinHitKeyphrase = 1 MaxNbOfKeywordsShown = 10 MinHitKeyword = 1 MaxNbOfEMailsShown = 20 MinHitEMail = 1 FirstDayOfWeek=0 ShowFlagLinks="" ShowLinksOnUrl=1 UseHTTPSLinkForUrl="" MaxLengthOfShownURL=64 HTMLHeadSection="" HTMLEndSection="" Logo="awstats_logo6.png" LogoLink="http://awstats.sourceforge.net" BarWidth = 260 BarHeight = 90 StyleSheet="" color_Background="FFFFFF" color_TableBGTitle="CCCCDD" color_TableTitle="000000" color_TableBG="CCCCDD" color_TableRowTitle="FFFFFF" color_TableBGRowTitle="ECECEC" color_TableBorder="ECECEC" color_text="000000" color_textpercent="606060" color_titletext="000000" color_weekend="EAEAEA" color_link="0011BB" color_hover="605040" color_u="FFAA66" color_v="F4F090" color_p="4477DD" color_h="66DDEE" color_k="2EA495" color_s="8888DD" color_e="CEC2E8" color_x="C1B2E2" LoadPlugin="geoipfree" ExtraTrackedRowsLimit=500 ---- |
|
投稿日時: 2007-03-06 10:30
うーん、スペックがもっといいマシンで読み込ませて、
/var/lib/awstats以下をコピーするとか、 ログでいらない部分を削って小さくし 読み込みを早くするとかしか ないんじゃないでしょうか。 2004年を諦めて、2006年からにするとか・・・ |
|
投稿日時: 2007-03-06 15:50
コメントありがとうございました。
すでにawstatsの運用を断念しております。 このようなページを見つけたためです。 http://www.bflets.dyndns.org/Tools/AWStatsDocs_JP/awstats_benchmark_jp.html このページによると高速化の方法が書いてあるのですが、 できうる範囲でやってみましたが、結局1日分を24時間以内に 処理できないので、諦めました。 また、100万訪問者/月の規模のサイトには 「AWStatsは適切な選択ではありません」とも書いてあります。 ご丁寧にAnalogを勧められたので、Analogを使おうと思います。 っていうか、Analogからの乗り換えだったのですが。 |
1