IT技術工作日志: 2005-06-12-³n¥ó¥@¬Éªº¤ûj

星期六, 6月 18, 2005

探討Googel廣告，XML集合沒有必要性？

由於IE出錯，實際上沒有完成真實的刷新，換言之，ALEXA這兩天沒有受到刷新的壓力。使用計數可以剔除搜索引擎的影響因素，因此可以階段性地用到主網上——但是需要使用另一個ID,以及用到其他的地方，象博客，花的功夫不會太多。而多人看的不妨拿出去，少人看的部分嘛，就拿回來。今天早上沒有豬豬的影響，但仍是六點就醒了，衹睡了六個小時。

昨天廣告界面倒是刷新了三千次之多，顯然，這間合法的，因為沒有進行點擊。而事寮上，我的用意是通過這個做法提高點擊的效益，但是問題隨之出現：廣告沒有再在這臺機上出現了。原因是什麼？我已經把cokkie什麼的刪除了，也重啟過撥號器，按理說地址已經改變，為什麼仍是沒能顯示呢？事實上，目前在提高點擊率的更前一級，還有一個努就是提高廣告的有效顯示率。當然，今天是無所謂的，已經有幾千個翻頁，足夠了，問題衹是為什麼它沒有按IP地址的改變再重新出現？

那個頁面的免費計數器看來衹是體現為一種視覺上的連接，連反向連接都不能算。而對於提供商來說，似乎就是為了給自已的網站提高一點點擊量，當然，還有幾個單詞，記我刪除了。使用99申請的Googgle帳號是快快的就拿到手了，真是快！這樣就讓我花了小半個下午去整理蒙記，我怕涼乾了，而自把幾個博客重新派到象臺灣香港後，訪問量馬上大量增加，的確是有作用的。我打算把醫學和性方面的內容使用這個廣告帳號發出去，在多了一個帳號後就減少了由於反復操作造成封殺的可能性了。另一方面，也可以把敏感的內容相應隔離開來。

中午的時侯由於計數器和新的帳號的原因變成重整，中斷了動態主頁的開發；現在要重新開始了，記得中斷原因是由於要考慮那個標貼是從數據庫讀出所造成的負載問題。如同上面所說，section從數據庫讀出已經是一個重負載，我打算把它消除掉，如果標簽是也是從數據庫中負載每頁使用的話，的確也是一個更大的負擔。目前的設想應該是使用對象引用記錄，在初始化這個網站對象的時侯同時訪問一次數據庫（也就是兩次了，一次是網站本身，而另一次就是標簽自已）以後整頁就在這個網頁對象中轉悠。

解決的方案大約有三個：
其一，是使用象原來的SectionBase的解決方案；其次是連同Database作為一個解決方案，換言之，所有的東西都塞進一個哈希表中，並有一個計時進程定時地把超過指定時間沒有訪問的值扔出去；如果新訪問的值沒有，就從數據庫中讀出來擺進哈希表中，目前的Database實際上就是這樣的東西；
另一個辦法就是把文件定時寫到（發布到）目錄靜態文件，這樣做的壞處是既不能發達到主目錄中，否則會太大，這樣jsp就很難操作；如果由tomcat以外的程序解釋，對於它的解釋就非常困難，比較現實的方法是使用httpClient一個個地訪問頁面轉換成靜態。這套方法如果處理少數頁面沒有什麼不妥，但是如果大規模轉換，就會遇到上面的問題，復雜性成十倍地增加；
第三種方案就是寫成一批的屬性文件或者xml，然後在訪問的時侯讀取相應的項值。struts中的locals多語言版本就是這樣的操作方案，而實際上使用xml用到這這種地方就最蠢了，xml要麼不大，一次性parse後就常駐內存，要麼比使用數據庫還要消耗資源。事實，我目前所知的最耗費資源的操作就是parsexml文件，這還是在使用digester/sax這樣的輕量級解釋方案，如果使用jdom之類，資源的損耗就更大得驚人，用到網站這樣高流量的地方，真是不想讓人活了！

所以決定使用第一種方案。Googgle花了我不少時間，效率因之降低了許多。Google的服務顯然並沒有中斷，但是在這裡就是訪問不了；顯然是給共產黨的蓋世太保給封了，估計也不是為了什麼三個代表，八成是由於共黨持有部分國內搜索引擎的主要收益，明知技術鬥不過Googgle，讓Google進貢人家不理是，也就衹能使出如此下招了。——如果有朝一天統一臺灣，看准了吧，一樣會把臺灣當肥鵝剝削精光爛窮的，否則無論如何體現不出三個代表的先進性的。

XML集合屬性看來需要重新地修正了，原因不是由於實現不了原有的設想，而是發現原有設想可以更簡單地實現——換言之，到目前還沒有發現非要使用xml實現的地方。這已經是第二次了。看來這不是偶然的，XML集合屬性看來沒有存在的必要的。時間太晚了，不能再做下去，衹可以把一些代碼收收尾上載到服務器上，以便明天可以多少交交差。

星期五, 6月 17, 2005

動態主頁，收拾廣告，計數器，漢字編輯亂亂的困擾

這個編輯器拿到IE下面就不好用！看來也沒有其他辦法的，衹能是向其中一個瀏覽器，通過再一次刷新向系統傳遞客戶方使用的瀏覽器類型，決定使用那一段的代碼。盡管今天早上仍是早早醒了，但是豬豬不在旁邊蹬著，睡得沈得多了，今晚仍不能和豬豬睡，原則上是不和豬豬睡，她上床我就下床睡地板好。但是從代理到廣告到博客都花了不少時間，找到了一段計數器，可以用到那個博客，在博客上看來也不要寫得太露骨，點到即止，衹需要提示存在這樣的關系即可。否則就會流於與其他類似的形式了。

偷這幾個網頁花了不少時間，除了考慮後臺用例外，它使用div也令偷的難道加大的原因，而且怪就怪在這幾個界面在firefox很好用，但是在ie下面看，卻不是怎麼樣的。這個動態網站與blogger的個人管理還不一樣。網站本身的設置比個人信息設置要復雜得多，反而是提醒了也需要一個個人的信息設置了，假如它不是到總網管理個人信息的話。

修整菜單的其中一個目的是為了適應firefox瀏覽器。現在看來，兩層以上下拉菜單不適於在前臺使用，但適合在後臺操作。同時兩維菜單很難適應不同的瀏覽器，即使是用手工也不易完全一致，更談不上自動出現了。唯一的辦法就是轉換成多級的平面菜單。

一直以來相當活躍的巴林代理昨天起不知為什麼的全盤失效了。實際上對於廣告展示數目不穩不用擔心的，因為中間還有一個變數就是服務器那裡是不是把廣告調了出來？看來，googel調廣告也不是完全一有就調，而是參照性的，其中pr的作用非常大，如果pr高，那麼每次總是有廣告出，如果有人在那頁點擊過，它也會把類似的廣告調出來。

目前比迷惑的地方是網站管理上的用例還沒有作出來，所以有什麼因素還太明了。大致地可以認為有：
帳號管理；
模板管理；
網站基本特性的管理；
訪問統計等等；

當進入到界面部分的時侯，實際上，中文編碼的問題已經開始困擾著我了。其中的一個原因是由於Ultraedit帶了中文字體適應的功能而沒有在菜單上明顯地表現出來。所以我也沒有察覺其中的不同，但是editplus就表現出明顯的文本上有編碼的存在。而且html顯示出了正常的中文編碼，但是變成jsp後，編碼經過tomcat解釋，又重新陷入混亂。顯然，這和我已經習慣了的文本就是最基本的記錄有衝突——文體本身仍是具備編碼轉換。這倒也是，在java中不就有這樣的轉換命令了嗎？還有一個微軟提供的編碼轉換工具，一直不知它怎麼用，其實恐怕就是由於給編輯器自已轉換了所以看不出來；便用它來嘗試轉換一個昨天碰到的文件，卻是一堆蓋茨自已也認不出來的垃圾。

這個問題困擾的地方就是如果我要提供多語言版本的話，那麼這麼多環節上的語言如何適應呢？如果真要另外弄一個文件然後再調用就麻煩透頂了，不過現在還不到傷傷腦筋的時侯，還有更急的事情呢！而硬著頭皮了解那個工具欄的用法，居然發現還是挺用用處的，至少象色彩現在可以弄得豐富點了。

進入到global文件，對於總網屬性又令我重新進行了一次審視：每次刷新都要訪問一次數據庫獲得一個實際上是極少變化的數值是不合適的，應該將這個實體屬性去掉，它衹應該從一個常駐對象中讀出——甚至從一個xml中對讀也是好的。顯然，有些文件很大不宜放到這個地方，因此，最終最好的辦法是發布到目錄中；各個科室也是如此，而小短對象則應該做到一個公共的集合表，直接訪問，當初的sectionbase就是這樣的用處，實際上是有存在的道理的，在下一步就把它恢復過來。這個操作可以把系統特別是數據庫的負擔減少至少一半以上。

從實際上的使用上看，由於圖片路徑是與css路徑相關而不是與文件本身的路徑相關，這樣反而不需要特別考慮它的路徑，這是使用div/css形式的一個好處。但也意味著幾乎是每一個頁面要維護著一套css，到底是不是更方便了真是難說，而對一批人來說，提供了更大的分工方案倒是非常現實的。
一個博客贏利方式的站點；
http://www.creative-weblogging.com/50226711/advertising_with_creative_weblogging.php

看到一個流量統計的東東，免費？但好象還是滿好用的。拿來做個實驗，不過blogspot是不用看的，估計也沒有什麼人看的，那個M版甚至一個人也沒有去看呢！其他幾個博客都是有統計的，所以也無多大所謂。不知主網IP不同時它是否能夠識別，它用的是地址，那麼還要解釋才能對照。它如何贏利？它的程序很簡單，其實我還打算也做一個呢，但是技術水平可能不算高，這條還不清楚，因為如果它直接更新數據庫記錄的話，而不使用消息系統，那麼系統很快就會崩的。至於它如何營利，總不會是為了出一個計算標簽連接，這沒有什麼意義。我相信，它可以提供基礎的統計數據供諮詢者營利，或者當你使用得差不多了，就向使用者收錢——這的確是一條路，如果已經完成了那個消息統計系統，其實是有打算這麼來做一次的。現在，顯然我可以把它連到我的博客上以此統計實際的流量人數。桌面電腦再一次突然耗盡所有的內存，顯然仍是直接是netscape.

從網景起，怪事連連難以招架：先是UltraEdit的漢字打成亂碼無論如何都改不過來，仍然是找不到什麼地方可以設定它的編碼，最後不知鼓搗了什麼地方好了；然後是更奇怪的事情：重寫後的html/jsp可以訪問，而直接訪問jsp路徑就報文件不存在。我實在找不到合理的解釋。最後發現帥於沒能上下文路徑，因此在html條件下由於重新改寫路徑而成功顯示，而當jsp時就找不到路徑，這也提示了一個掩藏上下文路徑的簡單的方法。

星期四, 6月 16, 2005

搜索引擎機器人，adsword廣告，“偷”後臺界面

老婆大人總是捨不得把豬豬送到小床上睡，昨天又把她帶上大床，結果我再次是衹睡了半夜的覺，精神再次差得非常。看來，如果豬豬再到我們的床上睡的放話，我就衹好睡地上了。早上給豬豬弄醒了，她睡覺時不但風車一樣轉，而且還間隔性蹬腿，這樣一來在她旁邊睡是不可能睡得穩的。早上六點鍾給豬豬弄醒了，擺弄了一下電腦，然後就在書房再睡了一小覺到8點，總算好一點。但剛開始操作時，敲鍵盤沒有反應，但單獨輸入鍵卻是好的，擺弄了差不多一個小時，總算確認是鍵盤的故障，這個鍵盤就扔了算啦。

昨天的搜索引擎的訪問數量是高估了一點，實際舊每一次訪問會有兩次也許是三次的日志記錄，會話綁定前後就各一次，所以實際的量應該是在二分一以下。而實際上前天的量比例更大。昨晚上碰到更怪的情況，似乎是會話衹綁定不解除，開始以為是由於訪問壓力很重，但到早上的記錄已經達到了5000多，這就說明是 tomcat出了問題了。

上午本想布署一個使用代理服務訪問的環境，卻莫名其妙地花了一個多小時，代理服務並不可靠；另外一點時間是給鍵盤拖累了。有幾個代理服務器表面上看來好象挺快，但是常常是點幾下後就通通不行了。所以就特別的花費時間。組織幾個可靠的代理服務器還是有必要的，辦法就是試用一段時間，如果OK就作記錄。其實那個 blogcn也是夠臭的，居然無法進行登陸了。看樣子也是會話丟失的毛病，看來中國這幾個博客多多少少都有些不可忍受的毛病。測試代理服務器的辦法就是使用NC打開一段時間自動刷新。我估計目前使用NC的人已經很少了，所以反而顯得比較地安全。

先睡個覺，回頭幹正事。

再次研究Googgle的廣告數據，發現它有著計數修正的功能，大致上，如果有一個頻道的日常顯示比較少，那麼偶然性的點擊給的錢就比較少，相反，如果顯示的次數比較多，那麼一次點擊的收入也比較高。這種算法是相當智能的：這就是說散布在非重點網頁的界面即使有點擊，收入也會比較低，因此，如果要提高點擊的效率，不仿先想辦法把相應界面的顯示數造上去。所以實際上造數不僅僅包括點擊，相應，這是效率比較低的一種：保證有一定數量的展示是加重點擊權重的重要因數，而且與自已點擊相比，根本不能算作是作弊。第二個才是點擊，而還有第三個，就是要保持有一定的收入和點擊數，這是對Googgle提示的帳號有效性，這個數不能造得太多，目的是保持自然平穩而不是真的要增加數量，點擊比例一般專業性網站是百分一，非專業性的是千分之一左右，因此把內容組織得專業點可以提高點擊的效率。

事實上，這也並不容易。因為很多時侯，根本就沒有顯示出相應的廣告內容。那個blogcn到下午才恢複正常，打算去上弄一弄它，不過地是有點糊塗了，到底拿它幹什?用呢？目前非常顯然的是，海外的原則上用作繁體而不使用簡體，目的一是吸引海外的讀者，二是對國內的文章作一個備份。而海外目前可用的站點就是兩個，各有限制，還沒有更好的解決方案，恐怕也其他盡管還有一些博客，都會同樣地左卡右卡的。國內的blogchina是主力站點，它的配置水平及不上 blogcn，速度也真是慢。而blogcn也有它的問題，象今天一整天出不來等等。技術型的當然集中到了csdn，那個站點的訪問性能比較臭。我想，象 wartek.blogdriver之類的也不准備再加了，一切以可以發放廣告和訪問方便為准繩。已有的不再轉移，而新開的欄目可以優先考慮 blogcn，因為它的模板可設置性遠遠超過了blogchina.

確認提高顯示次數比自行點擊更有效也更安全後，那麼提高計數的辦法就是使用一個專門的代理服務器的自動刷新頁面了。而在目前的幾個代理服務器中，不少實際上是用不了的。這件事情一直到下午才最後清晰起來。上一封達斯韋德申請的Googel帳號，本來是有很大把握的，但是把它放給英語，結果卻是連泡也沒有冒起一個來。說真的，或者對方根本上就是按地區劃分的，我的收款地址是中國，這是無法更改的。有這一條，衹怕人家也衹會把中國的低值內容給我送來。使用中國價值爭取高值市場的設想可能無法實施的。我留意到上一次申請時並沒有驗證網址，所以這次把99拿上去，看看結果如何，如果還是不行，就要試著改改地址了。

下面是要增加一個菜單，不過我還沒有想清楚需要一個什麼樣的菜單呢！結果順便把ysw的菜單整理了一下。

今天花的時間裡其實代理服務器的收集測驗花了不少時間的。而應付高的無病呻吟也花了我不少的時間。

使用Google的廣告十天後的觀感和博客的錢途

對於Googel的廣告好奇心正在逐漸消退，隨著了解的深入，對於Googel的廣告所能達到的一些作用也開始有更准確的認謖。

在申請Googel廣告的時侯，目前是這樣的：
1）了解有多少人關心我的文章知識，假定是可以通過互聯網的關鍵字搜索到而不是通過自已做廣告的話；原設想這可以通過廣告的顯示次數進行估計；
2）點擊廣告是多少？
3）具體那個站點的點擊計數是多少？這其實是把Google降格成了一個計數器；
4）整理一下知識，把網上日記從亂七八糟的自已記錄變成有潛在價值的資料庫；當然，最敏感的部分沒有放上來；
5）順便看看可以帶來多少收入。
6）了解一下是什麼人做廣告，以及對廣告的受者心理是什麼？

老實說到目前的廣告點擊有一多半是我自已點的，目的不在於錢，才幾個錢算什麼呀！一來是好奇，的確想看看到底是什麼人賣廣告，主要是Google匹配廣告的邏輯是什麼。二來是聲明一下存在，免得Google到時把俺給砍了，一聲Sorry就讓我回家去。我估計Google也不會在這個地方給我計較幾個美元的出入，反正羊毛出在羊身上，用不著Google自已掏錢的。從adsword的用戶信息看，有追蹤效果，但是沒有明確給出是誰誰那個網站放過的，看來， Google是把解釋權放在自已手上，避免有不必要的爭吵。

但實際效果並不完全如意。
第一；無法了解到實際上的pageview 是多少，原因有兩個，adsense的頻道是網頁地址而不是網站，所以除了這個網頁地址外其他的網頁它統統統計不了；其次，它不是每次都顯示的，甚至不清楚它顯示的比例是多少。但看得出，它是根據一個緩存中的ID顯示的，每一個ID顯示的量非常有限，所以會出現如果在一個地址長時間訪問自已站點的話，根本看不到Google廣告的出現，這是為了提供廣告的實施質量，是有道理的，不過放置廣告就不能准確知道視覺效果了。其實，這裡可以使用一個開關讓調式更方便一點；

第二；收入是多少？就本人來說，如果不是試著這個adsense廣告，大部分情況下是對廣告自動視覺過濾，根本就從來沒有點過人家的廣告。不過，自從有了 adsense廣告後，由於對它興趣濃厚了，倒也覺得其中有很多廣告其實是蠻有意思的。所以我點擊這些廣告後，也不是一走了之，大部分情況下是會真的進去試一試，實際上，這個廣告變相讓我了解其他網站的運作形式。但就客觀的評估而言，單純的博客內容，難以吸引長期的穩定的收入，除非是一些特殊的成本之類的內容。但如何把它與廣告結合令用者和廣告消費者感興趣，還沒有多少idear。總之，如果沒有進一步的組織措施，希望博客文章有穩定的收入，是不太不現實的。我的博客量算是大的，我算了一下，就算全部掛上廣告（衹要托管站不是非要自作聰明的卡住的話，一般都可以放上廣告內容），一天有一美元就很不錯了。而達到這個收入所花的時間用到正事上，我看至少可以賺10美元。可見，這事情衹能是幹正事時bytheway，而不能當真作為一個工作收入。

第三；作為廣告的發布商即消費者，比較愚蠢的是對非直接營收的部分發廣告，換言之僅為知名度發Googel廣告。這是我對受者心理的看法。這和電視、報紙等不同，網絡的特點是短粗直接，廣告接受後可以直接進行消費，至少是消費預演。因此，如果發布者的消費部分未搞好，使用Google廣告的效果令人懷疑；而作為提供知名度來看，成本就偏高了。因此，出於點擊目的或消費目的的廣告包括跟蹤，adsense還有業務上需要提高的空間。

就收入來說，中國國內的消費水平很低，基本上廣告發布少，點擊收入低；大概衹有海外的五分一到十分一。因此，如果把內容發布成英語或者繁體，可以相應地提供收入百分比。在blogpot上一個海外的點擊就曾經給我帶來0.4美元的收入，而國內甚至看到10次點擊，才區區0.2美元，差距明顯。最後，如果 Googgle找不到合適的內容放到發布者的內容欄目，也就無所謂廣告收入了，因此，用詞最後用得規範點，這樣Googgle可以比較容易地找到相關的廣告內容，不然，就淨是出些太陽離地球有多遠的無深入廣告，甚至乾脆隱了形。

這十天的試用還令我對於博客的營收設想有了修正：僅憑博客內容難以獲得可持續的收入，由博客自已經營尚且如此，那麼就博客托管商自已組織來為這些從這些博客內容出廣告贏取收入，衹怕投入永遠比產出多。反過來，如果博客自已沒有收入，也完全沒有必要長時間花錢供養博客網站！因此，解決方案似乎衹能是博客網站要進一步放權幫助博客建立起自已的發布中心，幫助博客賺錢，而不是搞些花梢玩意，象博客中國什麼博客秀之類的，簡直就是白癡。因為它把博客當成白癡了，居然把QQ那些大不透的小兒行為也搬到博客上來。

星期三, 6月 15, 2005

搜索機哭人的麻煩，“偷”blogger的界面

老婆始終不願意讓豬豬單獨睡小床，怕給豬豬弄醒，所以睡到了地上，即使是如此，感覺也比前幾晚好得多了，睡得深了，但仍給豬豬間斷性的器鬧弄醒，早上六點半就起床了實在再也睡不下去了。

昨晚上實際上拖到很晚的時侯dep才恢復正常，這就讓我不敢輕易地對萬維服務器進行昇級了。
在連接運行到60個小時後，萬維服務器的內存也沒有很好地得到釋放，出現了outofmemory的反應，而實際上負載並不多。這不知是意外還是意料之內了，原來衹是打算看看主頁對象，但搞錯了服務器，卻發現萬維上不正常，隨後發現有記錄是內存溢出；反正已經改了不少的dep，於是決定昇級到萬維；但是昇級完畢後，發現仍有不穩定，特別是，許多文章欄不見，由於已經全部昇級，連對照的版本也沒有，決定重新用回老的版本，而更新dao和相應的classes 目錄。……最後發現，是虛驚一場。但是，即使是從萬維早上溢出看，原因也是極度不明的。因為當時沒有修改過文件，也沒有很大的負載量，原因的確不明；唯一的可解釋的地方就是由於數據結構修改與CLASS不同，可能造成大量的錯誤溢出。

目前存在著兩種選擇，其一是弱改寫而強目錄；其二是強改寫，弱目錄。目前使用後者看來有點困難，很難做到百分百的匹配它的目錄和文件，如果要看起來象是一個獨立的文件目錄就更不容易，看來，既然已經要修改它的重寫文件，不如改用強目錄。目前的科室同樣是使用強目錄，這樣就需要通過系統腳本生成和刪除所涉及到的目錄了。

午飯前的一點時間收集了一點代理服務器，近來有點奇怪的是大陸的代理服務器越來越難收集了，其他地方的菜機反而是越來越多。還在用餐時高就來了電話，說專科操作不起來，我再看看吧。非常明顯地，無論如何總是很難從目錄結構中得到充分的信息，所以既然已經使用系統腳本維護，那就需要生成一個global的文件放置這些信息，對於一個複雜的站點，這個信息文件還是有必要的。

本來對Googgle想寫一份總結性的隨筆，但結果成了一篇文章，花了一點時間再貼出去。下面是做一個彈出的登錄窗口，這個很簡單，不過隨後打算“順手”為論壇加上Googgle廣告條，卻花了點時間，由於看不到出現的效果，顯得搞起來頗為勉強。

再下面是搞妥那個後臺管理。結果花了一大堆時間“偷blogger的後臺界面”，因為我喜歡。界面組織其寮也並不是我的弱項，實際上，由於我的建模演算能力很強，所以用例都很有針對性，較之一般的“好看”明顯高出一籌。衹不過我覺得把時間花在這些地方好象不太值，另一方面，我本身比較傾向內容驅動，非界面花梢的原則——事實上我認為對於網站這樣缺乏忠實消費者的場所，界面越花梢，消費者的注意力越是分散，越是不會在這個網站消費。但由於高等人不配合，與其左等右等出不來合用的界面，不如我自已直接采納好了。而最簡單的就是把合用的東西直接偷過來，改成自已的東西。

Blogger的界面幾乎全部使用div/css編制，普通的另存為一點作用也沒有，害得我花了好久時間才把它的圖片一一弄下來——圖片是我真正的弱項，我現在還不會用PS。曾經有爭論說table的濫用，但我覺得table沒有什麼不好用的，衹要注意不要整個大範圍的表格，就不會有問題；div/css 這樣可以把一些圖片以背景的形式在css文件中定義（另外這裡還看到了一個從前沒有見過的在css中定義適應不同的瀏覽器的方式），這樣大概是針對某種團隊組織形式設計的，把圖片的更替可以由界面人員處理，而不會出現：“某某程序員，把某個圖片換一下”，顯然，目前是由於我們的美工太業餘——HTML代碼是她們提供的，她們如果真懂得運用CSS，其實簡單的界面標簽也不會太困難的。

DEP由於outofmemory再次停機。但是在日志中沒有發現有大量的訪問讀數。有一個可能性，是由於訪問其他附從應用導致高負載停機，這是可能的，這樣在主負載應用上就沒有大量的訪問記錄了。看來，要抽時間把內存加上去了，這樣會可靠一點。

晚上好象很旺，顯然是有幾個搜索引擎在湊熱鬧，但同時登錄的也不是少數，居然速度還不算慢，已經1500個會話了，還在不停地增加，觀察內存似乎還有許多。看來的確是有現寮的意義對搜索引擎限時訪問，這點可以使用防火牆很容易地達到的。統計下來

這個數字真是可怕，足以讓幾乎全部數據失真了。看來那個計數有很大程度上是把我們自已也給騙了，真實的點擊數減去這個就衹有一半左右。把這個清除去，看看計數情況如何？會話記錄仍在發瘋似地上昇，已經達到了1700了。看來承受的能力也是相當強的。而把搜索引擎??的??剔除后，就意味?真正??的人?只有原???的十分一以下，而平均每人??的??也就大幅增加了，?到10-20。??，整?估算都要?行更?。

?在已?禁止搜索引擎白天??，看看?果如何吧。

星期二, 6月 14, 2005

全天基本上主頁框架上，卻衹是開始，量很大

昨晚上把豬豬交給保姆帶，但仍然是太早醒。盡管七點就開始坐到電腦前，但很快就覺得睏倦了。早上的事情主要是給Style值的引用錯誤拖住了，昨天想不起來為什麼不能在前面直接賦值，現在清楚了，要在前面賦值，必須使用克隆的對象而不能是當前的對象。其實昨天整理這個select的默認值，也弄了一個多小時，這種小臭蟲經過不清理，就還不知道會留到什麼時侯。

亂七八糟的臭蟲花了我許多時間，一直到下午四點半才開始正式進入主頁模塊的前臺。部分更新dep後再次出現編譯擁塞，幸好是dep，如果是萬維就損失嚴重了。打算接手把中國的域名注冊部分一一搞清楚，但是卻發現無法實現自已解釋的域名服務。

不過，事實上我還沒有細細地想這個動態網站到底有什麼東西。顯然的是，他們說的簡單提供弱博客形式的功能是不可能長期立足的，上海的那個網站比較地接近於動態網站的概念，而其他的多是主頁空間。象黃頁那樣沒有專門的目錄，顯然是不行的，而專門上的目錄，沒有相應的操作界面和審計工具，也無法限制它的上傳大小。至於說到數據庫功能，如果對方有能力處理數據結構，衹怕也沒有必要接受這樣的網站了，所以提供的應該是數據對象的有限訪問功能而不是全部。其他事情都難以在這幾個小時內完成，目前需要完成的是那個動態網站的域名解釋方法。

一旦更改，就意味著除非昇級，否則各臺設備將是不一致的。同時，盡管使用域名改寫，但是由於上下文仍是一個，所以又有另一個問題，是否要把那個上下文的處理調到前面來做了。最簡單的辦法就是先不管這些個東西，而是讓它可以登錄，可以發文章，僅此而已。

總結一下，動態網站要求有以下幾個功能：
1、自定義域名，這條發現有大的問題；
2、自動編寫靜態頁面；
3、對指定界面使用模板以及勸態的模板及解釋工具；
4、上傳的目錄管理和容量審計功能；
5、自帶的前臺登錄彈出窗口；
6、目錄管理策略和轉向方式；

以上四條都不是短時間內（估計都要一兩天）可以完成的，所以還是現實點的從目前同一個上下文起步為佳。先前設想的轉到另一個默認上下文進行域名區分的路是不通的，這樣的話，目前的二級域名就會全部失效。另外，另一個廣告帳號仍然沒有發放給我使用。另一問題就是是否放到一個目錄之中呢？看來，需要的是一個完整的文件目錄，而不是把jsp放到該目錄中。這是現在要著手做的。盡管今天dep由於不知原因的更新緩慢地編譯了幾次，但是仍然在今晚要繼續往上更新。先前出了一些疏忽，假如了解系統的人直接訪問目錄，是可以看到全部的目錄結構的，這必須糾正過來。今天的WINDOWS連續幾次突然溢出，也鬧不準是什麼原因，覺得有點不象樣了，把flashget刪除了，好象還和網景有很大的關系。每次都是當網景打開時會出這個錯的。

主頁的目錄重寫仍然有疑問，我記得當初這樣的對後續路徑的重寫是不成功的，是在全科那裡試驗證明，最終是靠倒過來的重寫規則才勉強達到。

太晚了，先睡覺了。那份cvs文件倒是告訴我，可以象輸出文本一樣把這份文件輸出來。

昨天alexa上昇了，但最新的指標卻又掉了兩千多，這是周二的，好象也有刷新操作。那麼今天實際上是創下了新高，估計數值將在周五看到，我不刷新，看看結果會如何。

星期一, 6月 13, 2005

三分二的時間是活動主頁

今天早上是一大早就讓豬豬又蹬醒了，她自已倒是倒頭大睡到了八點多，而我由於再也睡不著了，所以就在六點出頭就起床了。晚上關於廣告帳號的事情一直繚繞在腦海中。早上起來，打算趁著網絡暢通的機會抓緊時間時間更新一批博客文章，但從點擊了廣告開始，就偏了題；一連試用了兩個擺著我的博客上的廣告網站，一個是中國人才網，看來它的模式是先試用，然後過一段時間收錢；而另一個在上海開通的自助建網。但這實際上是一個既有網站多開一個目錄的做法，如果是使用靜態型的網站，倒也沒有多少問題，但域名一項沒有看到，估計還沒有解決。

BLOGCITY 的CSS編輯可能是有問題而不是失效。而當把 BLOGCITY和JAVAXML的網站都准備好後，那個CSDN也DOWN了，這就沒有什麼可搞的了。由於非技術型的匯集網站沒有什麼徹實的價值，所以我也看不出有向blogcn轉移的必要性，須知，那個網站在我的印象中也是非常慢的。而當實實際際開始打算使用blogcity時，就發現仍然是有嚴重的缺陷，限制顯得太多了。最嚴重的是，它甚至沒有把文章列表列出來，這樣就太成問題了。看來還是需要找第三方，免費的東西總是不太好用，這類東西看來最終還是要我自已弄一套出來。

中間稍停一下，希望能夠不停機也能重載 database，但始終異常，都最後，發現是一切正常，但就是不能通過解釋重載入xml，而，?動時侯的載入同一個文件就完全正常——事實上，就是把代碼拷過去而已，大概是在清空那裡還有一些動作，沒有時間現在再詳搞下去，到時再說了。

那就回頭做正事。其實上面的也是正事，偏事還沒有開始，那頭的網站就DOWN了。過一會又象恢復了過來，看來正是在邊緣水平上掙紮。javaxml是最大的一檔，轉移的時間遠遠超過預想，整整花了我一個上午，連同休息，基本上去掉了半天。網景的瀏覽器看來真是太臭了，當初它是最好的瀏覽器之一，主要原因我看是由於邊緣的討好式的功能，象自動填卡之類作的孽，十足應了一句話：學雷鋒做好事，本職工作卻是沒有做好。不過和老朋友韻姣和Joan序舊也花了一個小時左右，超出了時間預算一倍以上，似乎每天的見面有點承受不住了。

星期日, 6月 12, 2005

開會，adsword體現的的廣告邏輯，中文域名

早上給豬豬早早蹬醒了，也許今天的的精神會變差。在進一步了解adsword的內部統計機制前，不對網頁加進一步的處理，目前僅僅有幾頁裡加上一個隔兩分半鍾自動刷新的腳本。精神雖然是極差，但仍是開了一天的會，累得我要死。邏向我展示的那個健康網，明顯是中國那種洗錢式的銷售然後擦屁股式的建網。這種東西是沒有辦法學的。事實是我最頭疼的就是合作者拿著不明所以然（內部業務邏輯）的網址當成所謂的需求，“抄就行了”簡值就是放屁。象專家黃頁限定副高一級，我一聽就發火了，堅決不放，結果怎麼樣，等到醫生也批他時陳就改口了。事情就是這樣，所以象招聘那些問題，我是想透了的，如果是要搞，我看就擴大來高，大不了我乾我自已事情;要麼就不搞。老鼠洞中做大王的錯誤是不能犯的，這條我再費脣舌陳也不會明白的。

另一個風波就是中文域名，他們給人家騙了。我一向看不起中文域名，事實上我認為當GOOGLE這類搜索引擎出現後，中文域名是連存在的價值也沒有的。而且還那麼貴，特別是這種依靠綁架客戶瀏覽器下載組件的行為是一點意義也沒有的。既然是要裝插件，那麼裝個google工具條就會自然地有那個google網上通，根本無需什麼中文域名——衹有對互聯網域名技術一竅不通的人才會使用中文域名，而當如此一竅不通的人主持網站建設和經營的話，網站的下場幾乎是可以想見的。就此事而言，他們應該先問問我的意見——我才是精通互聯網技術和協議的，其他人無論是不是搞技術的，都可以看作是業餘的外行。

拿了那個adsword的帳號進行了觀察，現在看來，google具有一定的過濾功能，象如果是從同一個地址的請求，它會過濾的，以及同一個地址有過多的請求，他也不會算帳的。應該說這還是比較客觀的，不過，對於大量共用IP的點擊來說，還是相當劃算；而實在有沒有扣錢，就是一個天知道的事情。同一個網址擺下多個廣告也是允許的。而同一個網站顯示多個地址後，它也不會再顯示的。這是為了減少自動刷新的技術造成的顯示效果。下面就是各自整理了，如前所料，面向中國，還有波蘭的點擊收費是明顯偏低的，估計是為了與窄告等公司進行競爭。

作為既定的內容之一，晚上也許是花了兩個小時，也可能衹是一個小時把blogchina.com產品行業評論欄中的文章添加了ads代碼，以及把其中重要的原創文章分別轉帳號到了CSDN 和blogger.com 上。說真的，博客中國也實在是技術臭得衝天，現在幾乎很少有能夠正常瀏覽的時侯了。所以把文章轉移到其他博客上是勢在必行，我覺得主要方向當然是向海外轉移，另外就是向專業站點轉移；最後我會建立自已的完全網站。當前，首先是把技術類的文章向csdn轉移。

在上面的程序由於與數據庫雙向相關，所以盡管發現有錯，還不能完全立刻的改。不然主服務器上會出錯；觀察顯示，tomcat的內存釋放並不算太理想，目前的會話並不算多時但是卻已經是消耗了400M 的內存，顯然這說明有不少內存並沒有真正釋放出來。在禁止了235流氓搜索後，點擊和會話讀數比例明顯上昇了，這足以說明其中有不少是搜索引擎的點擊，這條他們還是不太清楚的。事實上搜索引擎有多少點擊率我也不太清楚，在jsp中無法拿到ua，唯一的辦法就是每頁都另外發出一條iframe一類的不過這個腳本也是滿難弄的，iframe的事件很難控制它。從流量上看，盡管禁止了搜索引擎，仍是達到了兩萬多訪問，可見還是有明顯的進步的。

³n¥ó¥@¬Éªº¤ûj_ IT技術工作日志

星期六, 6月 18, 2005

探討Googel廣告，XML集合沒有必要性？

星期五, 6月 17, 2005

動態主頁，收拾廣告，計數器，漢字編輯亂亂的困擾

星期四, 6月 16, 2005

搜索引擎機器人，adsword廣告，“偷”後臺界面

使用Google的廣告十天後的觀感和博客的錢途

星期三, 6月 15, 2005

搜索機哭人的麻煩，“偷”blogger的界面

星期二, 6月 14, 2005

全天基本上主頁框架上，卻衹是開始，量很大

星期一, 6月 13, 2005

三分二的時間是活動主頁

星期日, 6月 12, 2005

開會，adsword體現的的廣告邏輯，中文域名

Previous Posts

¦Û§Ú¤¶²Ð

Archives

³n¥ó¥@¬Éªº¤û­j_ IT技術工作日志

星期六, 6月 18, 2005

星期五, 6月 17, 2005

星期四, 6月 16, 2005

星期三, 6月 15, 2005

星期二, 6月 14, 2005

星期一, 6月 13, 2005

星期日, 6月 12, 2005

Previous Posts

Archives

³n¥ó¥@¬Éªº¤ûj_ IT技術工作日志